中國電信發布全自研視頻生成大模型等
2024-12-05
來源:科技日報
1152
科技日報記者 羅云鵬
12月3日,中國電信人工智能研究院(TeleAI)在中國電信“2024數字科技生態大會”期間發布視頻生成大模型、視覺大模型產用一體化平臺、具身智能、智傳網等一系列創新技術、產品及科研成果,并發布開發者產業聯盟計劃。
本次發布的視頻生成大模型打造了“VAST(Video As Storyboard from Text)二階段視頻生成技術”,通過文本描述可精準勾勒出包含視頻構圖、主體目標位置及人物姿態等關鍵信息的“故事板”(Storyboard),進而生成對應的視頻內容。
得益于VAST的創新能力,視頻生成大模型可以保證單個或多個主體人物在各視頻片段中的外觀一致性,實現對復雜動作和交互式動作的精確控制,并讓角色和目標物體的運動符合物理規律。
基于此,通過語義、語音、文生圖、文生視頻等全棧大模型能力打通短劇及影視制作各個環節,覆蓋文字腳本撰寫、分鏡腳本繪制、視頻拍攝及剪輯、配音及音效合成等全流程。
大會期間,中國電信人工智能研究院還與華為、中興、亞信科技等在內的19家合作伙伴發布中國電信人工智能開發者產業聯盟計劃,旨在聚合各方力量,加快推動人工智能產業發展,提升技術能力與應用水平,并為全球開發者賦能。
