热门看点:可灵AI发布O1视频大模型 支持多模态输入与对话式编辑
可灵AI发布O1视频大模型支持多模态输入与对话式编辑,模态,可灵,输入框
2025-12-02 10:32:36
(相关资料图)
12月2日消息,据了解,可灵AI于12月1日正式宣布,其自主研发的O1视频大模型正式面向公众全量开放。该模型被定位为一款统一的多模态创作工具,支持用户通过单一输入框融合文字、图像、视频指令进行视频生成与编辑。
据悉,可灵O1模型采用MVL(多模态视觉语言)统一交互架构,结合Chain-of-Thought推理技术,能够处理文生视频、图生视频、局部编辑、镜头延展等多种任务,无需在不同功能模块间切换。该技术通过多视角主体构建方法,旨在解决视频生成中人物或物体在镜头切换时出现的特征漂移问题,以提升画面连贯性。
目前,可灵O1模型已在可灵App及官网开放体验,支持生成3至10秒时长的视频,主要面向短视频创作者、广告团队及个人用户。公司表示后续将开放API接口,供第三方平台集成。(袁雪丽)
本文来自网易科技报道,更多资讯和深度内容,关注我们。