热门资讯> 正文
2026-03-09 07:23
(来源:中华工商时报)
转自:中华工商时报
“我们正在进入‘一个人就能拍电影的时代’。”马年新春,这句网络流行语,随着字节跳动发布AI视频生成模型Seedance2.0而火遍全网。
应用Seedance2.0,无需专业编剧、导演、表演、剪辑、配音,普通人都能一键成片——只需输入一段简短的提示词或一张图片,60秒内即可生成带原声音频、多镜头切换、风格统一的“电影级”短片。于是,更有网友大胆预测,AI视频生成大模型(简称“视频大模型”)或让“一句话就能拍电影的时代”很快到来。
视觉盛宴,效果逼真
马年春晚舞台上,歌咏创意秀《贺花神》中所展现的那种亦真亦幻、穿越时空的舞美场景,正是应用Seedance2.0提供关键技术支撑而形成的“AI生成影像+实景舞台扩展”创新模式所生成的。而在《驭风歌》歌曲表演节目中,Seedance2.0更将徐悲鸿的《六骏图》静态水墨画变成自由狂奔的6匹骏马,从演唱者张杰身边飞奔而过,为观众带来一场技术赋能传统文化的视觉盛宴。
业内专家表示,上述舞台效果得益于Seedance2.0超强指令遵循能力和对物理规律的深刻掌握,使其能够基于原作画面、导演手稿、真实马匹跑动视频等多模态素材,实现对形体结构与运动逻辑的深度理解。
“视频大模型显然大幅降低长视频制作成本,缩短制作时间,降低创作门槛,让更多创作者进入长视频制作行业,最终使得长视频的数量和质量大幅提升,这对爱奇艺这样的长视频媒体平台来讲非常利好。”爱奇艺创始人、首席执行官龚宇表示。
Seedance2.0等视频生成大模型也将对爱奇艺带来影响。2月26日,爱奇艺发布“构建AIGC生态系统”,作为爱奇艺2026年继夯实主业、强化新兴业务外的第三大战略目标被提出。爱奇艺还首次公布其自研AI智能体平台纳逗Pro的相关进展。两天后的2月28日,中国首部AIGC动画电影《团圆令》登陆大银幕。
而另一由清华大学与生数科技自主研发的中国首个长时长、高一致性、高动态性视频大模型Vidu,也显示出其亲民、易学、易操作的功能,让网友热追。
在波涛汹涌的大海上,一艘木船正在搏击风浪、奋勇向前……一段Vidu在文字指令下,一键式生成的视频画面,近期在网络上流传,视频效果十分清晰,配上逼真的波涛海浪声音,让人感受到强烈视觉冲击。而在另一段由Vidu大模型生成的视频画面中,一辆卡车疾驰而过,车尾扬起的灰尘遮天蔽日,其光影效果逼真。
据清华大学教授、生数科技首席科学家朱军介绍,Vidu大模型可精确模拟物理规律生成光影、人物表情等细节,支持多镜头切换及中国元素融合,不仅能够模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点。2026年2月与万兴科技达成战略合作,共建AI漫剧工业化生产体系。
技术积累,商业化前景明朗
视频大模型未来能否生成越来越具有视觉冲击效果的电影视频,这取决于视频大模型能否不断进行技术改造和功能升级。对此,业内专家给予分析和详解。
“视频大模型的升级重点围绕自然语言解析能力、画面细节打磨和运镜、时长三大方面,这三大关键因素决定AI视频大模型未来能够取得的成果。”快手大模型团队负责人表示,唯有能够理解人类自然语言,才能真正让每一个人都能利用视频大模型尽情释放想象力,画面和运镜的升级可以提高视频质量,在时长足够前提下,视频大模型方能成为用户手中创作微短视频的助手。
据了解,国产视频大模型快手“可灵”,作为首个Sora级面向用户开放的文生视频大模型,曾在一个月内进行了三次升级。2026年2月,快手发布自研可灵3.0系列模型(Kling3.0Pro)。当前技术已突破基础画面生成,逐步向影视工业化领域延伸,部分模型角色一致性生成准确率达78%。
技术积累加上商业化前景明朗,让视频大模型的每一步动向都引发关注。快手高级副总裁、主站业务与社区科学线负责人盖坤表示,一直以来,AI技术创新都是推动快手大模型发展的驱动力,不仅覆盖内容生产、理解、推荐等多个层面,也持续推进着快手大模型商业生态的智能化经营水平。
竞争加剧,市场群雄逐鹿
当前,全球AI视频技术竞争加剧。
国际市场反馈显示,Seedance2.0已获得全球科技与影视从业者认可。多家海外专业机构将其评为当前全球领先的视频生成模型。等多地科技博主与创作者实测表明,该模型在多源输入组合、镜头语言设计、画面一致性等方面实现明显跃升,更贴合工业化内容生产需求。除Seedance2.0外,国内主流视频生成模型还包括可灵3.0、Wan2.6、Vidu Q3等,而国外则主要有Grok Imagine API、Sora2、Veo3.1等。
快手可灵支持文生视频和图片生成视频(也可以加入文字描述)两种模式,而且可以调整创意想象力和创意相关性。抖音不甘示弱,也推出视频大模型即梦,除文生视频和图生视频外,即梦还加入了对口型功能,即导入图片、视频后,再上传文本或录音即可调整视频,至今官网已提供视频1.2、视频2.0、视频2.0Pro三个版本可用。腾讯日前推出混元视频大模型,并在腾讯元宝App和网页端上线,其现阶段仅支持文生视频,每日可免费生成4次标准品质和2次高品质视频。
在国际上,近期亚马逊云科技、谷歌、OpenAI等企业相继发布了AI视频大模型,预计还会有更多AI公司推出视频大模型,整个行业的竞争将愈发激烈。
近日,全球知名AI基准测试机构ArtificialAnalysis发布最新的全球视频生成大模型榜单,可灵3.0系列模型(Kling3.0Pro)以1240的ArenaELO基准测试评分,位居文生视频赛道第一位,在前15名中,可灵共有7个模型在榜。业内人士分析,此前发布的可灵3.0模型在视频真实感、一致性和可控性上具备行业领先优势,意味着AI正式进入影视工业级视觉生产的核心环节。
招商银行研究对比显示,OpenAI的Sora2更偏向于物理世界模拟器的定位,而Google的Veo3.1则更接近影视工业级工具。反观中国市场,快手可灵3.0主打低成本、强互动与快速出片;生数科技Vidu Q3走“极致速度+一致性”路线;MiniMax的Hailuo2.3在动漫风格与动作物理连贯性方面表现突出;阿里巴巴Wan2.6深度绑定电商生态,聚焦商品多角度展示与背景替换;腾讯Hunyuan Video则以游戏资产生产与开源生态为切入口,面向3D生成、动作数据生产等产业级场景。
业内分析认为,当下,视频大模型领域已呈现出多强并存、群雄逐鹿态势。