中国首个长视频生成机制Vidu问世，国产AI多模态赛道超车进行中-金财在线

今年春节，清华大学人工智能研究院副院长朱军教授被OpenAI推出的视频模型Sora所震撼。他对Sora的表现赞叹不已，但也对未开放的技术和未来的不确定性感到担忧。人们开始猜测，何时才会有类似Sora的长视频生成机制问世。

近日，朱军代表清华大学与生数科技发布了中国首个长视频生成机制Vidu。Vidu的诞生标志着中国在AI多模态领域的突破，与国际先进模型展开竞赛。Vidu可以模拟真实物理世界，具有想象力，理解多镜头语言，可以一键生成长达16秒的视频，在语义理解方面表现突出。

Vidu的诞生并非一帆风顺，团队经历了许多困难和挑战。他们在扩散模型、贝叶斯深度学习等方面进行了大量研究工作。团队不断进行大规模训练，最终在2023年3月开源了全球第一个基于融合的大模型UniDiffuser。Vidu的出现刺激了团队的速度，两个月后，Vidu正式亮相。

Vidu采用与Sora完全一致的Diffusion和Transformer融合架构，通过单一步骤直接生成高质量的视频。与Sora相比，Vidu在视频时长、质量、一致性等方面已经领先，但仍有改进空间。Vidu的诞生展示了中国AI技术的崛起，为国内企业在多模态大模型领域赢得了一席之地。

在AI领域的竞争中，中国企业正积极布局视频大模型。国内企业在多模态大模型领域的起步较早，技术和经验积累丰富。Vidu的诞生是中国AI多模态赛道上的一次超车，展示了中国在AI领域的实力和潜力。

https://www.jincai100.comVidu的诞生标志着中国在AI多模态领域的突破，展示了中国AI技术的崛起之路。中国版Sora已经问世，国产AI多模态赛道的超车竞赛正在进行中，让我们拭目以待，见证中国AI技术的辉煌未来。

中国首个长视频生成机制Vidu问世，国产AI多模态赛道超车进行中