中国首个长视频生成机制Vidu问世,国产AI多模态赛道超车进行中

科技 2024-04-28 18:44 阅读:

今年春节,清华大学人工智能研究院副院长朱军教授被OpenAI推出的视频模型Sora所震撼。他对Sora的表现赞叹不已,但也对未开放的技术和未来的不确定性感到担忧。人们开始猜测,何时才会有类似Sora的长视频生成机制问世。

近日,朱军代表清华大学与生数科技发布了中国首个长视频生成机制Vidu。Vidu的诞生标志着中国在AI多模态领域的突破,与国际先进模型展开竞赛。Vidu可以模拟真实物理世界,具有想象力,理解多镜头语言,可以一键生成长达16秒的视频,在语义理解方面表现突出。

Vidu的诞生并非一帆风顺,团队经历了许多困难和挑战。他们在扩散模型、贝叶斯深度学习等方面进行了大量研究工作。团队不断进行大规模训练,最终在2023年3月开源了全球第一个基于融合的大模型UniDiffuser。Vidu的出现刺激了团队的速度,两个月后,Vidu正式亮相。

Vidu采用与Sora完全一致的Diffusion和Transformer融合架构,通过单一步骤直接生成高质量的视频。与Sora相比,Vidu在视频时长、质量、一致性等方面已经领先,但仍有改进空间。Vidu的诞生展示了中国AI技术的崛起,为国内企业在多模态大模型领域赢得了一席之地。

在AI领域的竞争中,中国企业正积极布局视频大模型。国内企业在多模态大模型领域的起步较早,技术和经验积累丰富。Vidu的诞生是中国AI多模态赛道上的一次超车,展示了中国在AI领域的实力和潜力。

https://www.jincai100.comVidu的诞生标志着中国在AI多模态领域的突破,展示了中国AI技术的崛起之路。中国版Sora已经问世,国产AI多模态赛道的超车竞赛正在进行中,让我们拭目以待,见证中国AI技术的辉煌未来。