大型语言模型是生成或嵌入式文本的基础模型 (一种大型神经网络)。它们生成的文本可以通过为其 提供起点或“提示”来进行调节,从而使其能够用自然 语言或代...
2025-01-17 58 人工智能AI行业报告
突破视频时长及镜头切换限制:由于受到 AI 算法和学习能力的限制,RunWay、Pika 等之 前的头部 AI 文生视频工具,无法完成镜头切换后的衔接,因此生成的作品往往都局限于 10 秒内的单一镜头视频。而 Sora 不仅可以实现不同镜头之前流畅的切换,还能生成 60 秒的 超长视频。 更加自由的视频尺寸:基于 OpenAI 公布的 Sora 技术报告,Sora 模型可以生成 1920x1080 与 1080x1920 之间所有尺寸的视频。而 Runway Gen2,仅支持长宽比为 4:3、3:4、16:9、 9:16、1:1、21:9 的视频。 背景角色稳定:过往的 AI 文生视频工具通常会出现背景角色不稳定的情况,即在背景中有 许多的人或动物的情况下,画面经常出现失真、混乱的情况。而这个问题在 Sora 的视频中 也得到了改善,以“东京漫步的女士”视频为例,在 Runway 中输入同样的提示词后,背 景人物会做出一些怪异的走路姿势,而 Sora 视频中背景角色表现非常稳定。 理解和模拟真实世界:由于 Sora 初步具备了理解和模拟真实世界的能力,因此 Sora 生成 的视频通常具备一些新兴特征,主要包括 3D 一致性、物体持久性、模拟物理交互等,这些 特征也使得 Sora 生成的视频更加的生动、逼真。 1)3D 一致性:Sora 可以生成带有动态摄像机运动的视频。基于 Sora 在 3D 动态理解和再 现的能力,当相机移动时,场景中的人物和物体会以符合三维空间的一致方式进行移动。 2)远程相关性和物体持久性:Sora 通常能够有效地对短期和长期依赖关系进行建模。因此 当物体被遮挡时,物体仍然能够被完整的显示。当切换角度、物体离开画面后重新出现, 物体仍然能保持前后一致。
标签: 人工智能AI行业报告
相关文章
大型语言模型是生成或嵌入式文本的基础模型 (一种大型神经网络)。它们生成的文本可以通过为其 提供起点或“提示”来进行调节,从而使其能够用自然 语言或代...
2025-01-17 58 人工智能AI行业报告
大模型快速发展,网信办数据显示,截至2024年7月30日,全国范围内通过登记备案的行业大模型有136款,占比达69%。行业大 模型深度赋能教育、金融、...
2025-01-08 76 人工智能AI行业报告
生成式AI也在加速赋能广告制作环节。今年业绩和股价爆发的AppLovin和汇量科技,主要关注的是决策式 AI在程序化广告平台的技术突破,提升广告投放精...
2025-01-06 105 人工智能AI行业报告
纵观历史50年,五次半导体市场规模迅猛成长均伴随爆款电子产品的普及。自1976年起,全球半导体市场历经了5次迅猛成长,分别由台式电脑(1983~198...
2025-01-05 89 人工智能AI行业报告
先进封装:受AI芯片大面积需求带动,2.5D先进封装于2023至2024年供不应 求情况明显,据TrendForce预估,2025年晶圆代工厂配套提供...
2025-01-05 97 人工智能AI行业报告
针对外贸 B2B 垂类场景的AI助手AI麦可:截至2024/6/30,购买AI麦可的会员共6095 位(不含试用体验包客户),较2024年一季度末增加...
2025-01-04 67 人工智能AI行业报告
最新留言