30年前,当互联网刚刚兴起时,大多数银行业从业者都无法相信支付方式将发生彻底变 革,购物将无需现金和刷卡,交易越多银行内部的排队现象却越少;大多数的证...
2024-03-11 17 人工智能AI行业报告
先行者往往要花费大量时间精力试错,一旦模式跑通,“明牌游戏”就开启了。后来者会有更好的参考系和聚焦方向。ChatGPT后续的文本生成模型进展就说明了 这一点。 过去一年,AI文本生成和图像生成相继走向成熟,Sora的发布意味着视频生成应用走向成熟的时间比原先预计的更早出现,AIGC已经加速迈入视频生成阶段。 对此,甲子光年智库更新了生成式AI技术的成熟应用进程时间表。2024年可实现根据文本提示生成初版短视频,2025年有望实现根据文本生成初版长视频,并在视 频制作环节真实使用落地。视频生成技术路线在过去主要有两条,一条是基于Transformer的路线,以Phenaki为代表,第二条是Diffusion Model(扩散模型)路线,该路线 在2023年是主流路线,诞生了Meta的Make-A-Video、英伟达的Video LDM,Runway的Gen1、Gen2,字节的MagicVideo等代表性产品。 Sora的发布,对Transformer + Diffusion Model(DiT)路线进行了成果瞩目的验证。Sora模型将视频压缩到低维空间(latent space),并使用时空补丁(Spacetime latent patches)来表示视频。这个过程类似于将文本转换为 Token表示,而视频则转换为patches表示。Sora模型主要在压缩的低维空间进行训练,并使用解码器将低维空间映射回像素空间,以生成视频。 Sora使用了diffusion模型,给定输入的噪声块+文本prompt,它被训练来预测原始的“干净”分块。 Sora是diffusion transformer,而transformer在各个领域都表现出显著的规模效应。
标签: 人工智能AI行业报告
相关文章
30年前,当互联网刚刚兴起时,大多数银行业从业者都无法相信支付方式将发生彻底变 革,购物将无需现金和刷卡,交易越多银行内部的排队现象却越少;大多数的证...
2024-03-11 17 人工智能AI行业报告
人工智能在影视文娱,以及游戏等行业具备广泛的应用场景,核心主线就在于内容生产力的释放与升级方面。一方面,整体提升文娱产业工 业化水平,形成AI赋能全流...
2024-03-07 22 人工智能AI行业报告
中国移动自主构建语言、视觉、语音等多种类型大模型,具备跨行业供给侧增强、高可控性、异构软硬件灵活部 署几大显著的技术特色,整体性能指标实现国内主流水平...
2024-03-06 22 人工智能AI行业报告
大模型的兴起,打开了产业通向数据驱动、智能决策 时代的大门。此前IBM商业价值研究院曾在其《值得押 注的七大投资决策》报告中指出,未来十年,生成式 A...
2024-03-06 30 人工智能AI行业报告
这些发现表明 , 发达经济体可能更容易受到人工智能采用带来的劳动力市场变化的影响 , 这种变化在比新兴市场经济体和低收入国 家更短的时间内实现。鉴于发...
2024-03-06 26 人工智能AI行业报告
判断一项新科技浪潮是否已经对产业产生了巨大影响的有效方法之一便是去各大招聘网站搜索相关 新兴岗位出现的数量、种类及其薪资水准。一旦出现井喷之势,说明产...
2024-02-26 86 人工智能AI行业报告
最新留言