大型语言模型是生成或嵌入式文本的基础模型 (一种大型神经网络)。它们生成的文本可以通过为其 提供起点或“提示”来进行调节,从而使其能够用自然 语言或代...
2025-01-17 58 人工智能AI行业报告
从 Transformer 到多模态大模型的演进与应用。Transformer 不仅在语言 处理上广泛应用,还扩展至图像、视频、音频等多模态任务。诸如 Stable Diffusion、VideoPoet 和 MusicLM 等模型展现了其强大的生成能力,推动了 多模态大模型(MLLM)的发展。 机器人现实世界至数据化的突破:RT-2、RoboCat 与 MimicGen。RT-2 通过大规模的视觉-语言预训练,将视觉识别与低级机器人控制结合,实现了机 器人在复杂任务和未见环境中的强大泛化能力。RoboCat 则基于 Gato 模型, 展示了多任务和多具身平台上的自我迭代学习能力,能够快速适应新任务并生成 跨任务策略。英伟达的 MimicGen 自动生成大量模仿学习数据,有效减少了人 工干预,提升了机器人学习的效率。
特斯拉 FSD,端到端算法成为主流,数据为关键。2020 年 FSD 引入 Transformer 模型,走向了数据驱动的模型范式,2024 年初 FSD V12 完全采用 神经网络进行车辆控制,从机器视觉到驱动决策都将由神经网络进行控制。FSD V12 能够模拟人类驾驶决策,成为自动驾驶领域全新发展路径。 英伟达 Robocasa:具体智能关键节点,首次论证 real-sim-real。通过升 级模拟平台并构建模拟框架,基于厨房场景和原子任务、复合任务、真实世界三 个场景收集行为数据集并进行结果评估。说明模拟器的丰富多样性以及视觉和物 理真实性显著改善了模拟效果,实验结果首次论证了 real-sim-real 可行。
标签: 人工智能AI行业报告
相关文章
大型语言模型是生成或嵌入式文本的基础模型 (一种大型神经网络)。它们生成的文本可以通过为其 提供起点或“提示”来进行调节,从而使其能够用自然 语言或代...
2025-01-17 58 人工智能AI行业报告
大模型快速发展,网信办数据显示,截至2024年7月30日,全国范围内通过登记备案的行业大模型有136款,占比达69%。行业大 模型深度赋能教育、金融、...
2025-01-08 76 人工智能AI行业报告
生成式AI也在加速赋能广告制作环节。今年业绩和股价爆发的AppLovin和汇量科技,主要关注的是决策式 AI在程序化广告平台的技术突破,提升广告投放精...
2025-01-06 105 人工智能AI行业报告
纵观历史50年,五次半导体市场规模迅猛成长均伴随爆款电子产品的普及。自1976年起,全球半导体市场历经了5次迅猛成长,分别由台式电脑(1983~198...
2025-01-05 89 人工智能AI行业报告
先进封装:受AI芯片大面积需求带动,2.5D先进封装于2023至2024年供不应 求情况明显,据TrendForce预估,2025年晶圆代工厂配套提供...
2025-01-05 97 人工智能AI行业报告
针对外贸 B2B 垂类场景的AI助手AI麦可:截至2024/6/30,购买AI麦可的会员共6095 位(不含试用体验包客户),较2024年一季度末增加...
2025-01-04 67 人工智能AI行业报告
最新留言