Agent(代理)一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。在计算机科学和人工智能领域,"Agent"...
2025-04-17 29 人工智能AI行业报告
现阶段大模型在处理任务的广泛性上还有很大提升空间,虽然 GPT-4、Gemini 1.5、Claude 3 等模型已经能够处理文本、图像、视频等多模态输入,但尚未具备独立决策和执行行动 的能力。此外,现阶段更多的模型仍聚焦在某单一领域进行性能提升,比如 Kimi 在处理 长文本输入领域表现突出,但尚不能进行图片生成;Sora 能够高质量完成文生视频任务, 但不具备问答功能。因此,现阶段评价大模型性能情况、分析模型演进方向,仍需根据模 型专长领域进行分类。将语言大模型的底层框架和训练方式应用于机器人的感知、决策、控制成为现阶段重 要趋势。2021 年 OpenAI 推出基于 Transformer 架构和对比学习方法的 VLM(视觉 -语言模型)CLIP;2022 年起,谷歌先后推出 RT-1/RT-2/RT-X/RT-H 系列模型,同 样采用 Transformer 架构,能够将语言描述的任务映射为机器人行动策略;24 年 3 月,初创公司 Figure 与 OpenAI 合作推出机器人 Figure01,由 OpenAI 提供视觉推 理和语言理解能力,Figure01 能够描述看到的一切情况、规划未来的行动、语音输 出推理结果等。语言大模型能力相对完备,底层技术路线大多选择 Transformer Decoder-only 架构, 结合MOE和多模态embedding,算法细节优化方向区别较小。以GPT-4、Gemini 1.5、 Claude 3 为例,语言大模型在推理、长文本、代码生成领域已经能够完成初级任务, 但距复杂、专业水平仍有差距; 多模态大模已经能够面向 B\C 端提供商业化产品,底层技术路线主要采用 Diffusion Transformer,但细节优化空间较大,高质量和成规模的数据集仍在发展初期; 具身智能类大模还在探索阶段,底层技术路线尚不清晰,数据收集、训练方法、测评 方法等都处于发展初期。在实际应用场景中准确率较低。
标签: 人工智能AI行业报告
相关文章
Agent(代理)一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。在计算机科学和人工智能领域,"Agent"...
2025-04-17 29 人工智能AI行业报告
[Download]资源名称:DeepSeek深度解读报告:部署、使用、安全(49页)...
2025-04-15 51 人工智能AI行业报告
DeepSeek V3与R1模型实现了开源,采用MIT协议。这产生多方面影响: 对大模型发展:这提升了世界对中国AI大模型能力的认知,一定程度打破了O...
2025-04-14 50 人工智能AI行业报告
DeepSeek 团队最大的特点之一就是年轻。团队成员中, 应届生和在读生占据了相当大的比例,他们活跃在公司的各 个项目和研究领域中。这些年轻人思维敏...
2025-04-14 66 人工智能AI行业报告
DeepSeek引领AI应用变革,“AI+消费”有望迎来大爆发。DeepSeek首次实现了大规模AI模型性能与成本之间的“剪刀差式突破”,显著 降低了...
2025-04-13 54 人工智能AI行业报告
DeepSeek 是一家中国人工智能公司,成立于 2023 年 7 月 17 日,总部位于浙江 杭州。它由量化资管巨头幻方量化创立,专注于大语言模型(...
2025-04-10 61 人工智能AI行业报告
最新留言