Agent(代理)一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。在计算机科学和人工智能领域,"Agent"...
2025-04-17 29 人工智能AI行业报告
2024 年大模型厂商推出模型的速度仍在加快,大模型与小模型共存仍是解决模型能力上 限和端侧推理的方案,各大模型厂商也会推出几 B 到 TB 级别的模型。随着大型模型训练 成本的不断提升,且有更多像 Meta、Mixtral、阿里通义等公司的开源,模型预训练市场 的玩家会快速缩小,针对特定任务的微调或者是 Agent 业务将会是更多中小模型厂商发展 的重点。在当前算力和数据 Scaling Law 放缓的情况下,找到新的 Scaling Law 方向是明 年模型发展的重点。 1.1 预训练和现实数据触顶,后训练时代将开启新的 Scaling Law 方向 从 24 年年初开始有论文提出模型能力提升速度随着参数规模的扩大而放缓,到 11 月份 OpenAI 前首席科学家 Ilya 在公开场合表示简单地增加数据和计算能力来扩大当前模型规 模的时代已经结束。但是,预训练的 scaling law 放缓不代表大模型发展速度和算力需求 的放缓,就像是芯片 gate 的实际尺寸停滞在 20nm 并不影响等效 gate 密度达到目前的 3nm,广义的摩尔定律甚至比 20 年前更快,大模型也需要找到具有更高的投入回报比的新 方向。
标签: 人工智能AI行业报告
相关文章
Agent(代理)一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。在计算机科学和人工智能领域,"Agent"...
2025-04-17 29 人工智能AI行业报告
[Download]资源名称:DeepSeek深度解读报告:部署、使用、安全(49页)...
2025-04-15 50 人工智能AI行业报告
DeepSeek V3与R1模型实现了开源,采用MIT协议。这产生多方面影响: 对大模型发展:这提升了世界对中国AI大模型能力的认知,一定程度打破了O...
2025-04-14 50 人工智能AI行业报告
DeepSeek 团队最大的特点之一就是年轻。团队成员中, 应届生和在读生占据了相当大的比例,他们活跃在公司的各 个项目和研究领域中。这些年轻人思维敏...
2025-04-14 66 人工智能AI行业报告
DeepSeek引领AI应用变革,“AI+消费”有望迎来大爆发。DeepSeek首次实现了大规模AI模型性能与成本之间的“剪刀差式突破”,显著 降低了...
2025-04-13 54 人工智能AI行业报告
DeepSeek 是一家中国人工智能公司,成立于 2023 年 7 月 17 日,总部位于浙江 杭州。它由量化资管巨头幻方量化创立,专注于大语言模型(...
2025-04-10 61 人工智能AI行业报告
最新留言