Agent(代理)一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。在计算机科学和人工智能领域,"Agent"...
2025-04-17 34 人工智能AI行业报告
我们认为今年席卷的 AI 浪潮本质上是生产力的革命,一个爆款现象级应用的 流量暴涨仅仅是一个产业开启的前奏。现阶段,除了以 ChatGPT 为代表的标杆应 用,关注第二第三梯队应用发展更能够客观感受到整个行业的繁荣。目前有越来 越多的应用开始发力,几乎每周都有新的爆款。根据极市平台消息,OpenAI 的 CEO-Sam Altman 在采访中透露,目前 OpenAI 面临非常严峻的 GPU限制,这也延迟了他们一些短期计划的实施。近来,客户投诉 最多的是关于 API 的可靠性和速度问题,据 Sam 解释,大部分问题是由于 GPU 短 缺造成的。在处理文本方面,更长的 32k 上下文还不能面向更多人推出。现在 OpenAI 还没有完全克服注意力机制的 O (n^2) 扩展问题,虽然 OpenAI 似乎很快就能实 现 100k-1M token 上下文窗口(在今年内)文本处理,但更大的文本处理窗口需 要进一步的研究突破。
除此之外,目前微调 API 也受到 GPU 供应的限制。OpenAI 尚未使用像 Adapters 或 LoRa 这样的高效微调方法,因此微调运行和管理起来计 算都非常密集。Sam 透漏更好的微调技术将在未来推出,他们甚至可能提供一个 社区专门研究模型。专用容量提供也受到 GPU 供应的限制。OpenAI 还提供专用容 量,为客户提供一个私有的模型副本。要使用此服务,客户必须愿意预先承诺支 出 10 万美元(约合 68.7 万人民币)。根据我们的测算,ChatGPT 产品运营需英伟达 A100 GPU 约 71296 片,预计投 入算力成本达 17.73 亿美元。据 SimilarWeb 数据,2023 年 5 月(至 5 月 24 日) ChatGPT 官网(chat.openai.com)总访问量为 14.08 亿次。据环球零碳研究中心 数据,每次用户与 ChatGPT 互动,ChatGPT 的每个响应词在 A100 GPU 上需要 350 毫 秒。除了支持 ChatGPT 产品本身的运营,还有上述微调 API 及专用容量等的算力需 求。因此我们认为目前算力仍然是制约 AI 应用发展的重要一环,整体行业需求还 有较大释放空间,这也是近期访问量趋缓的原因之一。
标签: 人工智能AI行业报告
相关文章
Agent(代理)一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。在计算机科学和人工智能领域,"Agent"...
2025-04-17 34 人工智能AI行业报告
[Download]资源名称:DeepSeek深度解读报告:部署、使用、安全(49页)...
2025-04-15 51 人工智能AI行业报告
DeepSeek V3与R1模型实现了开源,采用MIT协议。这产生多方面影响: 对大模型发展:这提升了世界对中国AI大模型能力的认知,一定程度打破了O...
2025-04-14 50 人工智能AI行业报告
DeepSeek 团队最大的特点之一就是年轻。团队成员中, 应届生和在读生占据了相当大的比例,他们活跃在公司的各 个项目和研究领域中。这些年轻人思维敏...
2025-04-14 66 人工智能AI行业报告
DeepSeek引领AI应用变革,“AI+消费”有望迎来大爆发。DeepSeek首次实现了大规模AI模型性能与成本之间的“剪刀差式突破”,显著 降低了...
2025-04-13 54 人工智能AI行业报告
DeepSeek 是一家中国人工智能公司,成立于 2023 年 7 月 17 日,总部位于浙江 杭州。它由量化资管巨头幻方量化创立,专注于大语言模型(...
2025-04-10 61 人工智能AI行业报告
最新留言