大型语言模型是生成或嵌入式文本的基础模型 (一种大型神经网络)。它们生成的文本可以通过为其 提供起点或“提示”来进行调节,从而使其能够用自然 语言或代...
2025-01-17 59 人工智能AI行业报告
我们认为今年席卷的 AI 浪潮本质上是生产力的革命,一个爆款现象级应用的 流量暴涨仅仅是一个产业开启的前奏。现阶段,除了以 ChatGPT 为代表的标杆应 用,关注第二第三梯队应用发展更能够客观感受到整个行业的繁荣。目前有越来 越多的应用开始发力,几乎每周都有新的爆款。根据极市平台消息,OpenAI 的 CEO-Sam Altman 在采访中透露,目前 OpenAI 面临非常严峻的 GPU限制,这也延迟了他们一些短期计划的实施。近来,客户投诉 最多的是关于 API 的可靠性和速度问题,据 Sam 解释,大部分问题是由于 GPU 短 缺造成的。在处理文本方面,更长的 32k 上下文还不能面向更多人推出。现在 OpenAI 还没有完全克服注意力机制的 O (n^2) 扩展问题,虽然 OpenAI 似乎很快就能实 现 100k-1M token 上下文窗口(在今年内)文本处理,但更大的文本处理窗口需 要进一步的研究突破。
除此之外,目前微调 API 也受到 GPU 供应的限制。OpenAI 尚未使用像 Adapters 或 LoRa 这样的高效微调方法,因此微调运行和管理起来计 算都非常密集。Sam 透漏更好的微调技术将在未来推出,他们甚至可能提供一个 社区专门研究模型。专用容量提供也受到 GPU 供应的限制。OpenAI 还提供专用容 量,为客户提供一个私有的模型副本。要使用此服务,客户必须愿意预先承诺支 出 10 万美元(约合 68.7 万人民币)。根据我们的测算,ChatGPT 产品运营需英伟达 A100 GPU 约 71296 片,预计投 入算力成本达 17.73 亿美元。据 SimilarWeb 数据,2023 年 5 月(至 5 月 24 日) ChatGPT 官网(chat.openai.com)总访问量为 14.08 亿次。据环球零碳研究中心 数据,每次用户与 ChatGPT 互动,ChatGPT 的每个响应词在 A100 GPU 上需要 350 毫 秒。除了支持 ChatGPT 产品本身的运营,还有上述微调 API 及专用容量等的算力需 求。因此我们认为目前算力仍然是制约 AI 应用发展的重要一环,整体行业需求还 有较大释放空间,这也是近期访问量趋缓的原因之一。
标签: 人工智能AI行业报告
相关文章
大型语言模型是生成或嵌入式文本的基础模型 (一种大型神经网络)。它们生成的文本可以通过为其 提供起点或“提示”来进行调节,从而使其能够用自然 语言或代...
2025-01-17 59 人工智能AI行业报告
大模型快速发展,网信办数据显示,截至2024年7月30日,全国范围内通过登记备案的行业大模型有136款,占比达69%。行业大 模型深度赋能教育、金融、...
2025-01-08 76 人工智能AI行业报告
生成式AI也在加速赋能广告制作环节。今年业绩和股价爆发的AppLovin和汇量科技,主要关注的是决策式 AI在程序化广告平台的技术突破,提升广告投放精...
2025-01-06 105 人工智能AI行业报告
纵观历史50年,五次半导体市场规模迅猛成长均伴随爆款电子产品的普及。自1976年起,全球半导体市场历经了5次迅猛成长,分别由台式电脑(1983~198...
2025-01-05 89 人工智能AI行业报告
先进封装:受AI芯片大面积需求带动,2.5D先进封装于2023至2024年供不应 求情况明显,据TrendForce预估,2025年晶圆代工厂配套提供...
2025-01-05 97 人工智能AI行业报告
针对外贸 B2B 垂类场景的AI助手AI麦可:截至2024/6/30,购买AI麦可的会员共6095 位(不含试用体验包客户),较2024年一季度末增加...
2025-01-04 67 人工智能AI行业报告
最新留言