大型语言模型是生成或嵌入式文本的基础模型 (一种大型神经网络)。它们生成的文本可以通过为其 提供起点或“提示”来进行调节,从而使其能够用自然 语言或代...
2025-01-17 59 人工智能AI行业报告
不同模型得分及精度转换:根据Tim Dettmers等人的论文,团队使用大模型GPT-4当裁判,对不同模型的回答进行打分,以 GPT-3.5的成绩作为100%,最终GPT-4自己的得分是114.5%。Michal Kosinski的研究表明,GPT-3可以解决70%的心智理论任 务,而GPT-3.5解决了93%的任务,以GPT-3.5的成绩作为100,GPT-3的分数约为75(70/93*100)。如果使用分数对精度进行 衡量,则GPT-4精度相当于GPT-3.5的1.145倍,GPT-3精度相当于GPT-3.5的0.75倍。 此外,如果New Bing目前使用的模型为压缩约6倍后的模型,所需算力约减少到原来的六分之一。同样,模型的质量会受到 一定的影响,压缩后大约从GPT-3.5下降到GPT-3的水平,具体其打分换算过来约76.2分。
在2500万DAU的假设条件下,若每个用户10次的使用次数,GPT-3.5所需GPU数量大约为27.2万A100。如果2024年Bing Chat 的DAU达2500万,每个用户提10次问题,若按照芯片75%的使用效率进行测算,GPT-3.5所需GPU数量大约为27.2万 (2500*10turns/1224 turns/0.75 GPU utilization rate)。若根据精度下降10%,算力除以2的逻辑,可以推算出GPT-4 在2500万日活及10次平均使用次数下条件下所需算力大约为66.4万(27.2 GPU/(2^log0.9(114.5/100))。 在同样的假设条件下,若New Bing之后使用压缩6倍的模型(得分76.2分),所需算力约为4.5万GPU。如果微软对模型进 行压缩,压缩后的模型使用4块芯片,其算力需求约为4.5万。同样地,在相同假设前提下,GPT-3所需的算力约为4.1万 (27.2 GPU/(2^log0.9(75/100) 。根据机器之心,GPT-4的推理成本是Davinci模型(GPT-3.5为Davinci3)的3倍,与我们 测算结果相似。
标签: 人工智能AI行业报告
相关文章
大型语言模型是生成或嵌入式文本的基础模型 (一种大型神经网络)。它们生成的文本可以通过为其 提供起点或“提示”来进行调节,从而使其能够用自然 语言或代...
2025-01-17 59 人工智能AI行业报告
大模型快速发展,网信办数据显示,截至2024年7月30日,全国范围内通过登记备案的行业大模型有136款,占比达69%。行业大 模型深度赋能教育、金融、...
2025-01-08 76 人工智能AI行业报告
生成式AI也在加速赋能广告制作环节。今年业绩和股价爆发的AppLovin和汇量科技,主要关注的是决策式 AI在程序化广告平台的技术突破,提升广告投放精...
2025-01-06 105 人工智能AI行业报告
纵观历史50年,五次半导体市场规模迅猛成长均伴随爆款电子产品的普及。自1976年起,全球半导体市场历经了5次迅猛成长,分别由台式电脑(1983~198...
2025-01-05 89 人工智能AI行业报告
先进封装:受AI芯片大面积需求带动,2.5D先进封装于2023至2024年供不应 求情况明显,据TrendForce预估,2025年晶圆代工厂配套提供...
2025-01-05 97 人工智能AI行业报告
针对外贸 B2B 垂类场景的AI助手AI麦可:截至2024/6/30,购买AI麦可的会员共6095 位(不含试用体验包客户),较2024年一季度末增加...
2025-01-04 67 人工智能AI行业报告
最新留言