Agent(代理)一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。在计算机科学和人工智能领域,"Agent"...
2025-04-17 44 人工智能AI行业报告
不同模型得分及精度转换:根据Tim Dettmers等人的论文,团队使用大模型GPT-4当裁判,对不同模型的回答进行打分,以 GPT-3.5的成绩作为100%,最终GPT-4自己的得分是114.5%。Michal Kosinski的研究表明,GPT-3可以解决70%的心智理论任 务,而GPT-3.5解决了93%的任务,以GPT-3.5的成绩作为100,GPT-3的分数约为75(70/93*100)。如果使用分数对精度进行 衡量,则GPT-4精度相当于GPT-3.5的1.145倍,GPT-3精度相当于GPT-3.5的0.75倍。 此外,如果New Bing目前使用的模型为压缩约6倍后的模型,所需算力约减少到原来的六分之一。同样,模型的质量会受到 一定的影响,压缩后大约从GPT-3.5下降到GPT-3的水平,具体其打分换算过来约76.2分。
在2500万DAU的假设条件下,若每个用户10次的使用次数,GPT-3.5所需GPU数量大约为27.2万A100。如果2024年Bing Chat 的DAU达2500万,每个用户提10次问题,若按照芯片75%的使用效率进行测算,GPT-3.5所需GPU数量大约为27.2万 (2500*10turns/1224 turns/0.75 GPU utilization rate)。若根据精度下降10%,算力除以2的逻辑,可以推算出GPT-4 在2500万日活及10次平均使用次数下条件下所需算力大约为66.4万(27.2 GPU/(2^log0.9(114.5/100))。 在同样的假设条件下,若New Bing之后使用压缩6倍的模型(得分76.2分),所需算力约为4.5万GPU。如果微软对模型进 行压缩,压缩后的模型使用4块芯片,其算力需求约为4.5万。同样地,在相同假设前提下,GPT-3所需的算力约为4.1万 (27.2 GPU/(2^log0.9(75/100) 。根据机器之心,GPT-4的推理成本是Davinci模型(GPT-3.5为Davinci3)的3倍,与我们 测算结果相似。
标签: 人工智能AI行业报告
相关文章
Agent(代理)一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。在计算机科学和人工智能领域,"Agent"...
2025-04-17 44 人工智能AI行业报告
[Download]资源名称:DeepSeek深度解读报告:部署、使用、安全(49页)...
2025-04-15 59 人工智能AI行业报告
DeepSeek V3与R1模型实现了开源,采用MIT协议。这产生多方面影响: 对大模型发展:这提升了世界对中国AI大模型能力的认知,一定程度打破了O...
2025-04-14 54 人工智能AI行业报告
DeepSeek 团队最大的特点之一就是年轻。团队成员中, 应届生和在读生占据了相当大的比例,他们活跃在公司的各 个项目和研究领域中。这些年轻人思维敏...
2025-04-14 74 人工智能AI行业报告
DeepSeek引领AI应用变革,“AI+消费”有望迎来大爆发。DeepSeek首次实现了大规模AI模型性能与成本之间的“剪刀差式突破”,显著 降低了...
2025-04-13 57 人工智能AI行业报告
DeepSeek 是一家中国人工智能公司,成立于 2023 年 7 月 17 日,总部位于浙江 杭州。它由量化资管巨头幻方量化创立,专注于大语言模型(...
2025-04-10 66 人工智能AI行业报告
最新留言