大型语言模型是生成或嵌入式文本的基础模型 (一种大型神经网络)。它们生成的文本可以通过为其 提供起点或“提示”来进行调节,从而使其能够用自然 语言或代...
2025-01-17 59 人工智能AI行业报告
GPT-2 在多个下游任务中表现出色。例如,在 8 种语言模型任务中,仅通过 zero-shot 学习, GPT-2 在 7 种任务中超过了最优水平;在儿童图书测试的命名实体识别任务中,超过最优 水平 7%;在文本长期依赖性建模能力测试数据集 LAMBADA 上,GPT-2 将困惑度从 99.8 降到了 8.6;在阅读理解任务中,GPT-2 超过了 3 个基线模型;在法译英任务中,GPT-2 在 zero-shot 学习的基础上,超过了大多数的无监督方法,略逊于有监督的方法;在文本总 结任务中的效果接近有监督的模型。 OpenAI:得到微软注资,关注技术滥用问题 微软向 OpenAI 投资 10 亿美元,并提供独家云支持。2019 年 7 月,微软向 OpenAI 投资 10 亿美元,帮助 OpenAI 构建人工通用智能(AGI)。此外,微软作为 OpenAI 的独家云提 供商,与 OpenAI 合作开发 Microsoft Azure 中的软硬件平台并考虑将其扩展到 AGI,以及 共同开发新的 Azure AI 超级计算技术。 OpenAI 出于对技术滥用问题的考虑,分阶段发布 GPT-2 完整版。
OpenAI 出于对技术滥 用问题的考虑,在 GPT-2 诞生后并未发布完整版的训练模型。2019 年 2 月,OpenAI 发布 了 124M 参数的小型 GPT-2 模型,5 月发布 355M 参数的中型 GPT-2 模型,8 月发布 7.74 亿参数的 GPT-2 模型。直到 2019 年 11 月,作为 GPT-2 分阶段发布的最终模型版本,OpenAI 发布了 15 亿参数 GPT-2,以及代码和模型权重。在此过程中,OpenAI 还使用各种任务的 人类反馈对 774M 参数 GPT-2 语言模型进行了微调,提高了模型在部分任务上的表现。Few-shot 取代 zero-shot,训练效果得到进一步加强。GPT-2 模型中,在下游训练时采用 zero-shot 理念,在执行各类子任务时不给任何样例,属于较为极端的情况。虽然在 GPT-2 在某些测试中取得了不错的效果,但在一些任务上结果不达预期。因此,OpenAI 引入了 few-shot,即对于特定任务仅给予少量的样例(10-100 个),和 GPT-2 一样不做微调处理, 仅通过与模型的文本交互来指定任务和 few-shot。从多种训练基准训练结果看,few-shot 能够取得比 zero-shot 更好的准确度结果。
标签: 人工智能AI行业报告
相关文章
大型语言模型是生成或嵌入式文本的基础模型 (一种大型神经网络)。它们生成的文本可以通过为其 提供起点或“提示”来进行调节,从而使其能够用自然 语言或代...
2025-01-17 59 人工智能AI行业报告
大模型快速发展,网信办数据显示,截至2024年7月30日,全国范围内通过登记备案的行业大模型有136款,占比达69%。行业大 模型深度赋能教育、金融、...
2025-01-08 76 人工智能AI行业报告
生成式AI也在加速赋能广告制作环节。今年业绩和股价爆发的AppLovin和汇量科技,主要关注的是决策式 AI在程序化广告平台的技术突破,提升广告投放精...
2025-01-06 105 人工智能AI行业报告
纵观历史50年,五次半导体市场规模迅猛成长均伴随爆款电子产品的普及。自1976年起,全球半导体市场历经了5次迅猛成长,分别由台式电脑(1983~198...
2025-01-05 89 人工智能AI行业报告
先进封装:受AI芯片大面积需求带动,2.5D先进封装于2023至2024年供不应 求情况明显,据TrendForce预估,2025年晶圆代工厂配套提供...
2025-01-05 97 人工智能AI行业报告
针对外贸 B2B 垂类场景的AI助手AI麦可:截至2024/6/30,购买AI麦可的会员共6095 位(不含试用体验包客户),较2024年一季度末增加...
2025-01-04 67 人工智能AI行业报告
最新留言