Agent(代理)一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。在计算机科学和人工智能领域,"Agent"...
2025-04-17 34 人工智能AI行业报告
ChatGPT 是 Open AI 公司发布的“语言模型”,该“模型”采用大规模的自然语言 (natural language model)算法,这个“模型”拥有和用户之间的交互界面,用户可以将 问题提交给“模型”,然后“模型”做出回复,就好比是在和一个智能的机器人进行文字 对话。 AI 应用分成分析型 AI 应用和生成式 AI 应用。其中,分析型 AI 应用已经被广泛使 用,包括短视频推送、人脸识别、搜索分类、语音助手和等;生成式 AI 还并未被广泛应 用,生成式 AI 的应用包括书写文字段落,生成图片,和生成代码等。 ChatGPT 是一种生成式 AI。ChatGPT 的工作原理可以简单的类比为,机器通过阅 读人类说出前半句话是什么,然后预测人类想要得到的后半句话应该是什么,可以类比 为诗词填空,出题人(即,人类)给出诗词的前半句,然后让答题者(即,机器)填写后半句。 达成这个目标,需要用人类已经存在的语料信息、图片信息或代码信息等作为数据集, 对模型进行训练,所以模型的认知边界将不断的趋近但无法超越人类自身的认知边界。 简要的来说,GPT 模型的实现有 2 个关键环节:第一,需要先用大量的数据对 AI 模型进行预训练,得到预训练模型;第二,在这个基础上进行一些人为的标注,进行微 调,提高其预测的准确度和可靠性。
比如,要生成一个可以正确地帮助人类规划旅行路 线的模型,模型的开发人员会使用规模极大的数据集(包含酒店信息、旅行路线请求信 息、地图信息、天气信息等)去进行模型的预训练,得到一个通用的预训练模型;然后 在这个通用模型的基础上,使用外包的人工标注团队,开展人工标注,对一些细节进行 标注,比如将已经停业的酒店标注出来,确保最终 ChatGPT 在规划旅行计划时不包括 这些已经停业的酒店。根据 Open AI 发布的信息,ChatGPT 的训练流程具体包括 3 部分:1)收集“展示 数据(Demonstration Data)”并训练出基于监督学习的决策策略;2)收集对比数据训练 奖励模型;3)使用 PPO 强化学习算法针对奖励模型优化策略。ChatGPT 目前基于 GPT- 3 和 GPT-4 技术之间,GPT-3 于 2020 年发布,GPT-4 有望于 2023 年上半年发布。 ChatGPT 的开发者采用了监督学习(Supervised Learning)和强化学习(Reinforcement Learning)算法去微调(fine-tune)ChatGPT 模型;其中,开发者采用了具有人类反馈的 强化学习算法(Reinforcement Learning from Human Feedback,RLHF),最小化了模型 所输出回答和真实情况的偏差度。 从技术的起源来看,ChatGPT(全称:Chat Generative Pre-Trained transformer), 采用了生成式的预训练的“Transformer”模型,而 Transformer 模型于 2017 年由谷歌 的研究人员在论文《Attention is all you need》中发布,这个模型促成了自然语言学习 (NLP)领域中 GPT 和 BERT 这 2 大模型的发展。这些年,在自然语言学习(NLP)领域, Transformer 模型逐步替代 RNN(循环神经网络)和 CNN(卷积神经网络);比如,相比于 RNN 模型,Transformer 模型引入了自我注意力(Self-attention)机制,结合算法优化,可 以实现并行运算,大量节约训练时间。
标签: 人工智能AI行业报告
相关文章
Agent(代理)一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。在计算机科学和人工智能领域,"Agent"...
2025-04-17 34 人工智能AI行业报告
[Download]资源名称:DeepSeek深度解读报告:部署、使用、安全(49页)...
2025-04-15 51 人工智能AI行业报告
DeepSeek V3与R1模型实现了开源,采用MIT协议。这产生多方面影响: 对大模型发展:这提升了世界对中国AI大模型能力的认知,一定程度打破了O...
2025-04-14 50 人工智能AI行业报告
DeepSeek 团队最大的特点之一就是年轻。团队成员中, 应届生和在读生占据了相当大的比例,他们活跃在公司的各 个项目和研究领域中。这些年轻人思维敏...
2025-04-14 66 人工智能AI行业报告
DeepSeek引领AI应用变革,“AI+消费”有望迎来大爆发。DeepSeek首次实现了大规模AI模型性能与成本之间的“剪刀差式突破”,显著 降低了...
2025-04-13 54 人工智能AI行业报告
DeepSeek 是一家中国人工智能公司,成立于 2023 年 7 月 17 日,总部位于浙江 杭州。它由量化资管巨头幻方量化创立,专注于大语言模型(...
2025-04-10 61 人工智能AI行业报告
最新留言