Agent(代理)一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。在计算机科学和人工智能领域,"Agent"...
2025-04-17 34 人工智能AI行业报告
在计算机视觉领域,无监督学习技术发展相对较慢。2020 年,基于对比学习思 想的 MoCo 问世,证明了无监督学习在计算机视觉领域能取得不亚于监督学习 的效果。在此之后,基于对比学习的无监督学习方法不断演进,朝着结构更简单、 对数据样本要求更低、更容易应用的方向发展,准确度也不断提升。2021 年,Facebook AI(现 Mata AI)的何恺明等提出了 MAE 方法,该方法的 核心思想与自然语言处理领域中的 MLM 方法相同,同样是随机掩盖图像信息, 并在训练过程中对图像进行预测与重构。MAE 方法对数据的泛化性更强,更善 于处理大规模数据,将无监督训练的速度提高了 3 倍以上,在多个下游任务中表 现比监督学习更好。 至此,无监督学习方法在自然语言处理、计算机视觉两个深度学习最重要的领域 完成了统一;也由此结束了飞速发展期,转而进入缓慢发展阶段。 目前,国内外 AI 公司发布的大规模基础模型都采用了无监督学习方法。该方法 放大了场景拥有者的竞争优势。在自动驾驶领域,Tesla 的 Auto pilot 通过无监 督学习使用数十万 Tesla 司机的行为数据来训练 AI 模型。
据 Tesla 于 2021 年 AI Day 公布的数据,Tesla 平均每天会收到 500,000 条以上的驾驶数据视频,并 采用自动标注技术(Auto Labeling)自动生成训练信号,以此训练新的 AI 模型, 向 L5 级自动驾驶逐步迈进。2021 年全年,Tesla 共训练了 75,000 个 AI 模型, 平均每 8 分钟就要训练一个新的 AI 模型。无监督学习方法使 Tesla 大大降低了 AI 模型的训练成本、提高了 AI 模型的迭代速度,帮助 Tesla 利用自身的数据优 势保持在自动驾驶领域的领先地位。BERT、GPT-3 等 AI 大模型的成功使人们认识到模型参数规模、训练数据量对于提高 AI 智能水平效果显著,引发了大规模基础模型开发浪潮,各国内外 AI 巨头纷纷跟进,研发 自有的参数规模更大、性能更强的 AI 大模型,享受算法进步带来的数据规模红利。未来,数据质量的重要性可能远高于数量。Google 在对其语言模型 T5 的实验中发现: 数据数量与数据质量两个因素间,数据质量更为重要。AI 大模型的正确发展路径是在保 证数据质量的前提下,增大数据数量、扩充参数规模。
标签: 人工智能AI行业报告
相关文章
Agent(代理)一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。在计算机科学和人工智能领域,"Agent"...
2025-04-17 34 人工智能AI行业报告
[Download]资源名称:DeepSeek深度解读报告:部署、使用、安全(49页)...
2025-04-15 51 人工智能AI行业报告
DeepSeek V3与R1模型实现了开源,采用MIT协议。这产生多方面影响: 对大模型发展:这提升了世界对中国AI大模型能力的认知,一定程度打破了O...
2025-04-14 50 人工智能AI行业报告
DeepSeek 团队最大的特点之一就是年轻。团队成员中, 应届生和在读生占据了相当大的比例,他们活跃在公司的各 个项目和研究领域中。这些年轻人思维敏...
2025-04-14 66 人工智能AI行业报告
DeepSeek引领AI应用变革,“AI+消费”有望迎来大爆发。DeepSeek首次实现了大规模AI模型性能与成本之间的“剪刀差式突破”,显著 降低了...
2025-04-13 54 人工智能AI行业报告
DeepSeek 是一家中国人工智能公司,成立于 2023 年 7 月 17 日,总部位于浙江 杭州。它由量化资管巨头幻方量化创立,专注于大语言模型(...
2025-04-10 61 人工智能AI行业报告
最新留言