Agent(代理)一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。在计算机科学和人工智能领域,"Agent"...
2025-04-17 31 人工智能AI行业报告
用于 AI 模型训练的数据集有多种方式避免侵权,或直接补偿版权持有人。 专有数据:1)版权合作协议:Shutterstock、Axel Springer 等多家版权提 供商与 AI 公司建立合作;2)API 付费访问:部分专业性强的数据提供商会 对 API 访问进行收费,23 年 Reddit、Twitter 的 API 访问由免费转向付费。 开源数据:1)开放许可协议:包括 CC、ODC、CDLA 等;2)特定的数据抓 取策略:如遵守网站的 Robot.txt 文件;3)社区监督:提升数据集透明度。 直接补偿创作者:1)事前补偿:技术难度低,但难以界定合理的补偿额 度,如 Shutterstock 建立的贡献者基金;2)事后补偿:对 AI 生成内容进行 溯源,定价合理但技术尚不成熟,如卡耐基梅隆大学发表的归因模型算法。 专用数据集:直接出售适用于模型训练的数据集,或打包成 MaaS 服务。 海外版权合作协议盈利模式稳定、商业化前景初步展现。AI 生成内容或对版 权提供商的传统业务造成一定威胁,版权提供商与 AI 公司的合作是互利共 赢。1)多媒体素材库 Shutterstock:通过出售模型训练素材创收,推出 AI 生成图片专区,提供由 OpenAI 支持的 AI 工具;2)出版商 Axel Springer: 向 OpenAI 出售其出版物作为训练素材,共同运用 AI 技术提升用户体验。 从 Shutterstock 看版权库与 AI 公司的合作:AIGC 的利好整体强于利空。 1)利好:Shutterstock 的数据授权收入已较明显体现在业绩端,驱动估值 修复和股价回升,23Q3 出售模型训练素材的收入占公司总收入的 19.5%; 2)利空:23 年以来 Shutterstock 传统业务低迷更多受同业竞争影响,同类 公司 Getty Image 业绩稳健,AIGC 对版权库行业的威胁和替代尚不明显。 国内外模型训练数据版权规定尚待完善,版权商股价有望得到密集催化。 22M12 一篇论文显示 Stable Diffusion 以像素点级别复制名画的细节。对 AIGC 的版权问题的争议和相关法规主要可以分为两类:1)AI 生成内容的版 权界定:美国不承认 AI 生成内容拥有著作权,而中国倾向于保护 AI 生成内 容的著作权;2)模型训练数据的版权规定:美国、欧盟均明确要求使用受 版权保护的材料来训练模型,而日本则认定训练数据不受版权保护。
标签: 人工智能AI行业报告
相关文章
Agent(代理)一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。在计算机科学和人工智能领域,"Agent"...
2025-04-17 31 人工智能AI行业报告
[Download]资源名称:DeepSeek深度解读报告:部署、使用、安全(49页)...
2025-04-15 51 人工智能AI行业报告
DeepSeek V3与R1模型实现了开源,采用MIT协议。这产生多方面影响: 对大模型发展:这提升了世界对中国AI大模型能力的认知,一定程度打破了O...
2025-04-14 50 人工智能AI行业报告
DeepSeek 团队最大的特点之一就是年轻。团队成员中, 应届生和在读生占据了相当大的比例,他们活跃在公司的各 个项目和研究领域中。这些年轻人思维敏...
2025-04-14 66 人工智能AI行业报告
DeepSeek引领AI应用变革,“AI+消费”有望迎来大爆发。DeepSeek首次实现了大规模AI模型性能与成本之间的“剪刀差式突破”,显著 降低了...
2025-04-13 54 人工智能AI行业报告
DeepSeek 是一家中国人工智能公司,成立于 2023 年 7 月 17 日,总部位于浙江 杭州。它由量化资管巨头幻方量化创立,专注于大语言模型(...
2025-04-10 61 人工智能AI行业报告
最新留言