大型语言模型是生成或嵌入式文本的基础模型 (一种大型神经网络)。它们生成的文本可以通过为其 提供起点或“提示”来进行调节,从而使其能够用自然 语言或代...
2025-01-17 58 人工智能AI行业报告
用于 AI 模型训练的数据集有多种方式避免侵权,或直接补偿版权持有人。 专有数据:1)版权合作协议:Shutterstock、Axel Springer 等多家版权提 供商与 AI 公司建立合作;2)API 付费访问:部分专业性强的数据提供商会 对 API 访问进行收费,23 年 Reddit、Twitter 的 API 访问由免费转向付费。 开源数据:1)开放许可协议:包括 CC、ODC、CDLA 等;2)特定的数据抓 取策略:如遵守网站的 Robot.txt 文件;3)社区监督:提升数据集透明度。 直接补偿创作者:1)事前补偿:技术难度低,但难以界定合理的补偿额 度,如 Shutterstock 建立的贡献者基金;2)事后补偿:对 AI 生成内容进行 溯源,定价合理但技术尚不成熟,如卡耐基梅隆大学发表的归因模型算法。 专用数据集:直接出售适用于模型训练的数据集,或打包成 MaaS 服务。 海外版权合作协议盈利模式稳定、商业化前景初步展现。AI 生成内容或对版 权提供商的传统业务造成一定威胁,版权提供商与 AI 公司的合作是互利共 赢。1)多媒体素材库 Shutterstock:通过出售模型训练素材创收,推出 AI 生成图片专区,提供由 OpenAI 支持的 AI 工具;2)出版商 Axel Springer: 向 OpenAI 出售其出版物作为训练素材,共同运用 AI 技术提升用户体验。 从 Shutterstock 看版权库与 AI 公司的合作:AIGC 的利好整体强于利空。 1)利好:Shutterstock 的数据授权收入已较明显体现在业绩端,驱动估值 修复和股价回升,23Q3 出售模型训练素材的收入占公司总收入的 19.5%; 2)利空:23 年以来 Shutterstock 传统业务低迷更多受同业竞争影响,同类 公司 Getty Image 业绩稳健,AIGC 对版权库行业的威胁和替代尚不明显。 国内外模型训练数据版权规定尚待完善,版权商股价有望得到密集催化。 22M12 一篇论文显示 Stable Diffusion 以像素点级别复制名画的细节。对 AIGC 的版权问题的争议和相关法规主要可以分为两类:1)AI 生成内容的版 权界定:美国不承认 AI 生成内容拥有著作权,而中国倾向于保护 AI 生成内 容的著作权;2)模型训练数据的版权规定:美国、欧盟均明确要求使用受 版权保护的材料来训练模型,而日本则认定训练数据不受版权保护。
标签: 人工智能AI行业报告
相关文章
大型语言模型是生成或嵌入式文本的基础模型 (一种大型神经网络)。它们生成的文本可以通过为其 提供起点或“提示”来进行调节,从而使其能够用自然 语言或代...
2025-01-17 58 人工智能AI行业报告
大模型快速发展,网信办数据显示,截至2024年7月30日,全国范围内通过登记备案的行业大模型有136款,占比达69%。行业大 模型深度赋能教育、金融、...
2025-01-08 76 人工智能AI行业报告
生成式AI也在加速赋能广告制作环节。今年业绩和股价爆发的AppLovin和汇量科技,主要关注的是决策式 AI在程序化广告平台的技术突破,提升广告投放精...
2025-01-06 105 人工智能AI行业报告
纵观历史50年,五次半导体市场规模迅猛成长均伴随爆款电子产品的普及。自1976年起,全球半导体市场历经了5次迅猛成长,分别由台式电脑(1983~198...
2025-01-05 89 人工智能AI行业报告
先进封装:受AI芯片大面积需求带动,2.5D先进封装于2023至2024年供不应 求情况明显,据TrendForce预估,2025年晶圆代工厂配套提供...
2025-01-05 97 人工智能AI行业报告
针对外贸 B2B 垂类场景的AI助手AI麦可:截至2024/6/30,购买AI麦可的会员共6095 位(不含试用体验包客户),较2024年一季度末增加...
2025-01-04 67 人工智能AI行业报告
最新留言