AIGC宇宙 AIGC宇宙

AI 数据版权新纪元:Real Simple Licensing 协议引发行业关注

随着人工智能(AI)行业面临日益严峻的版权问题,尤其是在 Anthropic 与版权方达成15亿美元和解后,许多企业开始重视其训练数据的合法性。 目前,有多达40起未授权数据使用的诉讼案正在进行中,其中包括一起因 Midjourney 制作超人形象而被起诉的案件。 在没有有效的授权体系的情况下,AI 公司可能面临大规模的版权诉讼,这让行业前景堪忧。

随着人工智能(AI)行业面临日益严峻的版权问题,尤其是在 Anthropic 与版权方达成15亿美元和解后,许多企业开始重视其训练数据的合法性。目前,有多达40起未授权数据使用的诉讼案正在进行中,其中包括一起因 Midjourney 制作超人形象而被起诉的案件。

在没有有效的授权体系的情况下,AI 公司可能面临大规模的版权诉讼,这让行业前景堪忧。为了应对这一挑战,一群技术专家和网络出版商联合推出了一项名为 Real Simple Licensing(RSL)的新系统,旨在实现大规模的数据授权。该系统已经得到了 Reddit、Quora 和 Yahoo 等大型网络出版商的支持,但行业内能否形成合力,吸引主要的 AI 实验室参与仍然是个未知数。

版权,盗版

RSL 的联合创始人 Eckart Walther 表示,他们的目标是创建一个可以在互联网上广泛应用的训练数据授权体系。他指出,“我们需要为互联网提供机器可读的许可协议,而 RSL 正是解决这一问题的工具。”

多年来,诸如数据提供者联盟等组织一直在推动更清晰的数据采集实践,但 RSL 是第一个旨在提供实际技术和法律基础设施的尝试。技术上,RSL 协议定义了出版商可以为其内容设定的具体许可条款,这包括 AI 公司是否需要定制许可或采用知识共享(Creative Commons)条款。参与的网页将把条款纳入其 “robots.txt” 文件,以便轻松识别哪些数据受哪些条款保护。

在法律层面,RSL 团队建立了一个名为 RSL Collective 的集体许可组织,旨在为出版商谈判条款并收取版税,类似于音乐行业的 ASCAP 或电影行业的 MPLC。目前,已经有许多知名出版商加入了这一集体,包括 Yahoo、Reddit 和 Medium 等。

尽管如此,确定 AI 模型具体使用哪些训练数据以计算版税的挑战依然存在。对于实时获取网络数据的产品,如谷歌的 AI 搜索摘要,数据使用的追踪相对简单,但如果训练过程未被记录,确认特定文档是否被某个大语言模型(LLM)使用就变得困难重重。

尽管存在这些挑战,RSL 的创建者们相信 AI 公司能够应对。“他们在之前的某些授权协议中已经需要能够报告数据使用情况,因此这并不是不可能的,”RSL 的另一位联合创始人 Doug Leeds 表示。“只要足够好,就能让人们得到应有的报酬。”

最后,RSL 的未来能否成功,关键在于 AI 公司是否愿意接受这一新体系。随着越来越多的 AI 行业领袖呼吁建立这样的系统,RSL 团队希望他们能够信守承诺。

相关资讯

宫崎骏“怒了”?ChatGPT吉卜力风潮惹版权争议,OpenAI或面临法律挑战!

OpenAI 的当红 AI 聊天机器人 ChatGPT 本周因一项突如其来的用户趋势而成为焦点:无数用户涌入,争相生成酷似日本动画传奇工作室吉卜力作品风格的图像。 这场模仿之风迅速蔓延,甚至连 OpenAI 首席执行官 Sam Altman 也在社交媒体上戏称自己变成了“吉卜力风格的 twink”。 然而,这场看似无伤大雅的流行趋势很快遭遇急转弯。
3/29/2025 11:31:00 AM
AI在线

终于坐不住了!Midjourney V7全新版本亮出王牌!

最近AI圈可太热闹了。 随着什么都会的GPT-4o横空出世,大家都忙着让它画画去了。 我前几天刷朋友圈,十条有八条都在晒GPT-4o画的吉卜力风,剩下两条还在求画教程….
4/3/2025 12:38:44 PM
彭彭

50组多风格提示词,全面测评Midjourney V7生图效果!

嗨大家好! 原本说好 2 月底就上的 Midjourney V7,今天终于来了! 那年杏花微雨,一张《太空歌剧院》冲破云霄,带来的震撼与欣喜至今仍让人记忆犹新。
4/9/2025 1:26:46 AM
阿真Irene
  • 1