OpenAI和苹果公司与出版商就新闻内容用于人工智能训练进行谈判
来源:中国保护知识产权网 发布日期:2024-01-26 阅读:30次
据报道,OpenAI将向出版商提供高达500万美元的新闻内容授权费用,以训练其大型语言模型(LLM)。据称,苹果公司也在进行类似的谈判。这一消息是在《纽约时报》宣布起诉OpenAI侵犯其版权一周之后发布的。《纽约时报》指控OpenAI未经其许可使用其文章训练LLM。
《纽约时报》于2023年12月27日宣布起诉OpenAI侵犯版权,称后者使用了其数百万篇文章来训练其LLM。
2023年,版权所有者一直在批评人工智能开发者使用图像和文本数据来训练模型,而不考虑这些数据是否受版权保护。大部分数据来自于从互联网上胡乱抓取的信息,要么是利用专门构建的网络爬虫抓取的,要么是从LAION之类的开源数据提供商获得的,然后再进行审核和整理。这一整理过程在多大程度上会删除受版权保护的数据仍是未知数。
《纽约时报》起诉OpenAI侵犯版权,称其LLM是“通过复制和使用数百万篇《纽约时报》受版权保护的新闻文章、深度调查、观点文章、评论、操作指南等内容而构建的”。当时,OpenAI发言人告诉《纽约时报》,OpenAI尊重“内容创作者和所有者的权利,并致力于与他们合作,确保他们从人工智能技术和新的收入模式中获益”。
OpenAI与主要媒体品牌进行许可谈判的决定被视为其避免未来类似诉讼所采用的一种方式。该人工智能实验室已经与《美联社》和媒体巨鳄阿克塞尔·施普林格(Axel Springer)达成了协议,与后者的协议将允许OpenAI的ChatGPT服务的用户接收来自阿克塞尔·施普林格新闻网站的内容摘要,并看到模型对具体问题的回答,同时会注明相关文章来自出版商。这两项交易的财务条款尚不清楚。不过,据美国科技媒体《The Information》报道,OpenAI为媒体公司提供的内容授权价格在100万至500万美元之间。与此同时,据报道苹果公司将提供更高的报酬,但同时要求对新闻内容拥有更广泛的使用权。
在版权侵权问题上,OpenAI还面临着越来越不确定的监管环境。欧盟曾表示,如果使用受版权保护的内容来训练其模型,LLM开发者必须作出声明。不过,英国和日本等其他司法管辖区已经宣布,他们有意允许受版权保护的数据用于训练商业人工智能模型(尽管磋商仍在进行中)。与此同时,包括微软、谷歌和Adobe在内的几家大型科技企业已经提出,如果客户因使用其人工智能产品而面临版权索赔,它们将对客户进行赔偿。(编译自techmonitor.ai)