iWeekly
美国最有影响力的新闻机构之一《纽约时报》整个夏天都在为人工智能而烦恼。8月初,《纽约时报》先是更新服务条款,禁止将新闻报道和图片等用于开发任何软件程式,包括训练机器学习或人工智能系统。随后,因版权问题,《纽约时报》与Open AI公司似乎将卷入一场诉讼对战中。根据NPR(全国公共广播电台)16日报道,双方正对“新闻用于AI训练”一事进行协商,如果持续有争议,《纽约时报》将起诉Open AI公司,保护知识产权。
禁止新闻报道用于AI开发
随着AI的发展,新闻媒体公司在“训练AI”上分成了两大阵营。一方是“同意派”,美联社于7月与Open AI签署合作协议,同意提供过去的报道用于数据学习,《华尔街日报》新闻集团也正在考虑向AI开发人员收取使用其中内容的费用,将生成式AI视为未来业绩的支持。另一方是以《纽约时报》为首的“反对派”。今年6月27日,《纽约时报》发给新闻编辑室所有工作人员的电子邮件中写道:“禁止将《纽约时报》任何独家新闻,无论已发表还是未发表的文章,用于训练生成式人工智能,例如ChatGPT、Bing Chat、Bard或其他工具。”
8月初,《纽约时报》正式公布更新后的服务条款,表示未经书面许可,所有在《纽约时报》刊登或提供的照片、影像、设计、音讯及视讯短片,以及其他资料及数据等,都不得用于训练生成式AI。如若违反这些规定,可能会被追究民事或刑事责任。
《纽约时报》并不孤独。今年4月,美国媒体业亿万富翁巴里•迪勒(Barry Diller)警告道,除非出版商能够利用版权法加以控制,否则人工智能将对新闻业造成破坏性影响。迪勒还考虑与一群主要出版商一起起诉使用版权内容训练人工智能系统的开发者。媒体大亨默多克领导的新闻集团(News Corp)是受到AI打击最严重的企业之一,其CEO罗伯特·汤姆森(Robert Thomson)表示新闻媒体的知识产权将被AI“偷走”,它不仅能收集和抓取故事,还能吸收和合成故事。这些故事包含了伟大新闻从业者的努力,但却被AI轻而易举盗取,导致读者永远不会再访问新闻网站,从而对新闻业造成致命打击。
在AI愈加成为各个行业不可阻挡的趋势后,《纽约时报》决定不追随这个潮流。它在给员工的邮件中写道:“我们决定寻找战略性创新的方法,AI于我们只是一种补充人类专业知识的数字工具。我们为技术的发展感到欣慰,但也需要在热情与事实中保持清醒的平衡。当AI威胁到我们时,我们将诉诸法律武器。”
Open AI正与《纽约时报》进行谈判,争取就版权问题达成一项许可协议。Open AI希望能使用《纽约时报》的图片和新闻,用于生成式AI的训练过程中,并愿意支付一笔可观的使用费。但很明显,《纽约时报》对这项提议抱有明显的担忧。根据NPR的报道,《纽约时报》内部人员考虑起诉Open AI公司。如果Open AI被发现非法使用《纽约时报》的文章来训练人工智能模型,法院有权命令该公司删除、销毁ChatGPT相对应的数据库,并处以高达15万美元的罚款。
“合理使用”适用于人工智能吗?
不只《纽约时报》,最近一段时间,许多公司或自由职业者都对Open AI提出指控,称该公司非法使用出版内容。美国喜剧演员莎拉·西尔弗曼(Sarah Silverman)2010年出版回忆录《The Bedwetter》,然而她却发现Open AI在未授权的情况下非法使用这本回忆录的数字版本。其他一些AI公司也存在非法使用图片、新闻等情况。盖帝图像(Getty Imgaes)正考虑起诉Stability AI,指控后者未经授权使用超过1200万张照片训练人工智能模型。
专家指出,图片所有者关注版权,但人工智能公司认为训练AI模型是创新之举,因此它们可能会使用所谓的“合理使用原则”为自己的行为进行辩护。“合理使用”是美国版权法中的一个概念,它允许人们在一定条件下,无需征得版权所有者的同意,可以自由使用受版权保护的部分内容,且不构成侵权。限制条件包括:是否具有商业意图或非营利教育目的,以及所使用的部分对于整部作品来说篇幅较短,并且不损害版权持有人的经济利益。
“谷歌图书扫描案”可以清楚解释如何应用“合理使用原则”。谷歌公司从2004年开始与美国纽约公共图书馆、哈佛大学图书馆等多家大型图书馆达成协议,通过扫描将馆藏的纸质书籍数字化上传至谷歌图书(Google Books),达到资源的最大化利用。扫描的书籍主要有两类,一类是不受当时版权保护的文献古籍,这部分提供全文查阅;另一部分受到版权保护的书籍只提供最多20%的免费内容,通常是目录和部分摘录,阅读全文则需要在Google Play上购买。
此举引起了出版商和作家的不满,他们认为,谷歌图书未经出版商和作者许可,私自扫描书籍,侵犯了版权法,于是在2005年对谷歌公司提出起诉。通过10年斗争,美国联邦上诉法院于2015年做出裁决,认定谷歌公司扫描图书的行为是在法律范围内允许的“合理使用”,并没有侵犯版权。因为谷歌图书并没有创造“替代品市场”,也就是说并不存在与纸质图书的激烈竞争。
媒体公司担心“合理使用原则”会成为某些AI公司侵权的借口。迪勒表示必须要重新定义“合理使用”的概念。“当一台不公平的机器没有界限时,就不可能得到合理的使用。”《纽约时报》内部人员也认为,如果法院判定AI生成的新闻与新闻媒体公司的独家新闻不构成竞争关系,那么新闻媒体公司的覆灭也只是时间问题。
新闻与图片来源:名利场、NPR、Semafor、The Verge,部分图片来自网络
iWeekly周末画报独家稿件,未经许可,请勿转载