OpenAI 称《纽约时报》版权诉讼毫无根据 数据来自公开渠道

2024-01-09 13:23
摘要:人工智能公司OpenAI日前对《纽约时报》提起的版权诉讼做出公开回应,称利用公开文章等数据训练AI系统属于“合理使用”。在今天下午 OpenAI 官方博客上发布的一封信中,该公司重申了其观点,即使用网络上的公开数据(..

人工智能公司OpenAI日前对《纽约时报》提起的版权诉讼做出公开回应,称利用公开文章等数据训练AI系统属于“合理使用”。

在今天下午 OpenAI 官方博客上发布的一封信中,该公司重申了其观点,即使用网络上的公开数据(包括《纽约时报》等文章)来训练人工智能模型是合理使用。换句话说,在创建像GPT-4和DALL-E3这样的生成式人工智能系统时,OpenAI 认为它不是“从数十亿个艺术品、电子书、论文等示例中“学习”以生成类似人类的文本和图像”。不需要许可或以其他方式支付这些示例的费用——即使它从这些模型中赚钱。

OpenAI 写道:“我们认为这一原则对创造者公平,对创新者必要,对美国竞争力至关重要。”

图源备注:图片由AI生成,图片授权服务商Midjourney

OpenAI 还在其字母反流中解决了这种现象,即生成式 AI 模型在以某种方式提示时逐字(或接近逐字)输出训练数据,例如生成一张与著名摄影师拍摄的照片相同的照片。OpenAI 认为,使用来自单一来源(例如《纽约时报》)的训练数据不太可能发生反流,并让用户有责任“负责任地行动”并避免故意促使其模型反流。

OpenAI还反驳了“训练数据反刍”的指控,称单一信息源的数据不太可能被AI模型逐字输出。该公司批评纽时“操纵”提示让模型“抄袭”,其实AI生成的内容与原文有明显区别。

此番言论与部分专家意见相左,后者展示AI系统确实会在未提示下重复训练素材。调查也显示,多数公众支持媒体公司在此案中的立场。目前,OpenAI正面临来自版权方和公众的压力,要求其改变使用他人内容的做法。

OpenAI与《纽约时报》之间围绕AI训练数据的版权争议继续升级。这场关乎AI伦理和创新的法律大战,其结果或将决定未来语言AI的发展方向。

更新于:11个月前