Reddit 正在出售用于人工智能培训的数据

2024-02-20

据彭博社报道,Reddit 已就内容许可协议进行谈判,允许将其数据用于训练人工智能模型。


据报道,Reddit 在 3 月份首次公开募股(IPO)可能达到 50 亿美元之前,与一家未公开的大型人工智能公司签署了一份价值 6000 万美元的协议。此举可被视为在最后关头向潜在投资者展示快速发展的人工智能行业的潜在收入来源。


尽管 Reddit 尚未确认这笔交易,但这一决定可能会产生重大影响。如果消息属实,这将意味着 Reddit 大量的用户生成内容--包括来自热门子论坛的帖子、知名和不知名用户的评论以及关于各种话题的讨论--可以用来训练和增强现有的大型语言模型(LLM),或为开发新的生成式人工智能系统奠定基础。


然而,Reddit 的这一决定可能会让其用户群感到不满,因为该公司最近的商业决策遭到了社区越来越多的反对。


去年,当 Reddit 宣布计划开始对访问其应用程序编程接口(API)收费时,数千个 Reddit 论坛暂时关闭以示抗议。几天后,一群Reddit黑客威胁说,除非公司撤销API计划或支付450万美元赎金,否则他们将公布之前窃取的网站数据。


Reddit 最近还做出了其他一些有争议的决定,比如删除用户账户中多年的私人聊天记录和信息。该平台还实施了新的自动审核功能,并取消了用户关闭个性化广告的选项,这加剧了用户的不满情绪。


随着各行各业和各平台对使用公共数据、艺术和其他人类创造的内容来训练人工智能系统的道德问题的争论不断加剧,最新报道的出售 Reddit 数据用于人工智能训练的交易可能会引起用户更大的反弹。