
Reddit才在2025年6月控告Anthropic未经授权使用该平台的内容来训练AI模型,本周转而控告Perplexity AI,以及其他3家数据截取公司SerpApi、Oxylabs UAB与AWMProxy,指控它们大规模地以不当的方式爬取Reddit上的内容。而这次Perplexity AI也不甘示弱地通过Reddit平台喊冤。
Reddit宣称,Perplexity AI,以及美国的SerpApi、立陶宛的Oxylabs UAB与俄罗斯的AWMProxy等数据截取公司,以工业规模及非法的方式从Reddit抓取用户贴文与评论,并用于商业用途,特别是训练或支持AI搜索/回答系统。其中,SerpApi、Oxylabs UAB及AWMProxy伪装身份、隐藏位置,假冒是真人用户来绕过Reddit的技术防护措施,甚至是通过Google搜索结果页来抓取Reddit数据。
此外,Reddit也指控Perplexity AI至少为上述其中一家的客户,购买其数据来构建其答案引擎。Reddit要求法院禁止被告使用或销售自Reddit爬取的数据,终止相关行为并要求损害赔偿。
迄今Reddit已与OpenAI、Google及Sprinklr等AI企业完成内容合作协议,但Perplexity AI一直未与Reddit签署授权合约。
不过,同一天Perplexity AI就通过Reddit平台反击,指出当公共数据成为上市公司商业模式的一部分时,它们便预见了今日的惨况。出售训练数据使用权已成为Reddit日益重要的收入来源,猜测Reddit的控告是为了在与Google及OpenAI的内容授权谈判中展现实力。
Perplexity AI澄清,该公司并没有不理会Reddit提出的授权问题,而是向对方解释,Perplexity AI是家应用层公司,不会利用内容来训练模型,也从来没有利用内容来训练模型,因此不可能签署授权协议。然而,就算听了解释,Reddit依然坚持Perplexity AI应对费。
Perplexity AI的答案搜索引擎主要功能为搜索网络、识别可靠来源,并将资讯集成成清晰与最新的答案,并集中呈现用户所需的见解。该公司表示,它们使用Reddit内容的方式是总结了Reddit的讨论,并在答案中引用了Reddit上的讨论流,然而,Reddit本周改变了心意,不再允许Perplexity用户在学习过程中找到Reddit上的公开内容,尽管Reddit认为这是它们的权利,但这与开放网络背道而驰。
不过,目前Reddit有超过9成的营收还是来自广告。根据该公司今年第二季财报,该季进账5亿美元,增长78%,其中光是广告营收就占了4.65亿美元,包含授权在内的其他营收只占了3,500万美元。该季Reddit的每股盈余为0.48美元。











