Reddit控告Perplexity AI与3家数据爬取公司

Reddit才在2025年6月控告Anthropic未经授权使用该平台的内容来训练AI模型，本周转而控告Perplexity AI，以及其他3家数据截取公司SerpApi、Oxylabs UAB与AWMProxy，指控它们大规模地以不当的方式爬取Reddit上的内容。而这次Perplexity AI也不甘示弱地通过Reddit平台喊冤。

Reddit宣称，Perplexity  AI，以及美国的SerpApi、立陶宛的Oxylabs UAB与俄罗斯的AWMProxy等数据截取公司，以工业规模及非法的方式从Reddit抓取用户贴文与评论，并用于商业用途，特别是训练或支持AI搜索/回答系统。其中，SerpApi、Oxylabs UAB及AWMProxy伪装身份、隐藏位置，假冒是真人用户来绕过Reddit的技术防护措施，甚至是通过Google搜索结果页来抓取Reddit数据。

此外，Reddit也指控Perplexity AI至少为上述其中一家的客户，购买其数据来构建其答案引擎。Reddit要求法院禁止被告使用或销售自Reddit爬取的数据，终止相关行为并要求损害赔偿。

迄今Reddit已与OpenAI、Google及Sprinklr等AI企业完成内容合作协议，但Perplexity AI一直未与Reddit签署授权合约。

不过，同一天Perplexity AI就通过Reddit平台反击，指出当公共数据成为上市公司商业模式的一部分时，它们便预见了今日的惨况。出售训练数据使用权已成为Reddit日益重要的收入来源，猜测Reddit的控告是为了在与Google及OpenAI的内容授权谈判中展现实力。

Perplexity AI澄清，该公司并没有不理会Reddit提出的授权问题，而是向对方解释，Perplexity AI是家应用层公司，不会利用内容来训练模型，也从来没有利用内容来训练模型，因此不可能签署授权协议。然而，就算听了解释，Reddit依然坚持Perplexity AI应对费。

Perplexity AI的答案搜索引擎主要功能为搜索网络、识别可靠来源，并将资讯集成成清晰与最新的答案，并集中呈现用户所需的见解。该公司表示，它们使用Reddit内容的方式是总结了Reddit的讨论，并在答案中引用了Reddit上的讨论流，然而，Reddit本周改变了心意，不再允许Perplexity用户在学习过程中找到Reddit上的公开内容，尽管Reddit认为这是它们的权利，但这与开放网络背道而驰。

不过，目前Reddit有超过9成的营收还是来自广告。根据该公司今年第二季财报，该季进账5亿美元，增长78%，其中光是广告营收就占了4.65亿美元，包含授权在内的其他营收只占了3,500万美元。该季Reddit的每股盈余为0.48美元。