Reddit 正在赢得人工智能竞赛
价值数十亿美元的数据游戏
Reddit 在人工智能领域的崛起并非偶然;这是一场数据货币化的经典案例。通过与科技巨头谷歌和 OpenAI 达成独家、高价值的授权协议,Reddit 将其庞大的用户生成对话库转变成了利润丰厚的收入来源。这些交易,估计每年为 Reddit 带来来自谷歌的约 6000 万美元和来自 OpenAI 的约 7000 万美元收入,目前构成了该平台总收入的 10%。这一从免费数据访问到受控、优质内容供应的战略转变,不仅将 Reddit 定位为一个社交论坛,更使其成为人工智能时代不可或缺的数据批发商。
该公司在 2024 年初的 IPO 文件中明确将数据授权列为核心增长方向,合同总额在两年到三年内达到 2.03 亿美元。此举利用了大型语言模型对高质量、实时、对话式训练数据的无尽渴求。Reddit 的首席执行官史蒂夫·霍夫曼曾著名地重塑了叙事,认为其数据不应“免费提供给世界上一些最大的公司”。其结果是催生了一种新的经济模式,即社交内容直接为人工智能革命提供燃料,而 Reddit 则掌握着钥匙。
算法优势与流量爆炸
人工智能交易带来的意外之财之后,紧接着是网络流量的巨大转变。谷歌搜索算法的一次关键更新,旨在提升论坛和讨论的排名,几乎使 Reddit 的读者数量增加了两倍。在 2023 年 8 月至 2024 年 4 月期间,月访问量从 1.32 亿激增至 3.46 亿。这不仅仅是数字游戏;它从根本上改变了信息的发现方式。Reddit 的帖子开始显著出现在传统的搜索结果中,并且至关重要的是,出现在像谷歌 AI Overviews 和 Perplexity 这样的工具生成的人工智能答案里。
来自 Profound 的分析显示,在十个月的时间里,Reddit 成为这些人工智能答案引擎引用最多的域名。这种算法的认可使 Reddit 成为用户寻求从技术支持到旅行建议等一切事物的真实、社区验证见解的主要目的地。这股热潮从根本上改变了该平台在信息生态系统中的角色,将其定位为人类讨论与机器智能之间的桥梁。
为人工智能引擎提供燃料
为什么 Reddit 的数据对人工智能公司如此独特且有价值?答案在于其规模、活力和真实性。Reddit 拥有超过 10 亿帖子和 160 亿条评论,提供了一个庞大的、未经过滤的对话知识库,每天随着新趋势、新闻和利基专业知识而更新。这些数据对于训练模型理解细微差别、俚语和现实世界问题解决能力来说是黄金。当人工智能模型回答问题时,它们越来越多地依赖 Reddit 的帖子作为权威来源,引用它们来使其回答基于感知到的人类共识。
引用经济
这催生了一种“引用经济”,其中 Reddit 的价值与其在人工智能输出中的普遍性直接相关。该平台不仅仅是一个训练数据集;它是一个实时的参考来源。人工智能公司使用 API 拉取实时的 Reddit 内容来回答用户查询,并为每次访问调用付费。这种双重角色——既作为训练燃料又作为推理引用——使得 Reddit 的数据成为一个持续的收入来源,远远超出一次性授权费。
出版商站在十字路口
流量的海啸迫使传统媒体进行战略反思。曾经对 Reddit 持怀疑态度的媒体现在正积极在该平台上培养存在感。像《纽约时报》观点版、《滚石》杂志、美联社和《新闻周刊》这样的出版商已经启动或重振了他们的账户,Chartbeat 的客户中来自 Reddit 的页面浏览量增长了 88%。对于新闻机构而言,正如英国的 Mill Media 所指出的,Reddit 代表了一个强大的渠道,可用于受众发展甚至订阅引流。
在社区雷区中航行
然而,在 Reddit 上取得成功需要技巧。推广内容意味着遵守严格的、社区驱动的规范,这与其他社交平台形成鲜明对比。回报可能很显著,但风险也是真实存在的——正如《洛杉矶时报》被 r/LosAngeles 版主封禁时所看到的那样。作为回应,Reddit 正在用新工具吸引出版商,包括增强的分析仪表板、自动文章导入和改进的嵌入产品,旨在将这种共生但微妙的关系正式化。
人工智能主导地位的阴暗面
Reddit 与人工智能的纠缠并非没有重大并发症。该平台的突出地位导致谷歌有时将 Reddit 帖子排在原始来源材料之上,从而将重要流量从新闻网站转移走。此外,将 Reddit 数据吸收到人工智能训练集中引发了质量问题;臭名昭著的谷歌 AI Overviews 生成含有胶水的披萨食谱事件就源于 Reddit 上的一个玩笑帖子。该生态系统现在也容易受到“寄生虫 SEO”的攻击,即品牌用人工智能生成的内容淹没帖子以劫持可见性。
尽管是顶级引用来源,Reddit 也无法免受人工智能搜索蚕食推荐流量这一更广泛的行业威胁。这种悖论突显了该平台必须把握的微妙平衡:利用其数据获取收入,同时确保其核心社区和信息的完整性不会因其助力推动的人工智能系统而受损。
规划动态未来
Reddit 已经在为下一阶段制定战略,寻求超越固定授权费的模式。在与谷歌和 OpenAI 的续约谈判中,该公司正在推动一种动态定价模式。这种创新方法将把付款与其数据的已证明价值和性能挂钩——例如提升人工智能基准分数或推动用户参与度——而不仅仅是使用的帖子数量。此举可能会重塑整个行业人工智能内容付费的经济模式。
与此同时,Reddit 正在加强对数字边界的控制。它更新了系统以阻止未经授权的自动爬虫,起诉人工智能公司 Anthropic 涉嫌违规抓取数据,甚至限制了互联网档案馆的访问。通过支持“真正简单授权”等倡议——一个用于人工智能内容补偿的标准化框架——Reddit 正在倡导一个结构化、公平的市场,这表明即使有利润丰厚的交易,标准化定价也拥有未来的价值。
Reddit 自身的人工智能雄心
Reddit 并不满足于仅仅提供数据,它正在构建自己的人工智能未来。该平台推出了“Reddit Answers”,这是一个由谷歌 Gemini 模型驱动的对话式搜索工具,首席执行官史蒂夫·霍夫曼表示其雄心是让 Reddit 成为“首选的搜索引擎”。这种内部开发代表了一种防御性和进攻性的举措:直接捕获搜索价值并减少对外部人工智能合作伙伴的依赖。这标志着 Reddit 意图成为人工智能游戏中的参与者,而不仅仅是提供者,利用其独特的社区数据创造差异化的用户体验,将人们留在平台本身。
最终,Reddit 在人工智能领域的胜利是一个战略杠杆的故事。通过认识到其对话基础的巨大价值,它确保了财务稳定性和前所未有的影响力。在谈判动态支付方案并构建自己的人工智能工具的同时,Reddit 正在为社区驱动的平台如何在人工智能时代不仅生存下来,而且蓬勃发展并制定规则绘制蓝图。