护城河是一个概念,所有投资人和创始人都非常关注它。因为它与企业的长期价值以及生死存亡相关。在 AI 时代,大家对护城河有着同样的执念。然而,大家越来越搞不清楚在这个时代什么才是护城河。甚至连是否还有护城河都已经成为了一个问题。
从之前开始,Google 内部就有相关讨论,且一直没有停止。然而,越来越多的答案显示,在 AI 时代,企业之前所拥有的那些护城河可能都难以抵挡攻击,显得不堪一击。
大模型不存在护城河。OpenAI 历经多年才建立起优势,而 xAI 以及 DeepSeek 等却能在更短时间和更低成本的基础上迅速赶上。大量的 AI 应用更是如此。OpenAI 此次对图片新功能进行了更新,这让许多人觉得那些专门从事图像生成的创业公司的护城河瞬间消失了。
独立开发者 Levelsio 表示,在 AI 领域似乎不存在某个模型能够长久地保持领先地位以及拥有护城河,很快就会有下一个模型将其取代。在图像生成模型领域,我们已经察觉到领先者的更替速度非常快:
这是一个极为残酷的行业。数十亿美金被投入其中,大模型公司在短短几个月内就有可能被超越,甚至被淘汰。a16z 合伙人 Justine Moore 发出了这样的感叹。
现在唯一的护城河就是不断地推出很酷的东西,真是太疯狂了。
几位播客 All In 的嘉宾之前在一个播客中说,在这个新的富足时代,营销是很重要的,渠道也是很重要的。
红杉资本(Sequoia)的合伙人 Konstantine Buhler 撰写了一篇文章,内容是谈论这个时代的护城河。他提出观点,认为使用数据便是护城河,即“Usage is the Moat”。我对此观点较为认同。恰好在前两天,我与一位在 AI 领域的创始人交流这方面的内容时,对方也提及了类似的概念。
这与之前我介绍的那个 3000 营养师撑起年收入 5000 万美金的 AI 产品有一点类似。从技术层面来看,它借助了 Anthropic 大模型的部分能力,并且很好地处理了特定群体的问题,而用户在使用过程中促使它不断地完善和优化产品。
Konstantine Buhler 表示,下一个能达到万亿美金规模的护城河或许并非基于专利或网络效应。它更有可能是依据数十亿次的用户交互,并且这些交互是竞争对手难以复制的。
在过去的几个季度中,我们看到了在风险投资领域属于最快增长速度的情况之一。很多公司正以打破纪录的速度向 1 亿美金或者更高的年度经常性收入(ARR)冲刺。一个时常被提及的问题是,这些公司的“防御工事”究竟有多深?
在商业领域,护城河一般指的是一种较为显著的进入壁垒,其作用是防止竞争对手进入市场并抢占份额。沃伦·巴菲特是护城河概念的主要倡导者,他曾表示:“一家出色的企业如同一座坚固的城堡,城堡周围环绕着一条深深的护城河。我期望护城河里有鲨鱼,以此来防范那些企图侵占城堡的人。”
每一次新的技术革命都能孕育出新的潜在护城河。在电话通信时代,我们见证了一种极为强大的护城河,那就是网络效应。梅特卡夫定律(Metcalfe’s Law)很好地体现了这一概念,该定律表明,一个电信网络的财务价值或影响力与系统中连接用户的数量的平方(n²)成正比。
这一理论诞生于 1980 年的电话通信领域。后来,它成为了互联网“网络效应”的核心概念,并且最终影响了社交网络。无论是称之为“网络效应”还是“梅特卡夫定律”,它都是一个强大的护城河概念。在几十年前,这个概念还不是那么显而易见。其本质是,随着新用户的加入,网络中的潜在连接数量会按 n² 的数量级增长。
这次 AI 时代带来了一个新的问题,即使用数据能否成为护城河?具体而言,用户在使用产品过程中所产生的数据,能否形成可持续的竞争壁垒?
这是一个开放性问题。历史上或许最典型的案例来源于 Google。Google 起初是依靠 PageRank 算法来达成搜索的自动化的。不过,仅仅过了几年,他们真正的优势不再是 PageRank 了,而是从用户搜索行为里收集到的点击数据。他们开始对某个链接被点击的概率进行预测。这些预测的依据是之前用户在类似搜索中点击的情况。
OpenAI 创建 GPT 的原因正在于此。GPT 的目标并非仅仅是成为一款热门的消费级产品,而是要收集这种使用数据的反馈。从理论上来说,如果他们能够打造出一个人人都可以使用的产品,那么就能够观察到用户所提出的问题,并且收集到关于答案质量的反馈意见。他们犯了一个错误,在我看来,那就是没有允许用户对回复进行编辑。因为这样做原本可以提供更高质量的反馈数据,从而让他们的护城河更深。
各家公司都在竞相追逐极高的收入目标。也许真正的护城河在于反馈循环,而这反馈循环就是使用数据。更多的数据能够带来更好的 AI 产品。OpenAI 在 2020 年的一篇论文《Scaling Laws for Neural Language Models》中很好地总结了这一效应,这篇论文的作者中有几位后来成为了 Anthropic 的创始人。
该论文提出,语言模型的性能会随着一些因素的增加而平稳提升,这些因素包括计算能力、数据集规模和参数。从图表方面来看,X 轴是采用对数刻度的。这或许意味着数据存在边际收益递减的情况。也就是说,这条曲线可能会呈现出一种特定的形态,即“logistic curve”(S 型曲线),也就是当数据量达到一定程度之后,收益会逐渐趋于平稳。但这对整体趋势没有影响。因为问题的复杂度在增加,新的 S 型增长有可能会出现。也就是说,能够持续“叠加曲线”。
我认为,产品的价值会提升。随着平台上使用数据的增长,这种提升会呈现指数级。
需要强调的是,这种“使用数据”与一般的互联网数据不一样。普通的互联网数据已经高度商品化了,比如有许多公司都在运用 Open Source Common Crawl()数据集。所以,护城河的真正所在,是凭借用户的独特使用状况构建起反馈循环,去解决他们特定的问题。这种数据在一些垂直领域具有更强的专属性,并且形成的护城河更为坚固。
现在,各家公司都在努力冲过增长曲线的拐点,想要比竞争对手更领先。倘若它们能够率先突破这个临界点,那么后来者进入市场就会变得很困难。因为领先者的产品质量远远超过对手,而竞争对手需要让用户使用一个明显质量更差的产品,并且要坚持足够长的时间来积累训练数据,以此提升产品质量。但对任何理智的用户来说,这种情况几乎是不会发生的。