近期,在GPT-4o创造的新范式影响下,Yuedane、Zhipu、Perplexity和OpenAI相继推出了AI搜索和推理功能。
与之前的“大海捞针”不同,最近更新中的AI搜索有了“大脑”。面对问题时,它能先像人一样拆解步骤,然后精准搜索,最后呈现答案。
根据“知识管理模型”,数据本身是无序的,缺乏意义。只有向上演化为信息、知识、智慧,才有价值。信息解决“什么”问题,知识解决“如何”问题,金字塔顶端的智慧解决“为什么”问题。从这个进化逻辑来看,CoT(思维链)支撑的人工智能搜索已经开始2.0时代,从信息聚合走向规则总结和辅助决策。
用户对人工智能搜索的依赖程度超出了预期,Perplexity 声称其每周可处理 1 亿次查询,每月可处理约 4 亿次查询。与巨头争夺用户还不够。更重要的是,人工智能搜索在商业化方面释放出积极信号。国外最新报告显示,随着AI搜索的发展,谷歌搜索广告市场份额十年来首次跌破50%。
新老玩家都虎视眈眈地盯着谷歌留下的“蛋糕”。目前有两条路。一是效仿谷歌做通用AI搜索工具,向C端出售使用权,向B端出售广告席位,打造AI搜索能力;另一种是以应用程序为载体,嵌入AI搜索能力。在这种场景下,你想绕过搜索引擎中间商,建立自己的分销渠道和数据门户。不仅可以通过搜索优化用户体验,增加支付的可能性,还可以防止中间商制造差价,增强盈利能力。
悦暗搞饥饿营销,疯狂加分,打造“中国第一4o搜索”存在感;通过Talkie赚回来的Minimax,专注于AI应用的搜索和推广;就连一向缓慢不冷不热的微信也在寻求改变。正在测试AI问答功能,打通混元与微信之间的生态。
“共识越大,门槛就越高。”有业内人士认为,正是因为AI搜索普遍被看好,竞争才加剧。 “如果不突出,就选择谷歌。”
搜索+深度推理=?
深度推理模式下的AI搜索需要拆解和分析能力,这远远超出了“搜索”本身的动作。搜索和推送的底层逻辑嵌套在寻找和解决问题答案的过程中。
结合Perplexity和Kimi的经验,AI搜索推理模式的基本流程如下:提出一个可能涉及大量搜索和多个意图的问题。 AI并不急于回答问题,而是先解决问题,分解一条复杂的指令。将其分解为几个步骤,然后依次完成“搜索+分析”动作,最后呈现答案。
以前的AI搜索很“书呆子”,用关键词在题库里搜索,在开书里答题。今天的AI是一个“聪明的幽灵”。掌握解题思路后,即可按照解题步骤答题。而且整个解题都是实时动态的,边思考边答题。
以Perplexity官方给出的案例为例,问题是“每年阅读贝佐斯所有的股东信,并每年在表格中列出要点”。为了解决这个问题,AI将其分解为三个步骤,分别是“搜索并找到贝索斯的所有年度股东信”、“获取每封贝索斯股东信的内容”和“产生贝索斯年度股东信的密钥” 。点形式”。如果使用Kimi探索版,生成答案后会再次搜索,完成“反思后添加”。
“搜索+深度推理”可以看作是执行搜索任务的代理,所以你可以看到AI给出了可行的操作步骤,而不是搜索“贝索斯”、“股东信”和“要点”等关键词。人工智能搜索的底层逻辑发生了变化,从“发现”到“解决”,“搜索”的动作已经成为解决问题的子集。如果将搜索视为辅助解决问题的工具,那么这个子集可以无限扩展,例如文档、知识库、PPT、办公软件等。Agent工具的开放性和可扩展性为提高搜索质量铺平了道路。
当然,就目前而言,搜索代理也有其自身无法克服的缺点。
Photon Planet在测试中发现,当过分强调搜索步骤的完整性时,过程是正确的,但结果却是错误的。这意味着单个CoT的链没有问题,但是链之间的连接关系出现了错误。有些问题中会出现“鬼撞墙”的情况,搜索和单步拆解动作反复循环,这会造成计算能力的巨大浪费。
上面也提到了,好的解决问题思路大于搜索。当CoT取代RAG成为标准时,我们必须警惕简单问题复杂化的趋势。例如,在一些经典的逻辑问题中,原本可以分两步解决的问题,不得不被迫增加分析过程,进而增加搜索的难度。 CoT 与数量无关,而是与构建质量有关。
人工智能搜索高级2.0
突破单一功能的语境,人工智能搜索距离解决问题又近了一步。
将搜索过滤出来的内容进行维度划分。最底层是信息。互联网时代的搜索是通过关键词来匹配信息池的。如何找到取决于用户手动点击过滤页面。人工智能搜索率先填补了上述空白。连接互联网的人工智能可以自行搜索并获得明确而不是模糊的答案。
但现阶段,用户的感知非常明显,ChatGPT等助手只能回答类似4W“谁、什么、何时、何地”的问题。聚合的好处是不需要打开N个网页就可以了解某个东西最基本的情况。提示上方的组件可以随意组合。这时,限制AI搜索有用性的关键就是搜索量。即搜索范围越大,能覆盖的4W就越全面,而且准确度也可以通过体积来提高。
知识是在信息的基础上进一步提炼的。它涉及对信息的深入理解和处理。它是通过大量的搜索和比较发现的规律和趋势。智慧是知识的进一步提升,运用法律来指导决策和执行。
2.0阶段的人工智能搜索是介于知识和智慧之间的。例如,你可以提出“贝索斯经常提到的关键词”、“贝索斯提到的关键点如何影响亚马逊的发展”等额外问题。还可以上传《孙子兵法》文档,让AI为亚马逊发展出谋划策。以上都是脱离4W层面来讨论How和Why问题的。正是因为搜索处理信息的维度增加了,所以它的价值也增加了。
目前来看,开卷考试和独立思考两种检索方式并没有太大区别。您可以使用关键字搜索获得相同问题的相似答案。从信息到智慧,AI 2.0搜索押注的是长期价值,但鉴于目前训练后推理投入不足,这仍需要时间。
除了CoT方法之外,AI搜索还有其他增强方法。信息检索是基础。在此基础上,衍生出三个想法。一是扩大搜索量和范围。 Kimi探索版的搜索量是普通版的十倍,一次搜索可精读500多页。
Kimi探索版的产品经理曾得出一个结论:“如果有Kimi搜索不到的信息,很大概率用户将很难通过传统搜索引擎找到它。”其潜台词是对Kimi的搜索量充满信心,但同时也忽略了一个问题。 “完整”不能等同于“准确”和“高质量”。
这就催生了第二个想法,质量搜索。核心是在开发搜索能力之前,提前过滤掉冗余、低质量的信息,保证搜索池的质量。相当于建立了一个搜索漏斗池。顶部是未经过滤的信息。第二层根据AI搜索公司或用户定制的标准进行过滤。第三层进一步细分,如相关性、相似性、优先级等强弱,信息的控制权和发布权将重新分配。
最后一种是直接补充信息源,因为无论在数量和质量之间如何选择,都可能达不到用户的期望。如果是这样,最好让用户自己上传数据和文本。
瓜分“谷歌”,人人有份
传统搜索在退却,人工智能搜索在前进,趋势日益凸显。目前,AI搜索已成为兵家必争之地。
招聘信息显示,AI六小虎中,悦暗重注AI搜索和推理方向,大量涉及推理和工程优化的职位正在招聘。 Minimax也在招聘与搜索和推荐相关的工程师,但其想法不同,专注于其AI应用中的算法和广告优化。