The Browser Company融资后重心转向AI浏览器研发,Arc 2.0或成泡影

admin

The Browser Company 是一家与众不同的公司。

它于 2019 年创办,以纽约为基地,累计获得 1.28 亿美元的融资,估值超过 5.5 亿美元。

核心产品是 Arc 浏览器,它凭借颠覆性的产品体验,吸引了上百万具有高粘性的用户。在硅谷的极客们看来,Arc 是过去五年中最为酷的浏览器产品,其产品设计远超 Chrome 等传统浏览器。

在 2024 年春天完成 5000 万美元融资后,他们做出了一个决定。这个决定是将团队重心转向研发新产品“全新设计的 AI 浏览器”。原产品 Arc 则仅保持维护,用户期待的 Arc 2.0 或许不会再有了。

半年后,新产品 Dia 开始对器官进行宣传。创始人 Josh Miller 表示,他们在这个 demo 中对于新产品有着诸多的想法,这些想法多得数不清。

现在,Dia终于开启了邀请码公测。

浏览器开发者工具使用__浏览器开发人员

一、为AI重新设计浏览器

这支团队的创新能力很强。他们一开始就有明确的目标,那就是从最开始做起,去打造一款原生的 AI 浏览器。

为了达成这一目标,开发团队觉得必须进行彻底的重新开始;即便他们耗费数年精力打造的 Arc 浏览器已经初步具备了一定的规模效应。开发团队未曾公布过 Arc 浏览器的用户总数,然而仅 Windows 版本上线的首个月就吸引了 20 万用户,iOS 端的 App Arc Search 上线之后,仅仅用了三个月,其日活跃用户数量就突破了 10 万。

Arc 浏览器堪称“古典浏览器时代”的最高潮,然而它无法对 AI Agent 给浏览器带来的这场革命产生关键影响。开发团队曾尝试在 Arc 浏览器中整合一部分 AI 功能,但依然无法改变 Arc 浏览器本身并非为 AI 而生这一事实。

Dia 官网的一条信息表明:Dia 不是单纯地在现有的浏览器上增添 AI 功能,而是把 AI 当作核心的构建理念,其目的是构建出一个全新的、由 AI 推动的浏览环境。

浏览器开发人员__浏览器开发者工具使用

开发团队觉得,AI 不单单是一个应用,也不只是一个按钮,它应当成为浏览器底层所具备的能力。

Dia 从一开始就将 AI 能力深度整合到浏览器中,那么它在实际体验方面会带来哪些改变呢?

二、极简但优雅的产品体验

表面上,Dia 浏览器是一款多模态 AI 浏览器,它集成了 GPT-4o 与 Gemini Flash 2.0。这款浏览器支持个性化对话,还能进行视频分析与多任务处理。并且它是免费的,没有使用限制。

如果你曾经是 Arc 浏览器的用户,那么当你打开 Dia 的首页时,你可以通过 Dia 首页察觉到两款浏览器产品有着截然不同的开发逻辑,也就是从“复杂极客工具”到“极简 AI 入口”的产品逻辑发生了巨大变化。

浏览器开发人员_浏览器开发者工具使用_

开发团队实现“AI 浏览器应该是什么样”的一种方式是,在 Dia 的首页一个角落加入了“Personalize Dia”功能。你可以从“你崇拜谁?”“你喜欢怎样的学习方式?”以及“Dia 的回答风格”这三个角度输入内容,以此帮助 Dia 快速理解用户自身,将 AI 快速设定为用户更熟悉的一种形态。

Steve Jobs 的创新精神会对 Dia 的知识结构搭建与思考方式产生影响。《The Atlantic》《NYT》《New Yorker》等媒体的视角也会对 Dia 的知识结构搭建与思考方式产生影响。用户的选择会在潜移默化中对 Dia 的知识结构搭建与思考方式产生影响,从而使 Dia 在某种程度上成为用户所崇拜对象的“投影”。

浏览器开发者工具使用_浏览器开发人员_

在 AI 融入浏览器的这股浪潮里,Dia 团队没有仅仅把 AI 生硬地放进既有的框架当中。他们尝试从用户与 AI 的交互这个方面开始着手,去构想“AI 浏览器”的个性化定制方案。

Dia 进一步提供了“Dia 的回答风格”强度调节,这种调节多达 20 档。就如同早期操作系统能让用户调整字体大小和界面主题一样,Dia 使 用 户 能 够 精 细 地 控 制 AI 的 表 达 方 式 和 情 感 色 彩 。 默认的中间档位提供了一个平衡点,用户可以依据自身喜好微调 Dia 的“个性”。

设置好 Dia 的风格之后,你可以感受到开发团队在“让 AI 能说人话”这件事上花费了很大的功夫。“舒服”这个词能够最准确地对其进行描述。

_浏览器开发人员_浏览器开发者工具使用

对于经常使用浏览器打开众多窗口且处理复杂工作的用户来说,Dia 浏览器的@Tabs 具备网页内容分析以及自动推荐提示词等功能,这些功能确实能够有效地帮助用户理清思路,还能够以最简单的方式梳理复杂内容的结构脉络。

在之前开发团队的早期演示里,Dia 能够协助用户去完成更为复杂的任务,像是自动把邮件里的商品添加到亚马逊购物车中,而在那个时候,AI Agent 概念还尚未兴起。在现阶段版本的体验里,Dia 对网页读取的颗粒度较为细致。并且,它同时更注重借助 AI 能力,还大幅简化了用户界面和操作流程,通过在设计上保持“克制”,从而获取了更加高效的使用体验。

_浏览器开发者工具使用_浏览器开发人员

Dia 意味着未来的 AI 浏览器,不会只是冰冷的工具,它能够理解用户,还能贴近用户,甚至在一定程度上成为用户在数字世界里的延伸。

这与 Manus 团队打造专门给 AI 使用的浏览器的思路是相似的,二者都有着一个核心目标:能让 AI 更好地为人类服务,并且以更自然、更具个性化的方式融入到我们的数字生活中。

三、与Manus不同的产品哲学

原生 AI 应用方面,浏览器作为平台能让模型能力更深入地理解用户的浏览习惯与上下文,进而提供更个性化且高效的服务。能将 AI Agent 概念中的产品快速交付给用户,所以今年的实际情况已变为“优秀的 AI 应用开发者会打造自己的浏览器”。

过去三十年互联网领域已经经历了数次重大的技术变迁,然而浏览器依然是构成当代互联网最前沿用户体验的重要部分。正因如此,浏览器市场变得“极端保守”。

可能会有一些极客类用户,为了屏蔽广告等功能而去尝试一款新的浏览器工具。然而,绝大部分用户不会仅仅因为一点新鲜感,就放弃自己原本已经熟悉的使用体验。这正是让 Chrome 在过去十余年能够一家独大的根本原因。

如果说 Dia 浏览器在现阶段有哪一点最为令人印象深刻,或许依然是“新鲜感”。然而,它的这种新鲜感与带有“极客工具箱”属性的 Arc 存在着显著差异。Dia 浏览器更像是开发团队所打造出的一片“适宜 AI 应用生长的土壤”。

这个思路与之前打造出 Manus AI 的 Monica.im 团队的思路相似:在开发 Manus 期间,Monica.im 曾有过打造一款 AI 浏览器的想法,但他们很快遭遇了一个问题,即 AI 和人类共用一个浏览器界面,导致体验非常差。

最终的解决方案是:为 AI 专门打造一款浏览器,以便人与 AI 进行交互,让 AI 通过操作浏览器来完成执行命令。它以基于浏览器的 Agent 的形式存在,需要用户在想要使用 AI 的时候去使用。

对于同一个问题,Dia 团队在浏览器交互方面展现出极强的创新能力,其给出的答案是:当 AI 能够更好地融入浏览器之后,对浏览器的交互逻辑进行重新设计。

The Browser Company 声称自己“不做 App”,然而浏览器实际上依旧是一个大型的 App。除了 Dia 这样的挑战者之外,像谷歌、Opera 等在之前的时代掌控着浏览器入口的选手,也在积极地迎接 AI Agent 给浏览器带来的转型机遇。

浏览器开发者工具使用_浏览器开发人员_

当前 AI 应用发展尚处于早期,还未提供手机系统级别的生态入场机会。在此前提下,The Browser Company 以及 Perplexity 的 Comet 都将浏览器当作布局 LLM 深度交互生态的“船票”,它们都做出了这样的选择。

浏览器作为一种产品,具有承接端侧用户信息和充当互联网入口的属性。一些硬件/手机 OS 厂商鉴于此,都在这个领域尝试进行突破,将一部分 AI Agent 的能力落地。所以,这个赛道会很快呈现出“百花齐放”的局面,并且会是 AI Agent 在短期内最令人兴奋的突破点之一。

浏览器开发人员__浏览器开发者工具使用

对于创业公司而言,问题变成了:AI 浏览器是否已是现有生态下的 AI App 终点?

创业公司在做浏览器,大厂也在做浏览器,它们都回到了一个根源的问题,那就是“浏览器”是什么?

互联网历史上的第一个“入口”是它。在 PC 互联网的最初阶段,以网景、Mosaic 作为代表的图形界面浏览器对用户访问互联网的方式进行了改变。微软的 IE 浏览器更是由于反垄断案而改变了科技竞争的格局。

随后,Office 以及 Adobe 等桌面软件曾一度兴起,并且占据了大量的市场份额。然而,在 Web 端,G-Suite 和 Canva、Figma、Notion 等新锐产品也出现了。随着 SaaS 模式在全球市场取得成功,最终网页应用和移动 App 成为了开发者的前两大选择。

在桌面平台方面,浏览器就像是聚拢价值的金山。用户会进行浏览信息的行为,比如浏览新闻、博客以及流媒体等;也会执行各种操作,像发送邮件、进行创作以及召开视频会议等。在大模型时代,我们把这些都称作 context(上下文)。

这表明,AI 拥有非常大的施展空间,同时也有被增强的机遇。

你关注了过去数月有关 Agentic AI 的讨论。你会发现,作为产品形态的 browser 浏览器,被频繁地讨论和使用。

Manus具备内置浏览器的功能。Opera推出了 AI 助手 Aria。Perplexity 在进行浏览器产品的研发。OpenAI 也在从事浏览器产品相关工作。同时,The Browser Company 有新产品 Dia。

一些原本定义并非浏览器的产品,选择了浏览器的形态。例如豆包,它的桌面端是以 Chromium 为基础进行开发的。还有一家大厂也有类似形态的产品,那就是夸克的桌面端。这两家大厂的产品,功能十分全面,并且用户量远远超过创业团队的新产品。最为重要的是,它们都是各自集团面向 C 端的人工智能重点发力产品。

浏览器开发人员_浏览器开发者工具使用_

豆包希望成为你的默认浏览器

Claude 有桌面端应用,它是基于 Electron 框架的 PWA 应用,并且还是基于 Chromium 的。(当然,Claude 很可能只是一个临时性的产品,他们应该没有准备一直以这种形态存在。)

浏览器开发人员_浏览器开发者工具使用_

部分AI浏览器或基于浏览器的AI产品

很多厂商在思考如何让 AI 能更好地“使用浏览器”。例如刚刚完成融资的 browser-use 以及 Amazon 刚刚发布的 Nova Act SDK 。这些项目主要集中在框架层,能为开发者提供调用浏览器的服务。

从AI接入方式的层面上,AI浏览器产品大多可以分为三类:

功能性的roadmap是明确且共识的:

一开始,AI 会处理一个信息单元,它会读取单个网页,会阅读文字,会抽取 YouTube 字幕,也会理解用户当前所处的网页环境。

接着,随着 context 的延展,AI 具备了理解更多信息的能力,像其他已打开的 Tab 等。并且,它甚至能够记住用户以往打开的网页以及执行过的操作。

最终,AI 必定会替代用户去执行操作。例如,它可以挑选商品,也能够发送邮件,还能写文档,以及做设计。凡是用户在浏览器内能够做的事情,AI 都具备执行的能力。

这是一个非常清晰的,能够颠覆过去浏览器体验的机会。

我们尚不知道,这个机会究竟属于拿到 5000 万美元融资的 The Browser Company 呢,还是属于传统巨头 Chrome 和 Edge 呢?亦或是,下一个如同 Manus 般的创业新秀会突然出现,把想象中的用户体验转化为现实。