经过两年多由大模型引发的 AI 战争,所有的创业团队和投资人都在问:大模型真正的应用场景是什么?或者更重要的是,如何才能获得真正的客户和收益?
在普通消费者还在为对话式聊天助手兴奋不已的同时,AI公司早已在寻找AI落地场景。比如企业SaaS这个千亿级赛道,就挤满了OpenAI、Anthropic、微软等AI新贵和科技巨头。
在如此拥挤的领域,一家名为Glean的公司凭借其内部的AI搜索产品赢得了索尼电子和Databricks等行业巨头的青睐。
近日,这家成立仅五年的公司在D轮融资中获得了凯鹏华盈和光速创投两亿美元巨额融资,公司估值飙升至22亿美元(约合人民币160亿元),成为企业AI领域当之无愧的领军者。
Glean 是如何做到的?它的企业 AI 搜索产品有何特别之处?
集中式人工智能搜索平台
Glean可以看作是一个AI企业搜索与知识管理平台,主要功能包括:AI搜索、知识管理、工作主页。
AI搜索是Glean的核心功能,相较于传统搜索,其优势在于跨应用、个性化。
Glean打造了深度集成的工作空间,为企业员工提供统一的界面来访问所有企业应用和服务,快速搜索、定位和整合会议纪要、支持票、项目档案等分散的信息,大大提高查找信息的速度。
例如,用户可以在Glean的平台上搜索Slack对话信息、Google文档内容以及Confluence中的信息。
不仅如此,用户还可以在Glean上执行所连接SaaS应用的轻量级功能,比如直接在Glean上开始会议、创建Jira文档等。
Glean基于企业内部整合的数据,不仅融合了能够实现“语义理解”的向量搜索、关键字搜索技术,还利用LLM推出了生成式AI搜索功能,推出了AI助手。
Glean的AI助手主要有三个功能:
1. 人工智能解答
Glean 的 AI 可以根据每个用户的特定需求、偏好和访问权限提供定制的搜索结果。例如,当不同职位和地理位置的员工搜索他们的 OKR 指标时,Glean 会给每个人不同的结果。Glean 还会利用员工活动(例如点击搜索结果)来提高搜索的相关性。
2. 专家测试
当无法检索信息时,Glean 还可以将员工与可以帮助解答问题或完成任务的人员联系起来。
员工可以通过点击“人员”选项找到与搜索结果相关的内部“主题专家”。例如,当用户想要搜索“员工数据保留政策”时,用户可以通过“人员”选项找到工程安全部门的相关负责人。
3. 情境推荐
用户在文档中选中某一内容后,可以输入快捷键Cmd-J/Ctrl-J来查看与该内容相关的补充内容和上下文。
例如,用户在查看“供应商安全调查问卷”文档时,可以通过输入快捷键查看“销售安全文档”、“常见安全问题汇总”等链接。
此外,Glean 的 AI 助手还可以充当写作和编码助手。例如,服务团队可以使用 Glean 生成支持单据回复。同样,它可以加快软件开发任务,例如查找编程最佳实践和最近的代码更改信息。
正如 Glean 创始人 Arvind Jain 所说,“Glean 是一个面向所有公司数据的 AI 平台。你可以把它看作是你公司内部的 Google 或 ChatGPT,它可以根据公司内部信息回答员工提出的任何问题,并引用源代码。”
除了搜索功能外,Glean还提供“知识管理”和“工作主页”功能。
“知识管理”是指用户可以共享、整合相关文档或链接、使用新的短网址跳转界面等,以便更便捷地导航到常用资源。
此外,任何员工或团队都可以为应用程序中的文档添加自定义描述,使其他人更容易快速理解并与他人共享文档。例如,人力资源团队可以将与员工入职相关的文档和链接整合到专门的集合中,以帮助新员工更快地了解公司。
“工作首页”根据用户的不同习惯,在首页呈现个性化的功能模块,包括公司公告、员工名录、日历等,用户还可以将重要内容置顶搜索结果顶部。
可以看出,Glean可以在集中式AI平台上连接、保护、索引和理解客户的企业数据,不仅大大提高了信息检索的效率,也使企业内部的信息和知识更易于管理和利用。
对此,Glean 创始人 Arvind Jain 表示:“凭借这些强大的更新,Glean 将企业搜索提升到了一个新的水平。我们正在提供一个互补的系统,使企业用户不仅能够与公司知识保持联系,而且能够相互联系,从而推动日益复杂的数字化工作环境中的进步。”
让企业放心使用AI
思科最近的一项调查发现,超过四分之一的企业因隐私和数据安全风险而禁止使用 GenAI。在调查中,企业表示他们担心 GenAI 工具会泄露其知识产权或可能向公众或竞争对手泄露其他敏感信息。
对此,Glean 首席执行官 Arvind Jain 表示,“企业领导者已经看到了 ChatGPT 在消费者领域的强大力量,并渴望利用其潜力显著提高工作场所的生产力和绩效。但企业数据非常复杂,需要克服的障碍很多,包括通用大模型的假象和数据泄露的风险。如果部署不当,存在犯下代价高昂的错误的风险。它需要建立在正确的搜索基础上才能真正实现其价值。”
他补充道:“Glean 是唯一一家知道如何将企业知识与 LLM 的推理能力相结合,在工作中提供准确、安全的对话式 AI 体验的公司。”
那么,Glean是如何实现“准确”和“安全”的呢?
答案是帮助企业利用自己的数据来训练自己的生成式人工智能模型。
这个模型的基础是Glean花费四年时间研发的“可信知识模型”,这个模型不仅理解搜索内容,还理解上下文、人与人之间的关系、公司内部语言以及隐私和安全参数,因此能够满足符合企业需求的准确性、安全性和参考性能力。
可信知识模型围绕三大支柱构建:
“可信知识模型”围绕三大支柱 ||图片来源:Glean官网
1. 公司知识和背景:
Glean通过100多个连接器连接客户公司的所有应用程序,捕获数据源,然后将所有元数据编制索引,通过全面梳理和深入了解公司内部语言、内部关系、内容活动等,构建独特的企业“知识图谱”作为每个客户的“搜索索引”,从而保证搜索答案的个性化和相关性。
“知识图谱”不仅衡量了每条信息之间的直接联系,还衡量了无数其他信号和关系,比如能够识别细微的差别,这使搜索引擎的知识更加完备,也使生成式AI能够不断学习和改进,提高搜索的相关性。
2.权限和数据管理:
Glean 的数据安全措施符合行业最高标准,对客户个人信息的维护和保护符合欧盟通用数据保护条例 (GDPR)。
Glean 使用准确的数据访问权限和数据加密。例如,Glean 遵守公司数据源中设置的权限规则,并进行用户访问审查,以实施最小特权原则。这意味着无论是 Slack、Teams、Jira、ServiceNow 等,员工只能根据他们被授权访问的数据获得答案。
同时,Glean 通过对所有数据使用 AES 256 进行静态加密、对所有传输数据使用 TLS 1.2+ 加密来限制数据泄露的风险。当用户在底层应用程序中删除文档时,该文档也会从 Glean 系统中删除。
此外,Glean 还提供可扩展的基础设施和审计工具,以确保敏感数据按照预期使用。
3. 完整可引用:
Glean 可以展示每条消息的来源以及每条回复是如何产生的,用户可以清楚地知道每条消息的来源以及谁是该消息的负责人。
因此,当公司员工进行自然语言查询时,Glean 的 AI 助手会利用生成式机器学习模型来理解和分析这些查询,然后利用公司独有的 AI 搜索引擎和检索增强生成 (RAG) 技术来检索最相关、最新的信息。最后,这些信息数据被输入到大型语言模型 (LLM) 中,根据公司内部的“知识图谱”和员工访问权限提供“准确”且“安全”的搜索结果。
尽管Glean正在混合使用大型语言模型来输出搜索答案,其中包括OpenAI的GPT-4和谷歌的Transformer模型BERT,但Glean官方表示,“鉴于公司的生成式AI模型都是定制化的,因此公司的任何数据都不会用于训练这些公共模型并造福外部机构,事实上也根本不会保留。”
可以看出,Glean相当于一个既了解公司情况,又了解每个员工喜好的助理,搜索答案基于“可信知识模型”,让所有信息安全、私密、准确、可追溯。
Glean不仅准确、安全,而且部署和使用也非常方便。
Glean 提供 Glean Apps 和 Glean API,允许企业在任何需要的地方使用自然语言创建自定义 AI 应用程序,或者创建定制的 AI 助手、协作机器人、聊天机器人和代理,并将其集成到他们的工作流程中并在几天内启动并运行。
对此,Glean 创始人 Arvind 表示,“Glean 的初始设置时间不超过两个小时,无需任何工程技能或手动微调即可部署。无论是通过 Web 应用程序、新选项卡、侧边栏搜索、原生搜索还是 Slack 命令,Glean 都能提供无缝的工作流程集成。”
“我们认为,扩展人工智能生成的体验以促进信息访问和发现是释放企业环境全部潜力的第一步。Glean 处于该领域训练模型和微调 LLM 的前沿,为这一进步提供了动力。”
拥挤的企业 AI 竞赛
Glean 的创始人是云数据管理公司 Rubrik 的联合创始人 Arvind Jain,其灵感来源于 Jain 的观察:Rubrik 的员工经常难以找到工作所需的信息,而其他公司的员工也面临着同样的问题。
2019年,Jain 与谷歌、微软和 Meta 的前员工在硅谷中心帕洛阿尔托组建了一个小型创始团队,创建了面向企业客户的 AI 搜索应用程序 Glean。
随着生成式人工智能的发展,Glean 已成长并转型为行业领先的 GenAI 解决方案提供商,致力于“为人们提供改变世界所需的知识”。
事实上,企业搜索在市场上并不是一个完全创新的概念。Glean 的竞争对手有很多,主要包括一些提供类似服务的大公司和其他初创公司,例如 Microsoft SharePoint Syntex、Amazon Kendra、Google Cloud Search、Coveo、Elastic、Lucidworks 等。
然而,Glean首次成功打造了全面的解决方案,通过独特的AI模型和个性化服务,领先于这些竞争对手简化了部署和运营流程。
Glean的商业模式是纯粹的B2B模式,它为企业客户提供两种不同的计费方式。
一种是按席位收费模式,每个用户的费用不超过100美元。另一种是基于年度合同的定制化企业解决方案,此类合同的总金额一般在5万至10万美元之间。值得一提的是,对于选择后者的客户,Glean通常会给予一定的折扣,使得整体解决方案更具性价比,因此更受客户欢迎。
此外,Glean 还与 Google Cloud Platform(GCP)建立了合作关系,企业客户向 Glean 支付的费用中有一部分用来支付给 GCP,这个费用比较固定,不会因为用户数量的增加而发生很大变化,类似于一个基础费用,大概是每月 1000 美元到 2000 美元。
目前,Glean 拥有超过 70 个客户,从初创公司到财富 500 强企业,涵盖科技、媒体、教育和医疗等多个行业。
Glean自然而然地成为了资本的宠儿,投资方包括凯鹏华盈、红杉资本、光速资本、Latitude Capital等。截至目前,Glean已成功完成四轮融资,共募资8.5亿美元,估值高达22亿美元。
对于Glean的未来,Glean Technologies创始人Arvind Jain表示,“今天,AI的作用是帮助你获取你需要的信息。但很快,它的功能将更加强大,将转变为与你一起工作的AI。你会看到各种各样的聊天机器人和系统,我们将生活在一个人工智能为我们工作的世界。”
Glean 毫无疑问在短短五年内成功成为一家估值超 20 亿美元的公司。但必须说,在 2019 年,生成式 AI 还没有现在这么火爆。其实,不仅在硅谷,在世界各地,已经有非常强大的竞争对手,包括 OpenAI 这样既专注于消费者端又专注于 B 端的公司;也有微软这样的商业软件巨头,更别提他们身后还有一堆 AI 初创公司。
作为领导者,格林如何在企业市场中保持优势、扩大影响力是人们期待的问题。