欧洲 OpenAI Mistral AI 成立一年估值 60 亿美元,联合创始人详谈发展策略

admin

被称为“欧洲OpenAI”的Mistral AI,成立仅一年,估值就已达60亿美元。

Mistral AI 自成立以来就在开源领域频频发力,前不久更是发布了新一代旗舰机型 Mistral Large 2,以不到三分之一的参数实现了媲美 Llama 3.1 405B 的性能。

近日,Mistral AI联合创始人兼首席执行官Arthur Mensch在接受《时代》杂志专访时详细讨论了Mistral AI如何吸引稀缺的人工智能(AI)人才、如何实现盈利以及欧洲缺乏AI生态系统等问题。

核心思想如下:

Academic Headlines在不改变原文主旨的情况下做了简单翻译,内容如下:

过去一年,总部位于巴黎的 Mistral AI 迅速崛起为欧洲最具影响力的人工智能公司之一。这家初创公司发布了六种语言模型,可以回答问题、生成代码并执行基本推理。

6 月份,Mistral AI 宣布已在一轮融资中筹集了 6.45 亿美元,估值超过 60 亿美元。2 月份,他们与微软达成协议,将他们的模型提供给微软的客户提供,以换取微软的计算资源。

Mistral AI 联合创始人兼首席执行官 Arthur Mensch 在具有里程碑意义的《AI 法案》辩论中辩称,立法者不应监管 Mistral 等基础模型,而应专注于监管其他人如何使用它们。他还反对限制 AI 开发人员分享其创作的自由。“我认为开源模式没有任何风险。我只看到好处,”他说。

《时代》杂志与门施谈论了如何吸引稀缺的人工智能人才、Mistral AI 如何实现盈利以及欧洲缺乏人工智能生态系统等问题。

问:几个月前,你们的首席商务官 Florian Bressand 告诉 CNBC,Llama 研发团队中有一半以上的人现在在 Mistral 工作。你们是如何从 Meta 吸引到这么多优秀研究人员的?

最初,我们招募了自己的朋友。我们之所以能够这样做,是因为我们为该领域做出了一些有意义的贡献,所以人们知道与我们合作很有趣。然后,从 12 月开始,我们开始聘请我们不太熟悉的人。这归功于我们遵循的策略,即推动该领域朝着更加开放的方向发展。这也是许多科学家的使命,他们出于与我们类似的原因,更喜欢自由交流和信息流动的旧方式。

问:世界上能训练出像 Mistral 这样的人工智能系统的人非常少。我知道法国的人工智能产业非常发达,但你认为你们已经成功招募了相当数量(甚至全部)了解人工智能的人吗?

不是所有人。我们有很多业内朋友,他们曾在 Google、OpenAI 工作,还有少数人留在 Meta。但可以肯定的是,我们吸引了 15 名知道如何训练这些模型的人。很难估计人才库的规模,但我认为当时知道如何处理这些事情的人大概占 10%。

问:Mistral AI 一直在筹集资金。你把这些钱用在了什么地方?

我们主要把钱花在计算上,这个行业的结构和软件行业不同,因为你一开始需要投入很多钱来建立科研团队,建立前沿的模型。

问:几乎所有其他基础模型公司的高管都谈到了他们预计未来几年将在计算领域投入 1000 亿美元。您是否也有类似的预期?

在过去的 12 个月里,我们花费了大约 2500 万欧元才达到今天的水平——我们在全球都有业务,我们的模型在性能和效率方面处于领先地位。我们的论点是,我们可以更有效地利用资本,我们正在开发的技术实际上是资本密集型的​​,但有了好的想法,我们可以比竞争对手用更少的开支做到这一点。我们在 2023-2024 年已经证明了这一点,我们预计在 2024-2025 年将继续这样做。显然,我们会花更多钱。但我们的支出仍将只是竞争对手支出的一小部分。

问:你们目前盈利吗?

还没有。我们的投资很大,对于一个成立 12 个月的创业公司来说,盈利并不是预期的事情。

问:你们的盈利计划是什么?你们的商业模式是什么?

我们的商业模式是构建前沿的模型,并让开发者可以使用。我们正在构建一个开发者平台,让开发者可以定制 AI 模型,开发差异化的 AI 应用——他们可以把技术部署在他们想要部署的地方,因此可以不使用公有云服务,这让他们可以定制模型,而不是像现在这样使用封闭不透明 API 后面的通用模型。最后,我们也非常注重模型的效率,因此我们可以实现一定的推理能力,让模型尽可能的快速和便宜。

这就是我们要构建的:一个我们自己托管的开发者平台,然后通过 API 和托管服务提供给我们的客户。但我们也会为想要完全控制技术的客户部署该平台,这样我们就可以让他们访问软件并完全控制其应用程序中使用的数据。

问:您的计划是让您和您的客户以更低的成本制造出几乎与竞争对手一样优秀的人工智能模型,并让它们更广泛地为公众所用,这样说是否公平?或者说,您想在绝对能力方面与竞争对手最先进的模型或“前沿模型”相媲美?

我们计划继续追赶,最终与其他公司一样具有竞争力。但实际上,我们的商业模式与其他公司不同。我们更喜欢共享、定制和部署我们的技术。我们不再能控制这些方面。

问:你们最近将最强大的模型以 API 的形式提供,而一开始你们的所有模型都是向公众开放的。为什么要做出这一改变?

这一点我们一直没有改变。我们一直希望在开源领域拥有领先模式,但同时也希望拥有一些只能通过货币化服务才能获得的高级功能。

我们提供的服务很大一部分都是开源的,这使得开发人员能够利用我们的技术构建他们需要的任何东西。最终,当你想将他们构建的工作负载转移到生产中,或者你想让它们变得更好、更高效、更好地管理、更便宜地维护时,这些开发人员就会来使用我们的平台,并使用我们底层的优化模型来提高推理能力的性能和速度。

我们会继续这样做。开源对我们来说非常重要。我们正在在此基础上构建一个开发者平台,这显然会实现盈利,因为我们确实需要一个可行的商业模式。但我们希望为使用我们开源模式的开发者带来额外的价值。

问:您经常说欧洲不能依赖美国的人工智能公司,需要自主研发的尖端模式。Mistral AI 是欧洲最知名的人工智能公司之一,但它与微软建立了合作伙伴关系,以获得所需的计算能力。Mistral AI 在这方面对微软的依赖是否限制了其作为尖端自主人工智能参与者的能力?

我们有四家云提供商。我们在设计上是独立于云的,这是我们从第一天起就制定的策略。我们的模型可通过 Microsoft Azure 获得,也可通过 Amazon Web Services 和 Google Cloud Platform 获得。我们将这三家都用作云提供商。我们还使用不同的云提供商(尤其是 CoreWeave)进行训练。我们构建了自己的技术堆栈和分销渠道,以创造我们认为客户需要的独立性。

问:除了在欧洲建立人工智能实验室之外,欧洲是否还应该尝试建立自己的主权计算基础设施?

我认为这对生态系统有好处。但欧洲并不是一个独立的参与者,不会凭空做出任何决定。如何确保欧洲能够有效地提供一些计算基础设施是一个生态系统问题。

这对我们的客户来说非常重要,因为他们中的一些人是欧洲客户,他们确实希望对他们使用的云基础设施拥有某种形式的主权。在这方面,我们的模型、推理和平台的部分可访问性实际上已经在欧洲部署。但还可以有一些改进。这不是由欧洲决定的。这是一个生态系统,需要认识到有些需求是可以解决的。我们希望在不久的将来有一些欧洲云计算合作伙伴。

问:法国前数字事务部长、你们联合创始人之一塞德里克·奥警告称,《AI法案》可能会“杀死”米斯特拉尔人工智能。该法案已经通过,但通用人工智能模型的行为准则尚未制定。它们应该是什么样的?

总体来说,AI法案是非常可行的,因为我们受到的约束都是我们已经满足的约束。我们已经记录了我们如何使用模型,如何评估模型,这已经成为前沿模型的要求。所以这样做是可以的。

我们仍需就训练数据集的透明度进行一些讨论,这是我们非常希望实现的目标,但需要权衡商业机密。我们的许多知识产权也体现在我们处理数据和选择数据的方式上。这也是他人的知识产权。作为一家小公司,我们对我们的知识产权非常谨慎,因为这是我们唯一拥有的东西。因此从这个角度来看,我们有信心找到一种各方都能接受的方法。

我们被要求参与并为技术规范的制定提供意见。我们也希望欧洲能够做出独立的选择,以促进生态系统的发展并让每个人都满意。

问:您的竞争对手的高管们经常谈论人工智能将如何在未来五年或十年内改变世界,他们担心什么,以及更强大的人工智能系统的发展可能带来哪些变化。您对人工智能将如何改变世界有什么预测吗?

我们建立了强大的技术,但我认为人们倾向于认为这项强大的技术可以解决所有问题。在 Mistral AI,我们非常专注于确保我们的技术能够提高生产力,为某些垂直行业、某些领域带来推理能力,从而产生社会效益。

人类创造的一切都是一种工具,我们带来的新工具带来了新的抽象能力。所以从某种意义上说,你可以把它看作是一种更抽象的编程语言。50 年来,我们一直在用计算机能理解的语言进行编程。现在,我们只需用英语、法语或任何语言与系统对话,就可以创建系统。这为工人和开发人员带来了一种新的抽象方式,这显然会改变我们未来 10 年的工作方式。

我认为,如果我们做得正确,并确保每个人都拥有这个工具,这就是我们创建 Mistral 的真正原因,我们就能确保它改善世界各地所有人的生活,无论他们来自哪个社会经济阶层。对我们来说,要做到这一点,首先要从医疗保健、教育等领域的差异化应用开始。

确保人们接受培训并能够接触技术也非常重要,让技术可供人们使用——以比以往更开放的方式提供技术,这是加速技术发展的一种方式。这还不够,政治决策者还必须制定支持计划,以加速尚未实现互联网接入的地区。但我认为,我们正在开发的新工具——生成式人工智能——在帮助人们使用这一新工具方面发挥着积极作用。

问:您能否想象未来的一种场景:您开发了一个人工智能模型,或者正在开发一个模型,并且您注意到了它的某些功能,您决定最好不要开源该模型,而是将其保留在 API 后面,甚至不要将其部署在 API 后面?

在可预见的未来,我们不会陷入这种情况。我们建立的模型具有预测能力。我们发现,集体管理软件及其使用方式的唯一方法是开源。这对于网络安全来说是正确的。对于操作系统来说也是如此。因此,当今最安全的技术是开源技术。

从某种意义上说,人工智能并没有改变软件的任何东西。它只是一种更抽象的软件定义方式。所以我认为开源模式没有任何风险。我只看到好处。它是一种中立的工具,可以用来做任何事情。我们禁止 C 语言并不是因为你可以用 C 语言制作恶意软件。我们发布的模型也没有什么不同。因此,控制投放市场的应用程序的质量仍然非常重要。但用于构建这些应用程序的技术并不是唯一可以监管的东西。

原文链接: