DeepSeek扫荡的AI风暴尚未停止。
外国媒体报道说,美国国会议员提出了一项新法案,旨在禁止在美国使用中国人工智能技术。这包括将DeepSeek作为刑事犯罪,最高判处20年徒刑。
同时,据美国德克萨斯州美联社报道,美国已发布了一份文件,禁止使用DeepSeek和Red Red Book关于政府设备。
就像DeepSeek被美国政策所阻止一样,其旧的竞争对手Openai也在如火如荼地举行了重要的现场直播活动。
软银首席执行官Masayoshi儿子投资了数万美元之后,Openai还选择了今天偿还她,并正式宣布了一项名为Deep Research在东京的直播活动中的Deep Research。
顾名思义,与普通的AI搜索功能不同,深入的研究具有更多的野心。
它被称为下一代智能代理,可以独立完成任务。
您只需要输入您的问题,它可以找到,分析和整合数百个在线资源,以生成与研究分析师水平相当的全面报告。
更重要的是,此功能的基础模型是由尚未发布的OpenAI O3模型的特定版本驱动的,该模型已针对Web浏览和数据分析进行了优化,并且可以使用推理功能来搜索,解释和分析大规模文本,图片和PDF文件。
这也是为“在金融,科学,政策和工程领域进行广泛工作的专业人员”设计的,这通常需要“彻底,准确和可靠的研究”。
此外,此功能可以用作购物应用程序,当您选择购买汽车,设备或家具时,可以使用它仔细研究产品信息可能会有所帮助。
Openai首席执行官Sam Altman发布:
“今天,我们正式启动了深入的研究 - 我们的下一代智能代理。这就像一个超级大国,可让您随时召唤专家!
它可以在线搜索,进行复杂的研究和推理,并为您生成报告。结果非常好,可以完成最初花费数小时甚至几天的任务,而且花费了数百美元。 “
目前,深度研究功能可供200美元的Chatgpt Pro的用户使用,每月最多100个使用时间。
接下来,Plus和Team用户还将获得该功能,其次是Enterprise Edition。
Openai表示,Plus版本预计将在一个月内启动,付费用户的查询数将很快“大大增加”。
但是,该功能目前仅在Web版本上支持,并且预计将在本月晚些时候启动移动设备和桌面应用程序的集成。
使用此功能,用户只需要在Chatgpt接口中的消息输入框中选择“深度研究”模式,然后输入他们需要查询的问题。
此外,您可以附加文件或电子表格来补充您的问题。任务开始后,侧边栏输出将伴随“完整文档,清晰的引用源以及思维过程的摘要”。
该行业具有专业,GPT-4O也支持搜索功能,但是对于涉及多个方面的专业研究,需要深度和细节,深入研究可以进行广泛的探索并为每个结论提供来源支持。
在响应速度方面,此功能的执行可能需要5到30分钟,并且用户将在完成后收到通知。
此功能的输出内容仅限于文本。但是,OpenAI计划快速添加嵌入式图像,数据可视化和其他分析输出。同时,该公司还计划扩展其数据源,包括“订阅”信息服务和内部企业资源,并有望逐步提供TOB服务。
据报道,深入的研究重点是通过端到端的强化学习培训培训复杂的网络浏览和推理任务,涵盖了多个领域。
通过此培训,它将学习计划和执行多步搜索路径以找到所需的数据,并可以在必要时进行调整,从而实时响应新信息。
Openai说,他们使用了名为“人类的最后考试”的评论来测试该功能。
该测试涵盖了100多个学科,并包含3,000多个专家级问题,其中包括多个学术领域,包括语言学,航空工程,古典科学和生态学。
与OpenAI O1相比,深入的研究取得了化学,人文,社会科学和数学领域的最大改善。
深入研究使用的模型在专家级问题上达到了26.6%的准确性,这是创纪录的。相比之下,Google的双子座思维仅达到6.2%的精度,Grok-2为3.8%,GPT-4O仅为3.3%。
DeepSeek-R1的准确率仅为9.4%,远低于深层研究。
在这个公共基准的盖亚(Gaia)中,深入研究使用的模型达到了最新的行业领先水平(SOTA)。
Gaia评估涵盖了不同的难度水平的三个现实问题。成功完成这些任务需要推理,多模式理解,Web浏览和工具使用功能。
深度研究(CONS@64)方法在所有级别上都优于先前的SOTA和深入研究(通过@1),尤其是在第3级的最大进步,最终平均得分为72.57。
该结果表明,更先进的深度研究方法(CONS@64)可以显着提高各个级别的性能,尤其是在更具挑战性的3级。
但是,依靠深入研究以完全避免AI幻觉并不容易,并且在报告和报价格式中也可能出错。
即使对引用链接进行参考验证,建议您在使用过程中仔细检查AI提供的信息,而不仅仅是直接复制和粘贴。
值得一提的是,在北京大学计算机科学与技术系中研究了负责此AI功能的人之一Zhiqing Sun。
自2019年以来,Zhiqing Sun在美国卡内基·梅隆大学(CMU)的语言技术研究所学习了博士学位,自2024年以来一直是OpenAI的研究员。
Zhiqing Sun也有很多实习经验。他曾在诸如Google Brain,Microsoft Research Institute和Mit-IBM Watson AI实验室等著名的AI公司实习。
关于此功能,Openai正式表示,今天的发布仅仅是开始。将来,它也可以连接到自定义的数据环境,甚至可以连接到企业级的大规模数据存储系统。
人工智能代理商可以用更大的自主权花费更长的思维和解决极其复杂的任务。
“深入研究的发射标志着我们更大的目标迈出的重要一步 - 通用人工智能(AGI)的发展,可以进行原始的科学研究。这一直是我们的长期愿景。”