DeepSeek助力包头稀土研究院研发项目,闫宏伟分享人工智能应用成果

admin

中新网于 2 月 23 日在包头发布消息。题目为:人大代表闫宏伟称,当稀土遭遇 DeepSeek。

记者 李爱平

打开笔记本电脑,然后倒上一杯热水,在内蒙古自治区包头稀土研究院,闫宏伟的一天由此开始。

人大代表闫宏伟:当稀土遇到DeepSeek_人大代表闫宏伟:当稀土遇到DeepSeek_

蛇年春节过后,在日常工作里他多了一个“朋友”。这个“朋友”是 DeepSeek(深度求索)。在过去的 20 多天里,他把 DeepSeek 运用到了“稀土通用语料库及其系统的设计和研发”(简称稀土语料库)项目中,并且很有成就感。

人大代表闫宏伟:当稀土遇到DeepSeek__人大代表闫宏伟:当稀土遇到DeepSeek

图为闫宏伟在工作中。 中新网记者 李爱平 摄

_人大代表闫宏伟:当稀土遇到DeepSeek_人大代表闫宏伟:当稀土遇到DeepSeek

在研究过程中,当遇到不懂的地方时,向 DeepSeek 请教,很快便能得到启发。闫宏伟近日在接受中新网记者专访时说道,DeepSeek 对研发项目起到了助力作用,堪称他的“左膀右臂”。

闫宏伟是全国人大代表,他在 2024 年全国两会结束之后开始拥抱人工智能。在那个时候,他深深感受到,在稀土领域融入人工智能,已经成为未来的必然趋势。

那时 DeepSeek 尚未出现,所以我只能通过购买各种专著的方式,逐步开始学习。在闫宏伟的办公室里,他学习过的《线性代数》这本书以及《数据有道》等书籍上,都留下了他标记的痕迹,有勾勾画画等。

_人大代表闫宏伟:当稀土遇到DeepSeek_人大代表闫宏伟:当稀土遇到DeepSeek

学习一段时间后,闫宏伟开始主动参与到人工智能领域中。他最先将 GPT 投入使用。使用 GPT 的第一感受是,这款人工智能模型不但可以解答疑问、解决困惑,还能够节省研发的时间,不过也存在一些不足之处。

人大代表闫宏伟:当稀土遇到DeepSeek_人大代表闫宏伟:当稀土遇到DeepSeek_

图为闫宏伟在四川参加学术会议。(资料图,受访者供图)

人大代表闫宏伟:当稀土遇到DeepSeek__人大代表闫宏伟:当稀土遇到DeepSeek

闫宏伟觉得,借助人工智能来构建稀土语料库这个项目,能够把包头稀土研究院在该项目上的空白给填补上。“在稀土行业当中运用各类大语言模型、人工智能模型以及机器学习模型去进行训练,这是不能拖延的事情。”

现在 DeepSeek-R1 的中文理解能力有了很大提升,它的推理能力更是在全球处于领先地位。闫宏伟觉得,一定要重新认识 DeepSeek,并且找出更优的解决办法。

他开始尝试引入 DeepSeek-R1 来充当助手,以解决缺乏资源和人手的难题。他努力要在 6 月份之前完成稀土语料库的研发工作。

这个项目研发成功了。这意味着一个标准稀土语料库已经宣告建设完成。闫宏伟认为,这是自己在人工智能领域这个“小白”努力到现在所做的最正确的事情。

_人大代表闫宏伟:当稀土遇到DeepSeek_人大代表闫宏伟:当稀土遇到DeepSeek

稀土遇到 DeepSeek,在闫宏伟手中能碰撞出怎样的火花呢?他觉得,开发稀土语料库,首要目的是训练和微调自己的机器学习模型与大语言模型。这个应用场景较为直观,不过需要专注于细节。通过持续增加语料库,能够为行业参与者提供持续的人工智能基础支持。

当下,闫宏伟在研发稀土语料库。在此过程中,他还开发了稀土语料库管理系统。

实际上这是一个语料库生产系统。利用这个系统,能够持续地把行业和组织的私有文献加工成便于训练和微调的数据集。同时,也把原始资料和语料库当作某种广义标记数据集。闫宏伟认为,此举对探索跨文本(含音视频等)资料语料化的技术路线以及实现有着重要意义,并且对他所从事的稀土行业也有着重大意义。