近日,上海人工智能实验室发布了大规模推理模型InternThinker(学者思考者)。公众在电脑上登录“学者·璞语”大语言模型,点击界面左侧的InternThinker链接后,就能体验到这个对标OpenAI o1的呼延推理模型的实力。奥数题、编程竞赛题、填字游戏……各种“烧脑”题都能被它解答。凭借对复杂问题的强大推理能力,大型模型可以成为人类在自然科学、工程技术、社会科学等专业领域研究的有力助手,为科研人员提供解决问题的思路。
即将过去的2024年,上海在人工智能大模型、人形机器人、脑机接口等新兴科技领域成果频现。除了萨姆·奥尔特曼创立的OpenAI之外,上海科研团队还基于特斯拉和埃隆·马斯克创立的Neural Connectivity打造了多种人形机器人和脑机接口产品,有望催生未来产业。 “核爆炸点”。
在有限算力下实现技术创新
经历了“百模之战”,国内基础大尺度模型的第一梯队已基本形成:文心一言、豆宝、Kimi……上海熙宇科技有限公司研发的MiniMax位列其中,成为为数不多的处于创业成长期的公司之一。企业打造的基础大型模型之一,目前全球每天交互量高达30亿次左右。
GPU算力有限,国产大型模型如何生成高质量的文本、图片、视频、音乐、语音?西域科技创始人严俊杰博士表示,他们在大型模型上做了很多技术创新。 MoE(混合专家模型)是其中的创新之一。它将各种任务按照“专业特长”的概念进行分类,然后分配给多个“专家”模块来解决。 MoE对应的概念是密集模型,使用这种架构的就是“通才”模型。与“多面手”相比,一群“专家”可以更高效、更专业地完成复杂的任务,也可以在不显着增加算力成本的情况下,将模型容量显着提升到万亿参数级别。
“线性注意力”机制也是熙宇科技研发的一项技术创新。通过算法优化,将传统模型架构中输入长度与计算复杂度的平方增长关系转变为线性关系,向“实现无限长输入输出”迈出了关键一步。
MiniMax 大模型生成的视频。
大样板企业的成长离不开创新生态和风险投资。今年10月,上海“生成式人工智能创新生态试验区”在摩苏空间揭牌。上海国投与西域科技、步星科技、无文芯穹等10家企业共同展开战略合作。目前,位于徐汇滨江的摩梭空间已吸引近百家初创企业入驻,其中部分初创企业已崭露头角并完成多轮融资。
无文新琼是一家进入模型速度领域的公司。由清华大学电子工程系科研团队创立,提供大模型训练的计算解决方案。今年,该公司发布了业界首个千卡级异构芯片混合训练平台,算力利用率高达97.6%。 “感谢上海为培育大模型生态系统、在徐汇西岸打造集算力支持、政策激励、优质服务于一体的创新平台所做的持续努力。”无文核穹CEO夏立学表示,“与上海国投合作后,公司将加速发展,为更多大型示范企业提供算力服务。”
人形机器人榨汁、搬运重物
在与大车型密切相关的体现智能领域,上海今年也取得了不少成果。实体智能的主流载体是人形机器人。在今年10月特斯拉的发布会上,“擎天柱”机器人展示了跳舞、倒饮料、与人交流、猜拳等技能。相关视频在网络上广为流传。传播。
上海企业研发的人形机器人也掌握了很多技能。今年8月,拥有259万B站粉丝的志辉君(真名:彭志辉)在B站平台发布了他和致远公司团队开发的三款“远征”系列人形机器人。发布会上,“远征A2-W”展示了操作榨汁机的技能。它利用类似人手的灵巧双手,将各种水果放入机器中,按下按钮将其制成果汁,然后一手握住榨汁机,另一只手握住玻璃杯,将果汁倒入杯中,然后采摘端起杯子走到彭智慧身边,递给它的主人。
人形机器人 Expedition A2-W 将果汁倒入杯子中。
“远征A2-Max”身材魁梧,双臂负重超过40公斤,身高1.75米。发布会上,它拎起一个箱子继续前行,完成了运输任务。彭智慧介绍,这款人形机器人可以在工厂内搬运40公斤的飞行箱,并可以帮助工人进行体力劳动。
今年9月,上海傅立叶智能科技有限公司还发布了第二代人形机器人GR-2。它高1.75米,重63公斤。全身共有53个自由度,单臂运动负荷为3公斤。与第一代人形机器人GR-1相比,GR-2的电池容量大幅增加,续航时间延长至2小时,并在支持直充的基础上,推出了可拆卸电池更换方案。额外。
未来,我们可以远程控制人形机器人,让它们在一些污染和危险的环境中工作。 GR-2已经具备远程操作功能。佩戴苹果的Vision Pro头戴式显示设备,人们可以用手抓取面前的虚拟图像,机器人也会做同样的事情来抓取面前的真实物体。
一名记者戴上 Vision Pro 遥控机器人来抓取物体。
上海首例脑机接口手术顺利完成
马斯克创立的神经连接公司,点燃了另一条前沿技术赛道——脑机接口。近日,这家美国公司宣布一项新的可行性研究已获得政府批准,将利用该公司开发的N1植入物让四肢瘫痪患者通过脑机接口控制机械臂。
上个月,上海首例半侵入脑机接口产品植入手术在华山医院完成。接受手术的瘫痪患者恢复良好,术后第三天就可以下床使用轮椅。布莱顿医疗科技(上海)有限公司首席科学家、清华大学教授洪波介绍,这款名为NEO的脑机接口产品与马斯克团队研发的侵入式设备不同。它不直接接触神经元细胞,而是将它们植入。它渗透到患者颅骨和大脑皮层之间的脑膜,因此不存在损伤神经细胞的风险。
而且,华山医院的微创手术仅用时1小时40分钟。利用自主研发的“在线时空脑功能定位系统”,医疗团队在手术过程中无需唤醒患者即可快速准确定位手感觉和运动脑区域,显着减少类似手术的时间和风险。
脑机接口产品NEO植入大脑的示意图。
据市科委介绍,NEO的研发和型式检验在上海完成。今年8月,成为我国首个进入创新医疗器械特别审查流程的脑机接口产品。近年来,上海积极推动脑机接口前沿技术创新,培育了脑虎科技、布莱顿、步步医疗等创新型企业,分别开发了侵入式和半侵入式领域的产品。
明年,上海将继续聚焦侵入式、半侵入式领域,推动脑机接口商业化,搭建共性技术研发服务平台,推进临床试验和应用示范,完善产品标准和检测体系,培育产业生态;同时,支持非侵入式脑机接口产品提高技术水平和应用规模。呼研的脑机接口产品有望在国内率先实现临床应用,改善瘫痪、失语、神经系统疾病等疾病患者的生活质量,并逐步形成这一未来产业的创新生态系统。
专栏主编:黄海华