我国人工智能+加速,上海财经大学推FinEval6.0并发布评测报告

admin

我国“人工智能+”战略步伐加快,金融行业大模型技术不断得到实际应用。为此,上海财经大学近期推出了国内首个针对金融领域大模型的专业可靠性评估标准——FinEval6.0,该标准在原有基础上增加了金融严谨性等多个评估维度,并同步发布了首份评测结果报告。FinEval6.0评测了国内外众多主流大型模型,结果显示,蚂蚁集团旗下的理财AI产品“蚂小财”在金融领域的严谨性等方面表现优异,位居首位,超越了众多通用型大模型。

上海通用发动机质量怎么样__电视机孤型通用底座

上海通用发动机质量怎么样__电视机孤型通用底座

金融领域大模型应用评测榜单,上财

_电视机孤型通用底座_上海通用发动机质量怎么样

公开信息表明,上海财经大学是我国率先投身于金融领域大模型评估研究的高校之一。该学府在2024年还参与了《金融大模型应用测评指南》的编制工作,该指南是全国首个以金融业务能力为基准的团体标准。在此轮工作中,上海财经大学依托对人工智能企业及金融机构的深入研究以及投资者视角的洞察,对FinEval6.0的严格评估样本进行了重点优化。该优化涵盖了金融学术知识掌握、金融行业深度理解、金融严谨性测试、金融安全意识以及金融智能体应用等多个核心领域,旨在对大模型在复杂金融业务环境下的表现进行全方位评估。

上海通用发动机质量怎么样_电视机孤型通用底座_

FinEval6.0对国内外九款具有代表性的大型模型进行了评估,这些模型涵盖了如DeepSeek-R1、GPT-4o等通用基础模型,以及专注于金融领域的模型。评估报告指出,这些模型在金融学术知识的掌握上普遍表现出色,然而,在应对金融领域的严谨性要求以及理解金融行业复杂场景的能力方面,各模型的表现却呈现出明显的差异。理财AI产品“蚂小财”的模型基础扎实,蚂蚁公司自主研发的Finix大模型整体表现优异,其得分全面超越了通用大模型。特别是在金融领域的严谨性方面,行业平均得分是70.27分,而“蚂小财”的得分高出平均值17分,显著占据了领先地位。

上海通用发动机质量怎么样__电视机孤型通用底座

电视机孤型通用底座__上海通用发动机质量怎么样

金融领域大模型应用严谨性评测排名,上财

官方公布的数据表明,“蚂小财”作为蚂蚁集团设立的人工智能理财助手,已与蚂蚁财富平台生态中的200余家家基金企业、证券公司以及财经新闻媒体建立了内容和服务链接。在通用大型模型的基础上,该技术团队成功构建了一套金融智能优化的技术架构,全面提升了金融应用场景中的专业功能和用户交互体验。

电视机孤型通用底座__上海通用发动机质量怎么样

金融领域是国内人工智能技术应用的集中区域之一,它对AI的专业性和严谨性等方面提出了更为严格的要求。目前,我国在金融领域的AI应用正逐步改善,正从“博学多才”向“专业审慎”转变,为下一阶段的大规模应用奠定了坚实的基础。张立文教授,作为测评团队的负责人和上海财经大学的教师,强调指出,对于“AI+金融场景”的这种积极而稳妥的探索,不仅有助于我国在国际AI产业竞争中占据优势地位,同时还将开启我国数字金融和普惠金融建设的新篇章。