肖仰华丨数据决定大模型的真正落地价值

日前，由爱数与昆仑技术联合举办的金融行业数据智能论坛成功举办。会上，复旦大学教授、博导、上海市数据科学重点实验室主任肖仰华教授就《大模型赋能金融高质量发展》进行了深刻洞察和详细分享。他表示，大模型本质上是数据工程，数据决定了大模型的真正价值，在严谨的金融领域中，大模型的落地需要聚焦提升大模型在专业领域的适应性和精确度，系统性增强行业知识，缓解“幻觉”问题，提升应用效果。

AGI 是智能本身的革命，是技术元革命

新技术的加速发展，为世界带来了快速的变化。不断增加的系统复杂性，为金融系统增加了巨大的不确定性，并带来了系统失控的风险。强大的认知能力是应对这些挑战的关键，而人类有限的认知能力难以满足日益复杂、不确定、变化增速的世界，发展具备认知能力的机器已成为必然趋势。强大的算力和高质量的数据是机器认知能力增长的关键，在两者的加持下，通用大模型已成为了先进生产力的代表，尤其是在文本处理、图文设计、甚至代码编写等方面，使许多规范化的重复性任务，可以通过自动化方式高效完成，全面提升生产力。

通识是领域认知的前提

通用人工智能的发展，为金融业务创新注入了新动力。过去，金融智能化着重于特定任务的解决方案，而通识能力的缺乏却使专业的认知能力无法发挥出来。通用大模型的出现填补了这一空白，能够基于海量参数化的知识容器，通过激发与引导，获得更深入和全面的分析与决策。

传统的金融智能化依赖于定制模型，无法处理开放表达的问题，且成本高昂。随着技术的发展，大模型日益成为自治智能体大脑，具备复杂环境的自适应能力，能够分析多样化的表达方式，并通过“举一反三”的方式对新任务快速学习和适应，有效降低了解决问题的门槛和成本。此外，大模型在评估、规划和执行复杂任务方面具备巨大潜力，特别在处理跨专业、跨领域的综合性问题时，其整体认知水平的提升使得以往难以逾越的知识壁垒得以打破。可以说，大模型将成为人类认知能力的引擎。

大模型加速金融场景数智化转型

金融服务的智能化正在经历从传统小模型、知识图谱驱动，向大模型驱动的引擎升级。大模型的重大机遇之一是场景智能化，特别是具有标准化、规范化的场景，如“窗口型”岗位等，是大模型落地试点的重要方向。同时，大模型具备的通识能力、任务分解与规划能力，可有效协调传统 IT 系统，构建统一的智能门户，不仅将优化用户体验，也将为企业带来更高效的运营模式。

同时，随着数据量的爆炸性增长，传统的依靠人力进行数据治理和分析的方法已经显得捉襟见肘，未来将由机器和人工智能技术来进行数据的管理与盘活，从而提高效率和准确性。此外，自然语言交互的兴起将使得专业领域的工作不再受限于特定的专业编程语言，普通人也能通过自然语言来访问和操作数据，这对各行各业都将产生深远影响。

未来，大模型的行业智能化，包括金融智能化的研究路径已非常清晰。目前，我们已走完了通识教育阶段，如通用大模型的到来，基本宣告了机器在通识能力达到了一定的水平，而下一步则需要通过领域知识的打磨来增强专业性，更好地在行业领域落地。

金融大模型落地：聚焦提升大模型在专业领域的适应性和精确度

行业大模型未来发展的本质是是再现一个行业专家的认知能力和水平。金融行业的本质是一种严肃、复杂的认知决策任务，需要丰富的专业知识、综合任务的拆解能力、并在有限的资源下作出平衡。这正是现在通用大模型所不具备的，并存在诸多问题，尤其突出的是大模型的“幻觉”现象，即“一本正经地胡说八道”。而在严谨的金融领域中，这些虚假的、误导性的陈述，将会造成严重的后果。其次，通用大模型无法理解企业的私域数据，尤其是专业性表达，比如资产负债等。此外，大模型的不可控性和知识编辑的困难也是其发展过程中亟需解决的问题。

未来，金融业需要聚焦于提升大模型在专业领域的适应性和精确度，同时探索如何有效利用私域数据以实现真正的价值创造。

金融行业大模型落地之道：增强大模型行业领域知识

随着大模型成本的大幅降低，其正逐渐被视为一种基础设施，预计将成为行业发展的关键驱动力。大模型是行业智能的引擎，与现有企业流程的无缝融合、领域知识的注入、与员工及专家有效协同，是大模型落地的解决之道。

大模型本质上是数据工程，数据决定了大模型的真正价值。系统性增强的大模型行业知识，可以缓解“幻觉”问题，提升事实、逻辑正确性，提升其在严肃场景的应用效果。

此外，通过增强大模型的能力、评测，以及利用大模型和小模型的互补优势进行结合使用等，都将促进金融机构解决复杂问题和创造新价值。

《大数据》期刊	华东师范大学数据科学与工程研究院	中国科学院虚拟经济与数据科学研究中心	上海世纪出版股份有限公司科学技术出版社
CCF大数据专家委员会	中关村大数据产业与创新联盟	农业大学数据产业技术创新战略联盟	上海市科学技术委员会