摘要
大模型为工业智能化带来了重大机遇,有望解决长期困扰工业领域的复杂性和不确定性问题。
然而,大模型在认知能力方面,尚未完全具备专家级的复杂决策能力。在数据方面,大模型对专业性强、结构复杂的工业数据理解不足,且数据要素市场不健全、隐私保护要求等因素限制了高价值工业数据的使用。
未来,大模型在工业领域的应用需要在提升认知能力、完善数据生态、确保安全合规等方面持续努力。同时,应注重人机协作,充分发挥大模型与人类专家各自的优势,共同推动工业智能化发展。
工业系统是典型的复杂系统。现代工业系统在规模和复杂度方面远超以往,已经成为复杂巨系统,造成人类认知与理解的困难。与此同时,全球正经历前所未有的技术变革,变化成为常态。市场变化、环境变化、需求变更、用户变更虽然为企业与社会发展带来全新机遇,但也带来巨大挑战。变化与变更往往引起旧系统的错配与故障,系统的复杂性和不确定性带来失控风险。提升对于系统失控风险的管控能力是当前社会发展的主要问题之一。然而,人类智能的发展是相对缓慢的。人类有限的认知能力难以认知日益复杂、快速变化、不确定性加剧的工业系统,这构成了工业发展所面临的根本矛盾之一。
发展人机协作的认知模式,是应对系统失控的新思路。与人类认知能力不同,人工智能的认知水平是随着数据和算力的增长而增长的。自2022年底,ChatGPT诞生以来,生成式人工智能快速发展。随着训练算力和数据的增长,大模型的能力仍在持续增长。一旦人工智能(AI)达到人类认知水平,具备认知工业系统的能力,这种能力是可能随着算力和数据增长而持续提升的,是可以伴随着工业系统的日益发展而持续进化的。发展工业认知,是应对工业系统巨大的复杂性和不确定性的重要思路之一。
一、工业认知的困境
(一)数据获取与治理困难
工业互联网缺少大规模高质量工业数据。首先,工业数据呈现出高度的复杂性。工业数据来源多样,包括工业设备、制造执行系统(MES)/企业资源计划(ERP)系统、计量仪表/传感器、数字孪生体、各类文档数据、行业标准等。工业数据类型复杂多样,包括非结构化、半结构化数据,可以表达为数值、文本、图像、语音、序列等不同模态。工业数据库系统异构多元,可以存储于传统事务型数据库、数据仓库、文档型数据库、图数据库、分布式文件系统等。其次,工业数据治理代价高昂。工业大数据多为生产、经营、加工与管理结果数据,缺乏过程性信息、背景知识、机理机制。工业数据治理也极为困难,人工代价高。训练各类模型需要工业数据标注,往往只有人类专家才能胜任,导致高质量标注数据稀缺。
(二)知识表示与获取困难
首先,隐性知识表示与获取困难。隐性知识来源于专家的长期实践积累与个人感悟,难以通过语言进行明确表述。其次,工业知识体系庞杂。工业知识涉及专家经验、基本事实、领域知识,还包括行业规范、标准和制度。复杂的工业体系往往涉及物理、化学、流程、工艺等多个学科的专业知识。另外,工业知识受众面窄。工业知识具有高度的专业性,通常由少数专家所掌握,工业知识体系的梳理工作也只有极少数领域专家才能胜任。
(三)智能应用与服务困难
首先,工业应用场景多样且复杂。工业应用涵盖了产品生命周期的各个阶段,涉及生产、组装、诊断、测试和运维等多个阶段。每个环境与场景有着不同的应用需求,比如运维阶段对故障的精准定位与方案推荐有着强烈需求,智能化服务与应用需充分考虑场景的特殊性和需求的多样性。总体而言,工业领域应用场景十分细碎,研发通用、普适的智能化及解决方案极具挑战。其次,工业场景对知识的应用方式复杂。大型设备故障分析涉及因素众多,需要经过长程推理才能找到根因。在消费互联网上,成熟应用的搜索和推荐方法难以满足工业需求。工业复杂性往往需要智能系统实现复杂问答、可解释性决策支持以及探索式交互,其知识应用的密度、深度和复杂性都是互联网应用难以比拟的。
二、大模型:工业智能化的新机遇
(一)大模型的意义
作为通用人工智能的代表,大模型正在引领新兴技术变革。生成式大模型具备世界建模能力,为理解复杂的现实世界和工业系统提供了可能,进而为工业智能化的发展提供了坚实基础,使得实现专家的直觉思维成为可能。
首先,大模型成为工业智能化的基础模型。具体而言,大模型通过其庞大的参数,实现了对复杂世界建模,表现出卓越的泛化能力。与依赖于有限数据集的传统小型模型相比,大模型显著减少了对高质量标注数据的依赖,只需通过有效提示或者少量示例,就能快速胜任新任务,这种泛化能力使得大模型成为工业智能化的基础模型。
其次,大模型奠定了工业的通识基础能力。大模型是通过海量通用语料进行训练的,这些语料涵盖了不同学科和领域,使大模型具备了通识能力,而通识能力是实现领域认知的前提。人类是先发展出了通识认知能力,才能继而发展领域认知、专业认知能力的,比如医生大部分情况下是在排查疾病。理解疾病的前提是理解健康,理解健康这种通识能力优先于理解疾病这种专业认知能力。因此没有通识认知能力,就没有领域认知能力。对于工业认知智能系统的实现而言,必须先借助生成式大模型夯实其通识能力。
第三,大模型成为工业智能化的能力引擎。从大模型的功用来看,大模型成为海量工业知识容器,实现了海量工业数据、信息与知识的有效编码。大模型成为模拟人类心智能力的认知引擎,具备常识理解、概念理解、推理规划、自识反思等认知能力。大模型也常被用作驱动智能体与环境交互的大脑,使得工业智能系统成为高度自治的认知智能体。大模型进一步可以协同不同AI组件与工具,成为用户访问各类复杂信息系统与工具的统一入口。大模型在人机自然交互方面能力出色,可以实现有效的人机协作。
第四,大模型有望实现专家的思维能力。人类专家经过长期学习与实践,既能够通过直觉思维(即人脑系统1所实现的快思考)做出近乎直觉的推断,也能通过理性而审慎的推理做出缓慢而严谨的思考(即人脑系统2所实现的慢思考)。近期,OpenAI推出的o1大模型更是在复杂推理任务中达到专家水平,彰显出大模型的强大思维能力。大模型在实现了人脑系统1能力的基础上,进一步提升了其系统2能力,为实现工业专家水平的认知智能带来重大机遇。从长远来讲,使用大模型再现专家认知能力的曙光已现,对缓解我国工业发展过程中的专家资源稀缺问题具有积极意义。
(二)大模型在工业中的新应用
在生成式大模型这一新引擎推动下,一些新颖的工业智能应用成为可能,一些长期的难点问题有望突破。
1. 工业数据的理解与统一处理
大模型有望实现各类工业数据的理解与统一处理。工业数据形态多样,包括文本、表格、日志、脚本、视频、音频、序列等,经过领域数据微调的大模型有望理解不同类型的数据。大模型的泛化能力也使得统一处理复杂多样的数据成为可能,比如传统日志分析方法需要训练任务特异的小模型,难以泛化到不同的任务环境,在处理不同日志源和格式时,往往需要重新设计和训练模型。借助“预训练+微调”范式,大语言模型能够实现对多个日志分析任务的统一处理,从而提高了模型的适应性。
2.工业文档智能化管理与应用
文档是工业知识体系的最大载体,驱动了工业企业生产与经营的全过程。设计、生产、经营、运维都离不开各类文档,如设计图纸、作业指导书、设备维修手册和质量检验规范等,文档的智能管理与应用是工业智能化落地的重要形态。工业文档类型多样,分散储存在不同的设备与系统,缺乏统一管理和共享机制,导致信息检索和获取困难,进而影响生产效率和决策的及时性。传统集中式的文档管理平台统筹设计难度高,实施代价巨大。大模型凭借其强大的自然语言处理能力,能够理解复杂的用户问题、访问分散组织的各类文档并深入分析文档内容,从而提供精准的信息检索和内容生成服务。特别是,通过检索增强生成(RAG)等技术,可以实现海量文档的智能检索与服务,从不同文档、不同片段中选择相关信息综合生成满足用户需求的答案。
3.设备与系统的自然语言交互
由于工业场景和任务目标的差异,不同的设备与系统往往有着专业的操控语言,这些语言有较高的学习门槛,导致新手操作错误,影响生产效率与质量。大规模生成式语言模型,能够有效实现自然语言与专业语言或者设备命令之间的转换,操作人员可以使用自然语言进行设备与系统交互。自然语言交互方式不仅简化了操控方式,也降低了操作风险。传统的软件系统需要程序员设计大量的软件界面供用户操控数据与系统,费时耗力,难以适应用户的即时需求,而大模型使得自然语言直接交互数据与系统成为可能。此外,经过信息化阶段的发展,企业积累了种类繁多的软件系统,用户往往难以找到适当的信息系统。使用大模型智能体(Agent)技术可以实现统一的、智能化的信息交互门户,理解用户需求,进而将任务分发给相关信息系统。Agent还具备一定调度与规划能力,协同不同的软件系统完成复杂任务。
4.设备与系统故障的智能诊断
工业领域存在着各类大型装备、设备、网络与系统。自动化的设备与系统运维,特别是故障的智能诊断是工业智能化的重要应用场景。传统依赖于人工专家的诊断方法在诊断范围、效率、效果等方面显示出明显的局限性,难以应对日益繁杂的场景与复杂的故障所带来的挑战。大模型通过工业设备数据、运行日志、故障案例等数据的学习,习得了故障现象与根因之间的因果关系、设备与模块之间的复杂关联关系以及故障在物理关联网络上的级联传播模式,从而具备精准的故障定位、诊断与干预能力,甚至可以进行预测性维护。大模型Agent也可以沉淀业务专家的排障逻辑与诊断过程,从而模仿人类专家进行故障诊断。
5.专业与具身大模型提升研发效率
专业大模型与具身大模型显著提高了工业企业研发效率,比如专业的蛋白质大模型极大地加速了RNA病毒多样性的研究,为病毒学和相关医学研究领域带来了深远影响。进一步,具身大模型能够操纵机械臂进行复杂任务,极大提升了基于机器人自动化实验与检验的效率,也降低了人类从事复杂或危险环境中实验的风险。有数据表明,具身大模型加持下的自动化实验室使用5天时间,完成了传统借助人力6个月才能完成的催化实验。可以预见,实验检验密集的工业门类(如钢铁、冶金)将迎来研发效率提升、检验周期缩短的重大机遇。
6.基于图像大模型的工业质检
在生产制造过程中,利用视觉模型对产线上的产品或部件进行质量检测,已经是自动流水线的标配。然而,传统的视觉质检模型由于缺乏对特定领域背景知识的深入理解,往往难以适应多变的实际生产环境。这种局限性使得传统模型在面对复杂或未知的缺陷类型时,难以做出准确的判断和反应。相比之下,大模型凭借其泛化能力,能够在少量样本微调下,快速适应和胜任不同领域和场景的质检任务,也可以通过大模型生成优质质检数据训练小模型,提升小模型的质检能力。
7.工业数据库自然语言访问与分析
各种关系型或非关系型数据库存储了工业系统中的绝大多数数据。大模型给数据库系统的智能访问与分析带来了重大机遇,能够实现较高准确率的自然语言向结构化查询语言(SQL)的转换,使得用户能够以自然语言而非专业SQL语句访问数据库,降低了数据库系统的使用门槛,减少了数据管理编程需求,大模型也在一定程度上实现了智能化的数据库系统调优与诊断。大模型Agent技术在智能数据分析场景中展示了高度适应性和广泛应用前景,能够自动规划数据分析任务,调用数据查询、分析与绘图工具,生成分析结果、结论与图表,极大地提升了数据分析工作效率。
8.生成式仿真
2024年3月,OpenAI多模态生成式大模型SORA诞生,显示出强大的世界建模能力,为工业仿真带来了全新机遇。传统的工业仿真依赖于有限的实验数据和特定机理模型,难以模拟复杂的现实世界。相比之下,生成式大模型能够通过对真实世界的全面建模,生成更接近现实的合成数据,特别是在极端情况以及多要素混杂情形下的数据,从而提高仿真效果。无人驾驶等领域已经在使用生成式大模型对复杂路况与天气环境进行仿真,提高仿真度,降低了物理实验的成本。
三、生成式大模型的挑战
大模型的行业落地与应用存在很多共性挑战,包括生成过程不可控、不透明,生成结果不可靠、不正确,大模型知识难编辑、难更新。总体而言,大模型仍然难以胜任工业领域的复杂问题求解、严肃认知决策等应用。对这些共性问题本文不再赘述,本节从认知能力与数据问题两个角度进行论述。
(一)认知能力
尽管大语言模型在各行业应用中展现出巨大潜力,但在认知能力方面仍存在局限。首先,大模型仍然难以胜任工业领域的复杂决策任务。人类专家能够胜任复杂决策任务,是因为其具有丰富的领域知识,具有不确定场景的推断能力、未知事物的识别能力、复杂的策略取舍能力、精细严密的规划能力、综合任务的拆解能力以及宏观态势的研判能力。这些能力在故障排查、疾病诊断和投资决策等严肃应用场景中尤为重要。然而,当前的大模型在这些方面仍显不足。其次,生成式大模型存在诸多固有缺陷。主要问题包括幻觉生成、缺乏领域忠实度、专业知识匮乏、复杂推理能力有限、复杂规划能力有限、缺乏可解释性、评测体系不完善以及较高的推理成本,这些问题反映了大模型在行业应用中的局限性。总体而言,大模型驱动的工业复杂认知决策仍需长期努力。
(二)数据问题
大模型在利用工业数据时仍面临着诸多挑战,包括技术层面和生态层面的挑战。技术层面的挑战集中体现在其数据理解与处理能力不足,限制了高价值工业数据的使用。工业数据大多存储在数据库系统中,这些数据库包含大量高质量、各种形态的私域数据和行业数据,如何将这些数据转化为大模型训练语料是一个重要问题。私域数据有着较强的私有性和专业性,对大模型理解数据进而利用数据造成了困难,比如很多程序员个性化的数据编码,大模型是难以理解的。如果没有背景知识的支撑,大模型也难以理解专业性极强的传感器参数、医疗诊断等数据。
数据生态方面,数据要素市场尚不健全,私域数据的汇聚和交易流通困难,使得大模型难以利用高质量私域数据。如何完善数据要素市场建设,让数据供得出,流得动,仍然缺乏制度保障。此外,在当前的隐私保护法规背景下,模型在数据的使用过程中必须谨慎,以确保数据处理符合隐私保护法规。唯有在数据安全和合规的基础上,方能有效利用数据训练大模型。
综上,大模型为工业智能化带来了重大机遇,有望解决长期困扰工业领域的复杂性和不确定性问题。然而,大模型在认知能力方面,尚未完全具备专家级的复杂决策能力。在数据方面,大模型对专业性强、结构复杂的工业数据理解不足,且数据要素市场不健全、隐私保护要求等因素限制了高价值工业数据的使用。未来,大模型在工业领域的应用需要在提升认知能力、完善数据生态、确保安全合规等方面持续努力。同时,应注重人机协作,充分发挥大模型与人类专家各自的优势,共同推动工业智能化发展。
(本文刊登于《企业改革与发展》杂志2024年第11期。)