导语:AI 大模型以其强大的学习计算能力掀开了人工智能通用化的序幕持续加速产业升级和高质量发展
自工业革命以来,工业生产先后经历了机械化、电气化、自动化、信息化的演进,正从数字化向智能化迈进,人工智能技术是新一轮科技革命和产业变革的重要驱动力量,AI 大模型以其强大的学习计算能力掀开了人工智能通用化的序幕,持续加速产业升级和高质量发展,成为推动我国工业智能化的关键因素和数字经济发展的重要引擎。
工业大模型,特指在工业领域设计和应用的、具有大量参数的人工智能模型,它们通过深度学习和海量数据分析,为工业自动化、智能化提供了强大的算法支持和决策辅助。工业 4.0 的浪潮带来了对智能制造前所未有的需求,工业大模型作为这一转型过程中的核心驱动力,其创新应用正成为学术界和工业界关注的焦点。它们不仅能够提升生产效率,降低运营成本,还能够促进新产品的快速开发,提高市场响应速度。过去,人工智能在工业领域的应用往往受限于特定任务,仅能根据已有数据进行预测或推断,实现质量检测、预测性维护等单一功能;现在,工业大模型凭借卓越的理解能力、生成能力和泛化能力,能够深度理解工业特定领域的复杂问题,处理海量数据,并从中挖掘背后的规律和模式,推动工业生产走向自适应、自决策、自执行。从机械制造到供应链管理,从产品研发设计、生产制造到运维服务,工业大模型的应用正在不断拓展,其影响力逐渐渗透到工业生产的每一个环节。
卡奥斯基于海尔集团 40 年的制造业经验,自主研发了国内首个以工业互联网平台为底座的多模态大模型——COSMO-GPT 工业大模型,具备工业知识问答、工业代码生成、工业文本生成和工业理解计算等核心能力,已经在智能柔性装配、服装辅助设计和注塑机工艺参数优化等场景落地应用,并取得显著成效。本文首先对既有文献进行梳理,回顾了工业大模型的发展现状;其次深入探讨了工业大模型三种典型的构建模式;最后详细阐述了以工业互联网平台为数字底座的 COSMO-GPT 工业大模型总体架构、核心能力和创新实践探索。
一、工业大模型的发展现状
顾名思义,AI 大模型指具有大量参数和复杂结构的深度神经网络模型,是大数据、大算力和强算法结合的产物,是凝聚了大数据内在精华的隐式知识库。随着算力的不断提升以及大规模数据集的持续丰富,大批科技公司和学术机构开始构建拥有数以亿计甚至数千亿参数的神经网络。大模型的概念是相对以前专用的小模型而言的,大模型拥有更多的参数和更深的网络结构(更多的隐藏层),可以更好地捕捉数据中的复杂模式,学习更高层次的抽象特征,从而在各类任务处理上拥有更好的性能和更出色的表现能力。
使用通用数据集训练得到的 AI 大模型虽然具有强大的自然语言理解与生成能力,但由于缺乏特定行业的数据和知识,在处理特定工业任务时,往往难以理解细分领域的专业术语和约束规则,输出的解决方案无法满足工业实际应用的要求。此外,AI 大模型在应用于工业场景时往往需要接入企业的信息系统,由于缺乏企业业务流程、数据结构、运营模式等方面的数据和知识,生成的解决方案无法匹配特定企业的实际需求。
近几年来,为了使 AI 大模型深度适配工业场景,学术界和产业界开展了大量的研究工作,也取得了比较丰硕的成果。丰田汽车基于计算机辅助工程的优化理论,开发了专为车辆设计师服务的工业大模型,可以将工程约束条件融入设计流程,根据文本提示生成的设计草图自动优化了风阻、底盘高度等关键工程参数。Back2CAD 公 司 在 OpenAI 和 Amazon AWS 等 的支持下开发了 CADGPTTM 大模型,具有 CAD项目辅助、文档生成、代码生成、虚拟助手功能。西门子开发的 Siemens Industrial Copilot 可迅速生成并优化仿真代码,将原来长达数周的仿真任务缩短至数小时甚至数分钟。Vanti 公司开发的工业大模型 Manufacturing COPILOT 可以融合来自企业资源计划(ERP)、制造执行系统(MES)等不同信息系统的异构数据,借助可视化技术,以自然语言对话的方式与用户交互,将数据分析处理过程转换为易于理解的、可操作的图形化叙述,实现辅助决策。山东能源集团、华为以及云鼎科技联合发布的盘古矿山大模型是全球首个应用于能源行业的工业大模型,原先需要工人下矿井逐个检查的卸压工程规范性验证操作,现在坐在办公室里就能完成。深信服发布的安全 GPT 大模型基于海量流量、代码、安全日志等特定安全领域数据,实现了高精准的攻击流量检测和解读,能够有效检测 Web 0day 漏洞、高度对抗的混淆、协议绕过等高级威胁。北京航空航天大学团队打造的工业大模型 AIGC 引擎具有工业仿真系统代码生成、工业数字孪生场景生成、机器操控指令生成、生产工艺生成等多项功能。
总的来看,当前 AI 大模型在工业领域的应用可以归结为两个方向:一是使模型具备更强的泛化能力,提升小样本训练效果,使其可以迁移至更多应用场景,主要应用场景有视觉检测、质量控制、原材料检测、环境感知、AGV自主导航等;二是作为工业应用的入口,以自然语言对话的方式生成工业领域的文字、图像等内容,降低工业应用的使用门槛,主要应用场景有生产报表生成、控制代码生成、设备监控、生产调度等。
二、工业大模型的构建模式
由于缺乏对工业细分领域知识的理解,基于大规模通用数据集训练得到的通用大模型往往无法直接生成满足工业特定任务要求的解决方案,因此,为了使 AI 大模型能够真正赋能工业智能化发展,必须构建专业的工业大模型,目前主要存在三种构建模式:预训练模式、微调模式和检索增强生成模式。
(一)预训练模式
预训练模式是指按照通用大模型的构建方法,收集大量无标注的工业数据集和通用数据集,使用 Transformer 等架构重新训练模型,学习工业数据集中的通用特征和知识,使模型能够从容应对行业的具体问题。这种模式的优点是工业大模型具备广泛的工业通用知识,可以最大程度地满足各类工业场景的需求。此模式缺点也同样明显,高质量工业数据的收集、大量的训练时间、对庞大算力资源的占用、电力消耗以及其他相关开销,导致预训练大型模型的成本高昂,可达数百万美元,甚至更高,只有大型科技公司或研究机构才有能力承担,普通的企业或个人很难负担得起。
(二)微调模式
微调模式是指在一个已经预训练好的基础大模型的基础上,利用特定工业场景已经标注好的针对特定任务的高质量数据集对大模型进行架构调整(例如添加特定的输出层)和参数优化,从而使其学习到工业细分领域的知识,能够完成特定的工业任务。在微调过程中,通常会选择冻结大模型的底层参数,以保留其在预训练阶段学习到的通用知识,只更新模型的顶层或新添加的适配器层,以学习特定任务的特征。微调模式能够合理利用预训练基础大模型的广泛知识,通过微调使其能够适应特定的任务需求,减少从头开始训练所需的时间和资源,并且对数据量的要求更低,单个任务的微调通常只需要几千至上万条工业数据,但要求所用的数据已被标注。
(三)检索增强生成模式
检索增强生成模式是指为已经预训练好的基础大模型外挂一个它能理解的行业知识库(通常为向量数据库),在不改变原大模型参数的情况下,使其能够在生成响应之前引用训练数据集之外的权威知识,从而快速接入工业细分领域的信息,实现特定工业场景的知识问答和内容生成。在没有检索增强生成前,大模型接受用户输入,并根据预训练过程中学习到的知识创建响应结果。检索增强生成允许大模型动态地访问和利用大量的外部信息,其工作过程如图 1 所示。检索增强生成为大模型添加了一个信息检索组件,这个组件会将用户输入转换为向量表示,并于外部行业知识库中执行相关性搜索,检索与之相关的文档或信息片段,这些文档或信息片段不仅提供了上下文背景,还扩展了模型对特定领域或话题的理解,大模型根据接收的这些文档或信息片段以及用户的原始输入来生成答案。这种模式的优势是无需进行额外训练,只需构建和接入权威的行业知识库,就能快速利用现有的基础大模型实现对工业领域知识的理解和应用,后续大模型的更新和维护也仅局限于信息检索组件和行业知识库的迭代。但与预训练模式和微调模式相比,这种模式的泛化能力和稳定性要差,可能无法充分适应工业场景的需求。
图 1 检索增强生成模式的大模型工作过程
三、基于工业互联网平台的工业大模型通用体系架构
在工业大模型的开发实践中,预训练、微调以及检索增强生成构建模式构成了一套丰富而灵活的框架体系,鉴于不同工业场景对模型性能、效率及可解释性等方面的多样化需求,综合采用上述多种构建方式已成为一种趋势。卡奥斯基于海尔集团 40 年的制造业经验,以多个开源通用大模型为基础,在微调的同时融入检索增强生成机制,自主研发了国内首个以工业互联网平台为数字底座的多模态大模型——COSMO-GPT 工业大模型(见图 2),其总体架构可以概括为“1+1+N”,即 1 个数字底座、1个能力引擎和N 个应用场景。
图 2 以工业互联网平台为数字底座的 COSMO-GPT 工业大模型总体架构
(一)数字底座
数据质量直接决定了工业大模型的性能,如果输入的数据存在噪声或代表性不强,必将使模型的推理能力下降,若数据类型单一,还可能增加过拟合的风险。因此,无论是采用预训练模式、微调模式,还是检索增强生成模式,想要得到泛化能力强、准确性高的工业大模型,都必须先获得高质量的工业数据集。工业互联网平台作为数字底座,可以提供工业设备接入、数据采集、数据清洗、数据集成等能力,为工业大模型的预训练、微调和检索增强生成奠定坚实的数据基础。以卡奥斯 COSMOPlat 工业互联网平台为例,该平台已链接企业 90 万家,服务企业 16 万家,平台的现代工业数据栈能够高效采集来自企业工业软件、信息系统、传感器和生产设备等的海量异构数据,并进行实时数据清洗、融合、分析和标注,目前已建立工业数据集 562 个,其中有效数据 300 余万条。
(二)能力引擎
基于工业互联网平台,卡奥斯积累了 3900余个用于研发设计、生产制造、服务管理等环节的工业机理模型,200 余个用于故障诊断、路径规划、生产调度、质量控制等场景的专家算法,以及大量工业知识图谱、专用词典、行业标准、发明专利等,并基于这些内容建立了面向工业细分领域的行业知识库,为大模型的检索增强生成提供了有力支撑,这使得 COSMO-GPT 工业大模型具备了五大核心能力:
一是工业知识问答,针对特定工业场景中的知识点进行信息查询和问题解答,包括注塑机、工业机器人、机床等生产设备的操作知识,工业生产和加工的标准操作流程,设备故障原因分析和维修建议,工业环境中的安全规范,材料、组件和产品的技术规格等;
二是工业代码生成,包括工业设备的控制代码、PLC 等控制器的控制代码、工业机器人路径规划和动作序列代码、数字孪生和仿真代码、数据采集与监视控制系统(SCADA)使用的脚本、用于数据处理和分析的代码等;
三是工业文本生成,包括技术手册、操作规程、维护指南等技术文档,生产报告、质量分析报告、设备运行报告、故障诊断说明等分析报告,安全教育、操作指南等员工培训材料,团队协作记录、会议纪要、交接班报告等沟通文档,设计规格说明等设计文档等;
四是工业理解计算,包括物料齐套检查、设备物料选型、订单延期推算、产品不良率统计分析等;五是工业多模态,支持文本、图像、语音等多种类型的工业数据,增强工业信息理解和推理能力。
(三)应用场景
通过模型即服务的部署架构,COSMO-GPT工业大模型可以面向不同行业、不同需求,为用户提供轻量化、定制化的解决方案,实现从交互设计、虚拟仿真、网络协同、柔性生产到智能服务全生命周期的智能化升级,助力从场景、企业、园区、行业到城市的数字化转型,打造矩阵式赋能新范式。
四、COSMO-GPT 工业大模型的应用实践
COSMO-GPT 工业大模型的工业知识问答、工业代码生成、工业文本生成、工业理解计算和工业多模态等能力已在交互设计、虚拟仿真、网络协同、柔性生产和智慧服务等多个环节进行应用探索。
(一)智能柔性装配
随着生活水平的不断提高,消费者对产品的需求趋向于个性化、多样化。为了获得市场竞争优势,家电、汽车等制造行业纷纷改变原来单一化、规模化、整体化的生产模式,向大规模个性化定制生产转型,多品种、小批量订单日益增多。但由于生产线缺乏动态调整和快速重构能力,多品种、小批量产品的混线生产带来了模具、工装夹具等的频繁更换和机器参数、控制程序等的频繁调整,生产换型时间长,产品总装工序 80% 以上的操作依赖人工,生产效率低。
COSMO-GPT 工业大模型可用于家电产品的装配场景,实现智能柔性装配,降低多品种、小批量订单的生产成本,缩短交付周期。智能柔性装配系统的工作原理如图 3 所示,系统利用射频识别技术获取订单信息,判断待生产对象是否为新产品。对于新产品,多模态大模型利用 CAD 数字模型等设计数据、上游生产任务数据和装配工艺知识图谱,生成零部件装配工艺步骤,每个工艺步骤的操作流程则由机器人技能模型生成,通过数字仿真模型对轨迹柔顺性、抓取精度和作业节拍等进行验证和优化(见图 4),并由人工调整工序和轨迹错误,从而生成最优装配方案;对于既有产品,则直接从工序库中调用既有装配方案。在执行环节,系统融合 3D 相机、力传感器、设备运行数据和工艺参数数据对工况进行实时判断,对装配过程进行动态调整,已经验证并执行过的装配将被存储,用于下一次生产调用。当前,对于冰箱产品,已实现亚毫米级的精准装配,整机装配效率提高 42%。
图 3 智能柔性装配系统中工业大模型工作原理
图 4 智能柔性装配示意图
(二)服装辅助设计
服装是个性化、多样化、时尚化特征最为突出的产品之一,随着消费者个性化定制需求的日益增长,新品的设计和生产周期必须控制在几周甚至几天以内,给设计师带来了沉重的工作负担。服装的创意和概念往往是整个设计过程的瓶颈,消耗了设计师大量的精力和时间。
COSMO-GPT 工业大模型能够应用于服装的概念设计,实现服装辅助设计平台的搭建,该平台可以通过用户描述和参考图样快速为设计师提供设计方案,实现从概念描述到概念设计成果的快速产出(如图 5)。平台的内部运行原理如图 6 所示:第一步,提示词生成器以用户简单输入的关键词为基础,在行业知识图谱中检索出备选关键词,用户对备选关键词进行选择,从而筛选出最匹配用户需求的精确关键词;第二步,大模型接收精确关键词,从基于过往典型设计案例、业界优秀设计案例等内容构建的设计知识向量数据库中检索相匹配的行业知识,并生成多个候选设计方案;第三步,用户从候选方案中选出最满意的设计方案,并可以通过图像算法对设计图进行修改调整或利用大模型的能力对设计图进行局部重绘;第四步,输出设计方案和设计图。通过服装辅助设计平台,设计师可以根据用户需求输出服装风格、配色、材质、配饰等文字信息,一次生成多张效果图,完成款式设计;可以通过局部绘制蒙版的方式实现对服装配饰的添加、修改和对面料的替换;可以在不更改服装款式的前提下,仅对服装颜色进行修改。此外,支持根据用户上传的参考图片,一次生成多张类似风格的效果图。通过工业大模型赋能,平台已经支持外套、半身裙、连衣裙、T 恤、马面裙和卫衣共 6 种服装品类的设计,可以将设计师的设计效率提升 40% 以上。
图 5 服装辅助设计平台用户界面
图 6 服装辅助设计平台中工业大模型运行原理
(三)注塑机工艺参数优化
注塑成型是一种重要的加工方式,广泛应用于航天、医疗、汽车、家电等制造行业,我国超过 80% 的工程塑料都是采用注塑成型工艺生产的。注塑机是注塑成型的核心设备,也是国内市场规模占比最大的塑料机械装备。我国塑料生产的年耗电量约为三峡发电站一整年的发电量,而注塑成型的电耗在整个塑料生产过程中的占比超过 60%,因此降低注塑加工的电耗是工业领域节能研究的一大热点。注塑成型工艺过程复杂,涉及 400 余个数据点位和注射压力、保压压力、注射速度、熔体温度、冷却时间等 100 余个可调工艺参数,传统的参数调节依赖人工试模,调试周期长,且难以达到最佳配比,导致注塑机经常处于非最优运行状态,电耗居高不下。
应用 COSMO-GPT 工业大模型(如图 7 所示), 工 人 以 文 字、 语 音、 图 片、CAD 图 纸等方式与系统交互,多模态大模型准确识别用户意图,从用户输入中提取注塑件结构参数、注塑机功能参数等关键参数信息,并调用基于高质量注塑数据集和极度梯度提升树、粒子群等算法训练的工艺参数推荐专家模型,专家模型通过计算输出最佳工艺参数,大模型接收工艺参数,并结合注塑机工艺参数配置界面,生成最佳工艺参数配置方案。依托工业大模型,即使没有专业知识的普通工人也能快速完成注塑机的参数优化调节工作,减少了对高技能工匠的依赖,节省了用人成本和培训成本。基于COSMO-GPT 工业大模型,已经能够将车身外壳部件、内饰部件以及洗衣机外筒部件等复杂注塑件的试模周期由近百次缩短至 2 次,产品质量合格率由 92% 提升至 97%,单台注塑机的平均能耗降低 10%。
图 7 注塑机工艺参数推荐系统运行原理
图 8 注塑机工艺参数推荐系统用户界面
五、结论与展望
海尔基于多年的制造业经验和数据积累,以工业互联网平台为数字底座,构建了高质量的工业数据库和行业知识库,并在多个开源通用大模型的基础上,结合微调模式和检索增强生成模式,自主研发了具备工业知识问答、工业代码生成、工业文本生成、工业理解计算和工业多模态五大核心能力的COSMO-GPT 工业大模型。
在家电产品的装配场景,通过生成零部件装配序列和机器人控制代码,实现了智能柔性装配,冰箱产品的整机装配效率提高了42%;在服装辅助设计场景,通过文本输入和图像输入,可快速为设计师提供设计方案,实现从概念描述到概念设计成果的快速产出,设计效率提升了 40% 以上;在注塑机工艺参数优化场景,可为没有专业知识的普通工人快速推荐注塑机的最佳工艺参数,复杂注塑件的试模周期由近百次缩短至 2 次,单台注塑机的平均能耗降低了 10%。COSMO-GPT 工业大模型的创新应用可以显著提升企业生产效率,降低运营成本,为 AI 大模型在工业领域的全面推广和深度应用提供重要参考和启示。
原文刊载于《数字化转型》 作者:陈录城 杨振发 鲁效平 盛国军 秦承刚 王超 王朋静
暂无评论,等你抢沙发