工业互联网中边缘计算的实现方法
工业互联网是新工业革命的关键支撑和智能制造的重要基石,已经成为国家战略。构建企业工业互联网系统,核心是平台,如同一个智能体的心脏,工业互联网平台是系统建设的核心,用于汇聚数据、处理数据、准备数据,并驱动数据向工厂各处输送活力。而在平台建设中,边缘计算技术应用以及边缘与云端功能的分担是一个重要的话题。
1 工业互联网是智能制造的突破口
2015年5月,国务院发布了《中国制造2025》,围绕先进制造和高端装备制造,前瞻部署重点突破的战略领域,描绘了未来三十年建设制造强国的宏伟蓝图和梯次推进的路线图,是一份总的行动纲领文件;2015年7月,国务院关于积极推进“互联网+”行动的指导意见,提出了“充分发挥中国互联网的规模优势和应用优势,推动互联网由消费领域向生产领域拓展,加速提升产业发展水平,增强各行业创新能力,构筑经济社会发展新优势和新动能”;2016年5月,国务院发布了《关于深化制造业与互联网融合发展的指导意见》,指出:制造业是国民经济的主体,是实施“互联网+”行动的主战场;2017年11月,国务院《关于深化“互联网+先进制造业”发展工业互联网的指导意见》正式发布,“工业互联网作为新一代信息技术与制造业深度融合的产物,日益成为新工业革命的关键支撑和深化“互联网+先进制造业”的重要基石”,明确提出“构建网络、平台、安全三大功能体系,增强工业互联网产业供给能力。”并明确了与《中国制造2025》三步走相适应的一系列发展目标,至此,工业互联网上升为智能制造国家战略。
2018年年初,工业互联网高峰论坛在北京举行。时任国务院副总理、国家制造强国领导小组组长马凯出席会议并发表了重要讲话,指出:“工业互联网是新工业革命的关键支撑和智能制造的重要基石。工业互联网通过实现人、机、物的全面互联,促进制造资源泛在连接、弹性供给和高效配置。推动制造业创新模式、生产方式、组织形式、商业范式的深刻变革,和全球工业生态体系的重构迭代和全面升级。”
今年两会报告,工业互联网被写入了总理的政府工作报告,明确指出:“实施重大短板装备专项工程,发展工业互联网平台,创建‘中国制造2025’示范区。”
2 工业互联网是一个复杂的智能体
工业互联网的概念首先由GE提出。在《工业互联网——打破智慧与机器的边界》中,GE以航空发动机全生命周期管理为例,阐述了工业互联网的内涵,明确了工业互联网建设中的三个关键要素,即:智能机器、高级分析和工作中的人。可以认为,工业互联网是数据流、硬件、软件和智能的交互。
为了抢占工业互联网的制高点,跨国企业巨头进行了大量的投入,不仅在技术概念的研究、商业模式的设计上占据了话语权,同时利用先发优势,打造工业互联网平台,最具代表性的是:GE的工业互联网操作系统Predix,Siemens基于云的开放式物联网操作系统MindSphere。
工业互联网系统是一个复杂的智能系统,它是OT(Operation Technology)和IT(InformationTechnology)深度融合的产物,“工业互联网是一个整体,当前时髦的信息技术,都在工业互联网系统大框架之下。”国家信息化专家咨询委员会常务副主任周宏仁说到。
企业工业互联网系统涉及到下列产品制造和企业运营要素:
(1)装备是工厂运转的基本单元,感知环境、生成数据、执行指令、精准控制;
(2)互联互通的网络,实时、动态、透明的传递数据、输送信息;
(3)用于汇聚数据、处理数据、准备数据的平台,并驱动数据向工厂各处输送活力;
(4)工业APPs遍布工厂自下而上的每一个角落,表达控制逻辑、传递决策指令;
(5)模型描述是控制和决策的基础,支撑决策中枢,人工智能技术应用取决于模型。
企业工业互联网系统是一个由模型、软件、平台、网络和工业装备组成的复杂的完整的智能系统,而其中数据就像智能体的“血液”一样,贯通肢体到中枢,是智能体产生活力的源泉。
3 工业互联网建设要以数据为中心
3.1 现存系统架构中数据的流动方式
通常,制造企业都拥有多个、不同时期投入、不同IT公司提供的独立开发的软件系统,这些软件都有自己独特的理念、青睐的供方以及专门的系统。由于系统的建设是一个较长的时间过程,除了技术发展的限制外,为了不影响在线系统运营,最简单的办法是:在多个低层级系统之上(或多个系统之外)构筑一个新系统,将所有低层级系统的数据按照既定的需求处理后上传,以实现数据共享并开发跨系统的应用功能,由此造就了系统层次不断增多,架构复杂(如图2所示)。
大量的经验数据表明:信息系统的开发建设时,需要大量的时间精力(30%-40%)来处理数据交互的问题,包括:通讯规约、电文格式等;为了保持设备日常正常运转,企业需要花费大量时间和精力去处理、传达和交换信息,非常低效。
· 数据逐级上传,以满足上层管理和决策特定目标需求;
· 数据样本是根据既定目标进行选择并处理后进行传输的;
· 大量原始数据的微观属性价值被过滤而不复存在;
· 同级或周边系统无法直接分享数据,需要经过上位系统周转;
· 数据样本多用于已经在设计之初就明确的单一目的,数据价值未充分发挥;
· 上位系统基于数据的决策以非实时的方式逐级下达并执行。
通过对系统架构和功能的重构,一个重要的外在特征是系统更加扁平化。
3.2 数据服务业务重要性日益凸显
在过去若干年信息系统建设中,由于受到技术、管理、认识等多种因素的限制,往往不会刻意去区分两类业务,在已经建设的系统中,除了流程型业务的设计之外,也有大量的数据应用的业务,彼此紧密地交织在一起,这种方式可以保障在有限数据样本情况下,满足特定的计算需求;其不足在于数据样本选择是事先确定的而且是固化在程序中,无法灵活方便地进行调整。
这两类系统的数据源是同源的,但对数据处理所擅长的领域又不同,流程交易类服务主要是实时处理数据,数据服务的系统则是对量大、面广的数据做批处理,两者相辅相成、交织并存。但必须看到,支撑两类业务运行的技术和平台配置要求有很大的不同,源自对数据样本获取和使用的原则和方法不同,同时,在实践中,还要考虑既要减少对现有业务系统的干扰,又要增强数据的业务应用。
随着大数据的概念日益被接受,技术日臻成熟,使得打造一个专门从事数据业务的平台环境具有了技术的基础,同时也使得在一个专门的大数据平台上更多的运用数据成为可能,所以,将重要的、业已存在的数据服务型任务剥离到数据平台上运行不仅可能,而且必要;特别是在企业大数据平台上,可以方便地获取数据、灵活地使用算法工具、甚至“天马行空”式的在数据中耕耘,有助于企业知识的积累,有可能通过大量、多源时空数据发现更多的价值。
4 平台是工业互联网的核心
工业互联网系统中,平台是“心脏”,是企业运行数据的中心汇聚点,汇聚数据、处理数据、准备数据,并将数据信息输送到工厂各处,产生活力。必须构建一个能使所有系统实现互联互通的平台。在此平台上,信息的传递不再是上下节点的传递关系,而是全流程的信息打通,所有信息流和任务流都通过这个中间平台交互,让信息传递平台化。平台上任何一个工作节点都是对等的,从而实现技术架构上的去中心化和系统扁平化,每个系统或设备可以被视作可提供不同复杂程度的服务,实现服务化。
4.1 基于工业互联的企业数据系统架构
参照美国工业互联网联盟(IIA)提出的工业互联网参考架构(图2),将系统分为三个层级,分别为:边缘级、平台级、企业级。
这个参考架构明确定义了各层级的功能、技术特征,同时较好地阐述了此架构与业务系统(业务域)之间的对应关系。
4.2 企业工业互联网平台构成
当我们讨论制造装备时,有两个不同的考虑视角,从智能制造而言,关注装备智能化问题;从工业互联网的角度,则将装备视为产生数据的边缘装置,讨论装备对工业互联网的影响。
企业工业互联网建设中首先要解决的一个最重要问题是:数据采集和接入,这是与社会互联网的最大区别所在,也是GE、Siemens等不将自身的平台简单定义为一个云端平台的重要原因。
(1)现场多源异构数据的实时接入与可靠传输企业大数据与传统数据仓库的区别主要不在于数据量大,而在于数据多源。建设企业数据系统,在数据采集上要关注数据全样本的收集,其特征体现在数据的多源、多维度、多结构、多尺度。
根据对钢铁制造现场实际系统现状分析,工业现场数据归类如图3所示。
· 大量的多源、多时空尺度、多采样周期时序数据构成了现场工业数据的主体;
· 众多非结构化数据,如:工业电视、特殊仪表等;
· 未来,会有大量的来自移动终端的结构化和非结构化的数据接入系统,数据传输的协议规范也各不相同,包括:232、485、104、OPC协议,TCP/IP协议,数据库DB-LINK等。
(2)边缘计算资源的有效利用
为了对现场多源、异构数据归一化处理,同时兼顾计算和网络资源以及数据传输的有效性等,形成云端和边缘计算资源的合理和优化配置,既保留数据的原始属性,又避免无谓的网络与存储和计算资源开销,需配置数据采集区域服务器资源。
(3)云端数据平台架构
大数据平台的核心是面向不同数据类型的分布式存储,以及在存储之上搭建的分布式并行计算框架,通过内嵌丰富的算法包,实现对数据的计算和分析。对下,提供面向多元数据源的数据接入方式,使外部系统的数据能方便地接入大数据平台;对上,提供面向复杂应用系统的多样化展示方式,满足更高的数据可视化需求。
大数据平台服务按微服务架构设计,服务可分拆、可裁剪,可按模块化方式进行独立部署,系统可伸缩性,使得业务系统可以根据需求选择对应的服务进行非全量部署,降低了对硬件资源的要求。对于部分非关键性应用,如果无需分布式存储和处理的要求,甚至单服务器就可以实现系统的部署。
除了与数据存储、检索、展示等必备的功能之外,平台还需要配备必要的数据分析软件和工具,以便于用户方便地用于数据的分析。
某些功能既可以在边缘端实现,也可以在云端实现,取决于具体需求和资源配置情况。重要的是:系统要提供便捷的功能配置工具,使得云端与边缘端功能分担的配置可以灵活实现。
(4)云端与边缘功能配置与协同
如前所述,平台的功能是汇聚数据、处理数据、准备数据,并将数据信息输送到工厂各处,产生活力。
有些功能可以配置在云端,也可以部署在边缘,这主要视具体需求而定,需要在设计中提供一个便捷的技术手段,灵活地加以处理,所以,作为平台的两极,边缘与云端同时存在,构成一个整体,按照具体需求进行最优的功能分担设计和配置,将成为企业工业互联网平台构建的一个非常重要的问题(如图5所示)。
区域服务器的首要任务是对上述所有数据进行归一化处理,使之按照预先定义的格式归一化,并按照标准的TCP/IP网络协议上传大数据平台。
另外,视不同场景和需求,区域服务器还可以承载更多的可以在数据上传云端之前需要完成的许多必做的技术处理。至于具体在边缘完成还是在云端进行,一个重要的原则是:能够在边缘进行的工作,不要配置在云端。
5 企业数据系统建设实践
5.1 区域数据服务系统构成
数据采集采取区域汇聚原则
即某制造工序的所有数据均由本区域配置的数据服务器统一汇聚处理,从而可以在区域确保数据的时空一致性、确保数据基础模型的一致性。
首先按照厂部配置,如果一个厂部范围由于产线多、数据复杂等因素,单台服务器无法满足,可按照相同标准配置第二台,数据接入可按照产线(工序)来划分,原则是同一产线的相关数据接入同一台服务器,以便数据模型的管理。
区域数据服务器的配置原则
尽可能采用相同的标准配置所有区域的数据服务器,包括硬件、软件和功能,从而降低个性化开发的成本,便于扩展和维护。
区域数据服务器软件配置
数据采集采用宝信iCV软件实现,iCV具备先进可靠、具备众多功能和对系统接口,能够提供一体、可灵活配置、实施简便的开发环境;
高速数据存储使用实时数据库iHyperDB实现,通过配置建立好连接方式及存储参数后,所有选定的实时数据会自动传输至实时数据库中并作为原始数据存储,关系型数据采用开放式关系型数据库如MYSQL等进行数据存储;
数据处理、匹配、管理采用iBatchCube软件,可以将基础自动化原始数据根据业务规则形成与生产相关的批次数据。
配置ETL引擎,以便从关系数据库表中抓取数据,如过程计算机等系统。
5.2 数据服务功能构成
利用区域数据服务器的边缘计算能力和软件工具,对汇聚于服务器节点的所有现场数据进行分类预处理(如图6所示)。
数据汇聚
将区域内各种采集数据(包括:工业设备状态的常规物理量数据、环境与工况情景数据、漫游在此区域无线覆盖范围接入的数据等),均通过适当的接入方式汇聚到此服务器节点,接入方式可以是直接接入,或通过网关转接等。
协议转换
现场数据采集和传输的方式多种多样,并通过不同的网络协议接入,服务器必须具有接入各种接口协议的适配能力,并将不同数据格式、数据速率等转换成统一的网络协议,向上传送。
减量解析
数据从各种不同的专业系统汇聚而来,其数据的类型各不相同、数据的颗粒度也不尽相同、数据的原始结构也各有差异,所以要在数据传送到大数据平台前对数据进行处理,如:采集的数据进行噪音处理、异点剔除等;必要时,按照对数据质量的不同标准,选择适当的压缩方法,对数据进行压缩处理,减低网络资源需求。
数据缓存
具有足够的存储现场数据资源空间,以保证在与大数据平台进行数据交互不畅时,可以缓存数据能力,缓存时段可定义。
OPC服务
提供标准的OPC服务,在需要时,便于与其他同级服务器间进行数据交互。
时序匹配(数据关联)
主要是通过建立数据之间的关联关系,确保数据的时空一致性。
· 时序关系:保证数据时间顺序的正确关系,尤其是事件数据;
· 批次处理:根据业务规则,将原始数据形成与生产相关的批次数据,是后续数据应用的基础;
· 动态判定:可以基于本区域数据完成一些简单的异常判定、自动向系统输出日志或报警,该报警可作为标准业务流程的触发源。
与时空一致性关联相对应的是涉及业务内涵和逻辑的数据建模,经处理的数据从不同的专业和业务核心概念来对数据进行多维度的建模,依据数据后续的业务用途进行关联性整合,这类建模工作一般会在云端基于全样本数据进行,如:设备状态信息要对应到相应的材料归并,生产实绩信息要和产品信息相关联等。
结构解析
对于某些非结构化数据,在需要时,可以进行简单的(初级的)结构化处理,以降低数据传输对网络资源和云端存储资源的需求。
数据传送
写入大数据平台有如下几种方式:
· 通过实时数据库配置方式,定周期地把tag点数据传递到大数据平台,也可选择压缩后传递;
· 对于数据库,可采用大数据平台的ETL工具,定周期地把数据抽取到大数据平台;
· 本地编程,写远端的大数据OTS和PDS;
· 通过TCP/IP编程方式把数据传递到大数据平台。
6 小结
工业互联网建设已经上升到国家战略。企业工业互联网将有效地赋能智慧制造。
企业工业互联网系统涉及到各种各样的技术,但数据是一切设计的着眼点,而平台则构成工业互联网的核心。
对于工业系统,构建平台要兼顾云端和边缘计算资源的有效利用,而边缘计算环境的配置和功能设计,对于数据效率至关重要。