未来两种不可或缺的人才:数据科学家、物联网服务运营商
最近读了一篇 2015年的文章,标题是“ The top 5 new jobs created by industrial IoT",作者 Kund Lasse Lueth预测未来有五种工作会因为工业物联网的兴起而有大量的需求:Industrial data scientist, Robot coordinator, IT/IoT solution architect, Industrial computer engineer/programmer, Industrial UI/UX designer。
看看这五种职业,哪几种工作未来会是独立作业,有哪些工作适合在使用工业物联网的公司内任职呢? 30年前计算机刚兴起时,懂得使用计算器的工程师凤毛麟角,简直神人一般。加上当时只有大型计算机,多数计算机工程师都只能供职研究机构。直到个人计算机兴起,中间还有以工作站扬威的 Sun等公司,然后当一般大学都有计算器工程或信息工程系后,配合着个人计算机的普及,逐步演进到今天许多公司都有 IT 部门或至少配备 IT人员。
物联网独立服务运营商
笔者有一个在心中反复思索了很久的问题, 10年后的物联网应用方案会让使用的企业内都设置物联网维运部门,还是会有独立的运营商专责运营,或是中间会有过渡型态?物联网从业人员与传统 IT 工程师的区别在于, IT从出生开始就独树一帜,一直是一门专门的学科,然而 物联网则是 IT与 OT交织的科技 ,不同的产业、甚至是同产业内不同的公司,需要的 IT /OT专才各不相同。
试想台积电与联电的独家制程决不相同,就算是宝成与丰泰鞋业的制程也必有因为独到的管理哲学导致相异的产业管理模式,先不说懂半导体制程的 I oT computer engineer/programmer是否做得来制鞋业的 IoT computer programming,本身就是一个很有趣的命题。
物联网架构虽然万变不离其宗,都是南向( south bound)的 edge tier,中间的平台层(platform tier)负责串连装置并做基本的数据处理,北向(north bound)的应用层则运用平台收集、分析数据,进而利用分析结果控制 edge tier的装置。但是不同的产业或不同的任务,牵涉到不同的应用场景,因而需要收集的物理性数据(machine log)或用户行为(behavior log),可能南辕北辙,安装的位置与建模使用的算法也定然迥异。
因此所谓的 IoT solution architect与 IoT computer engineer/programmer ,其实是个很广义的泛称。未来的技职与大学教育如果不能配合推出跨领域的学程,让在学学子适当地调整学习内容与模式,物联网推广初期将严重受制于 IoT人才不足 。基此,除了个别行业巨擘外,物联网发展初期很难期待在每个采用物联网应用方案的使用者(政府或企业)都网罗上述五种人才,在体制内建立完整的物联网部门编制。
然而,独立存在的物联网应用方案服务运营商是否就是大势所趋呢?个别产业的熟稔程度、数据所有权、信息安全、客户信赖度等等都是需要克服的挑战。在智慧城市(路灯、交通、空污监测等)的应用场景中,因为涉及的专业知识相较于工业、商业、医疗等行业相对较少,专业的服务运营商切入困难度较低,而且因为智慧城市覆盖范围较大,又需要大量维修或巡逻人力,收集的数据往往都是公开数据(open data),非常适合电信或有线电视运营商投入。
但在工厂内外的物联网应用,纵算独立的服务运营商对于相关行业经营运作足够熟悉,若非有整组专责人力在现场支持,以工厂内低时延高可靠度要求的工作环境,恐怕没有一个公司愿意将涉及工厂运作的工业物联网运作交付给外人。更不用说每个公司都认为自己的生产资料都是营业机密,让一个第三者在运作过程中知悉,甚至保管或相关数据,对于许多老板来说显然是个无法想象的情形。
至于数据安全性的讨论则往往来自于是否将物联网应用方案收集到的数据放在云端,以便第三人监控管理。大部份的人听到数据放在云端,往往觉得不如放在自己家安全。然而实情是,这与将现金放在家里的保险箱或床底下,与放在银行保险箱中,两者哪一种比较安全一样。固然,报纸有时会报导银行遭到抢劫或银行保险箱遭窃,我们更应该比较的是两者机率孰低。 毕竟,银行保险箱业务受金融监督管理委员会的规范,银行有义务将银行保险箱设计到一定地安全程度,放在家里的保险箱的保障程度则是见仁见智。
在公司自行负责所有物联网应用方案运营与交给第三方独立运营商服务之间,是否有妥协的空间?毕竟大部份公司很难具备完整的物联网应用方案装置维护与精进能力,若想要维持物联网方案正常运作或有紧急状况时能快速回复, 在不触及数据的前提下,适当地将方案经营维运外包给第三人,将是确保物联网方案稳定而正常运作不得不考虑的状况。
另一种有趣的现象,B osch在其工业 4.0宣传影片中强调,他们管控全球不同工厂内超过 5000部机器设备,用以累积所有设备的运作数据,形成他们的专家支持系统的基础。同样的情形,除了同一企业内将全球各工厂内生产与机器设备资料累积成未来运作的参佐数据外,未来可以想象每一个计算机控制工具机(CNC)制造商针对同一型号的工具机远程监控,以求做好 远距维修与运作状况监控 。
借助这种远程的数据收集及持续性数据分析,工具机制造商将累积出强有力的数据库,除了可以更精确更及时地提供远程维修咨询外,还可以提供运用累积的数据 提供预防性维护(preventive maintenance),甚至做为未来改进工具机的依据。随着愈来愈多的设备加值或优化服务(app)的出现,更多的数据将被收集分析,笔者预测将来更将因此出现另一种型态的顾问咨询服务由设备制造商提供。
资料科学家
经过过去两年的宣传与普及,很多人都了解 物联网的核心在于数据分析与回馈。 但大部份的人还一知半解的是,目前的数据分析还不是电影里演的智脑,它的核心还是机器学习 (machine learning) 。在平台层的装置管理平台(device management platform)虽然负责串连装置(connect device)并将数据收集回来(collect data)数据分析引擎(data analytics engine, DA),但平台层的 DA 的主要功能是串流 实时数据聚集 (streaming data aggregation) 与串流数据事件处理 (streaming event processing)。
要发挥想象中的智能功能,还要结合企业层( enterprise tier,或称应用层)内的各种应用方案诉求的各种功能,进一步透过 data modeling及 predictive analytics才能达到。其中, data modeling与 predictive analytics往往靠方案设计初始时内建的算法达成,然而同样的应用方案在不同的工厂内,可能因为产线的布置、加工的工件大小或材质等等原因不同而需调整算法,也可能因为不同的业态(例如:零售业中 hyper market或 convenient store)使得同一套为了智能零售而研发的数据分析引擎必须做适当地调整。
更不用说促销期收集到的数据,是否需要在权重上适当地调整,以免影响数据解释的效度(不论是整体或对个别顾客行为)等原因而必须适时地与公司讨论,根据特定行业特定客户的特性进而随时调整算法。
与前一角色的讨论类似,在未来十年或更久以后,当学制调整成大部份学生都具备跨领域的专长,亦即主修资讯工程的学生兼修数学与机械,否则不是随便大学资讯工程学系毕业生就当然能够成为数据科学家,更不当然是个熟稔机械制造业或零售业的资料科学家。
再者,数据科学家团队内,除了精通程序语言与数学,能够选择算法并撰写程序者外,还有另一种与产业更靠近的 资料解读与产业分析师(interpreter)。没有产业分析师在客户与撰拟演算模型的数据科学家之间来回沟通,并协助客户精熟运用各式各样装置收集回来的各种资料源交错分析后可能代表的涵义,工厂内设备或机器人不会自己思考改进。
智能零售方案中各式装置因为更加廉价,更不可能具备足够的运算单元,装置本身更不可能有智能思考的能力。因此需要外来的数据科学家运用各种算法协助分析,并适时调整算法,以求与时俱进及因地制宜。
然则,现况资料科学家严重不足,资策会每半年一期的大数据人才培训班仅仅以半年时间速成的“人才”,距离真正上场实战效果,以笔者观察远远不如人意。要想在几年内填补数据科学家的需求缺口,明显不可能。所以, 有产业经验的数据科学家在可预见的几年内将是炙手可热的“战略物资”。
于此情形下,当物联网应用方案开始普及时,独立的数据科学家团队,必将是各方争抢,笔者认为这个行业人员很容易形成独立的咨询顾问机构,专责协助应用方案开发商开发各种“智能”的分析模块,或者协助实际导入应用方案的客户逐步落实并提高物联网应用方案的智能程度。
有趣的是,本文讨论的这两种角色,尤其是独立服务运营商这种行业,笔者在海内外文献或报导中几乎从未看过相关讨论。然而,笔者认为这两种角色,绝不只是讨论个人未来可能因为物联网兴起而出现的职业,更可能因为物联网应用方案实际运作的需求,进而形成独立的行业,值得所有有志于物联网产业的业者观察与积极投入。