智慧城市中的数据融合关键技术与挑战
截止到2016年底,中国的城镇化率已经达到了57.35%,城镇化建设虽然有力地促进了城市的发展,但是也带来了一系列新的问题,比如交通拥堵、空气污染、资源消耗等,这些都是21世纪城市发展所面临的关键挑战。为了更好的应对这个挑战,“智慧城市”这个概念应运而生,并且一经提出就受到了广泛的关注。
智慧城市这个概念可以追溯到20世纪90年代,在2009年IBM公司在此基础上进一步提出了“智慧地球”战略之后,更是受到世界各国广泛关注,其核心主要就是利用以新一代信息技术为基础,通过物联化和互联化的方式对各种数据进行动态监测、分析、整合,以更透彻的感知方式对城市进行更合理全面的调控,使城市中各个部分协调配合,在城市的经济、交通、通信、教育、环境、能源、安全、管理、服务、文化、医疗等方面实现更高效、更便捷的运作模式,极大的提高居民生活质量,塑造良好城市整体环境,加强人和城市之间沟通的新型城市形态。
为了实现智慧城市的构想,需要有合适的技术架构来进行支撑,为此,学术界对于智慧城市技术体系架构也进行了广泛的研究和探讨,在这些技术体系架构中,数据的重要性获得了一致的关注,普遍认为城市的智慧需要依赖对数据进行高效和合理的采集、清洗、存储、处理以及实用的能力。
数据融合关键技术
智慧城市因其涵盖的内容涉及城市的方方面面,研究的切入点即可以是一个具体的应用,也可以是城市整体的发展规划,因此研究智慧城市技术体系架构的不同方法有着不同的侧重面,比如有的重点研究包括信息化基础设施对于智慧城市的影响,也有的从智能化服务入手。但是无论从什么角度,绝大部分的研究都认为数据及其使用才是智慧城市最为核心的研究要点之一。
对于智慧城市的数据,第一步首先是有效的获取与感知,其核心主要是研究如何高效获取互联网、电信网、物联网和各行业数据,通过研究视频、音频、激光、射频定位、报警、智能图像分析等感知技术,构建智慧城市内立体感知系统,特别是需要针对数据来源的多源、异构等特性,对获取数据进行再组织与管理。在获取到了有效数据之后,下一步主要工作则是对数据进行高效的传输,其核心内容是通过各种无线、有线的长距离或短距离通信网络,在确保信息安全和传输质量的前提下,实现选定范围内的数据互联互通。
在有了海量的多源异构数据之后,如何高效智能化地存储、管理和分析数据,并将有意义的信息提取出来应用于各种城市数据密集型应用成了最重要的一个挑战,为此,需要将数据进行广泛深度的融合,为了应对这个挑战,出现了一系列相关的技术和解决方案,其中数据活化是一个面向智慧城市数据融合需求的技术体系,该体系通过研究数据的描述、认知、建模、关联、演化等方法,实现海量多源异构数据的自我认知、自主学习和主动生长。
智慧城市的数据活化技术体系首先需要研究数据描述方法与描述语言、数据认知技术、关联数据动态建模技术、数据演化与自主生长机制和数据联网等面向海量异构数据的关键技术,面向数据和应用的规模性、资源分配的动态性以及资源环境的异构特征,为构建智慧城市应用提供支撑能力。
数据描述方法与描述语言的重点研究内容主要包括数据描述的共性基础问题,如何定义通用数据特征描述规范,并研究数据的实体对象描述方法。其核心能力包括建立元数据组织、语义等模型,对元数据语法进行表示和封装,然后进行数据抽象,将数据、数据模型和描述型元数据封装成可唯一标识的数据实体对象,能够支持不同层次的数据粒度大小要求。
数据的认知技术主要研究数据的底层特征识别、提取和检索方法,基于统一完备的数据特征与语义描述,建立数据底层特征与高层语义的多粒度跨媒体数据映射,形成一个较为完整的海量数据之间语义理解和认知的技术理论方法。从海量多源异构数据的底层特征识别、提取和检索,到上层语义理解和知识发现,通过统一完备的海量多源异构数据特征与语义描述,建立完整的数据的认知技术体系。
关联数据动态建模方法则重点放在不同类型数据之间的数据内在关联关系上,通过研究关联数据的多层次建模方法,实现异构数据间关系的规范化表示、添加、删减、重构等基本运算操作,突破数据模型的动态构建与实时更新。根据文本、图像、视频等各种不同数据实体之间在时间、空间、事件等方面的相互关联、作用及影响,应用动态图理论对数据实体之间的关联关系进行动态建模。
数据的演化与自主生长机制主要研究具有竞争与协同特性的关联数据主动成长机制,分析数据关联主动识别方法的基本原理,通过建立一套基于数据特征描述规范的属性操作运算法则,研究分析数据实体成长、演进和繁衍的基本方法。
数据联网则是借鉴物联网的概念,研究比数据本身所包含的信息更为重要的数据之间的关联关系。数据联网(Internet of Data,IOD)结合信息隐藏技术,将数据的虚拟标签嵌入到数据实体中,虚拟标签将用于存储ID、元数据、日志信息、以及数据活化结果等信息,从而记录数据从产生开始后全生命周期中的各种活动信息,为未来数据的使用提供完整的记录。
数据融合挑战与应对措施
数据已经慢慢变成了关系城市经济和社会发展的战略性资源,城市本身是典型的数据密集环境,城市的运行涵盖环境检测、城市交通、公共服务、居家生活、经济商务、健康管理、公共安全等诸多方面。随着城市数据规模呈爆发式增长,越来越多的数据带来了大量的应用和商机,但是数据量的高速膨胀、数据无意义的冗余、数据原有关联的割裂又对信息的充分利用形成严重制约,同时数据可能关于某一时间、空间、人物、事件或者对象是有联系的,是相互关联的,现有的数据组织和处理并未充分体现这些关联性,而这些关联性往往对解决城市的管理与服务问题具有重要价值。如何更充分、更智能地发挥数据的作用是智慧城市未来发展的必然趋势,也使得数据融合成为了一个最重要的能力建设方向。为了解决数据融合的挑战,则需要从技术创新、管理体制、标准建设与国际合作等方面进行深化建设。
首先要加强技术创新,只有技术手段的更新,才使得数据融合成为现实,为此,需要建立起领先的“智慧城市”数据融合技术概念体系,推进技术创新投入,增强技术创新能力。同时,进一步加强创新体系建设,激发技术创新的内在动力,形成一系列具有自主知识产权的技术、产品和专利。此外,大力推动基于数据融合的应用推广,从真实应用需求角度指导数据融合技术的研究方向。
其次,数据融合的实现也以来体制机制的改革。数据融合最重要的是数据能够共享,如何将分散在现有各处的信息化系统中的数据提取出来并共享出来,需要一系列体制机制的保障,对涉及到数据隐私性要充分进行保护,通过共享来促进数据融合技术的发展和应用的推广,并催生新的基于数据融合的产业发展。
数据融合的推动还需要依赖强有力的标准体系进行保障,需要从实际应用出发,围绕其结构体系的共同特征,针对术语定义、设计与实施方法、技术体系、信息分类编码、空间定位、数据质量要求、数据描述、数据交换格式、接口规范等问题进行标准建设,提出一系列标准化的原则和具体要求。标准体系要满足集合性、目标性、可分解性、相关性、整体性、环境适应性等要求,只有建立良好的标准体系,才能使得数据融合无论在技术发展上和共享应用上有章可循。
目前,数据融合类的标准在我国正在开展一系列工作,包括数据采集规范、数据编码规范、开放共享要求以及知识模型等一系列标准都在制定和发布过程中,这些标准的研制在国家标准化委员会的指导下,以国家智慧城市标准化总体组为依托,在不同标准化技术委员会的支持下,以协同编制的方式开展工作,这样才能使得数据融合的技术和标准成为一个紧密融合的体系。
最后,中国在智慧城市数据融合中的技术发展和相应的建设经验,也需要与国内外组织尤其是标准化组织进行紧密沟通,把中国的经验与国际进行分享,在智慧城市的核心关键技术发展和应用领域发出中国的声音。