百度开放云:国内首发物联网云数据库
日前,百度开放云天工智能物联网平台再添一款重量级产品——分布式时序数据库,距今年7月13日百度CEO李彦宏在百度云计算战略发布会上宣布推出天工平台不到3周时间。百度开放云也成为国内首家发布物联网云数据库的公有云厂商。
根据相关研究机构预测,到2020年,将有125亿带有传感器的设备被使用、监控以及自动化部署,届时全球数据总量将超过40ZB(相当于4万亿GB),这一数据量将是2012年的22倍,年复合增长率48%。物联网发展已经成为驱动中国实现自动化生产的关键目标,而物联网大数据将是其中的重要课题。
大数据的存储模型经历了多个发展阶段,其中,关系型数据库在计算机数据管理的发展史上是一个重要的里程碑。数据结构化、最低冗余度、较高的程序与数据独立性、易于扩充、易于编制应用程序等优点,使其一直长期被广泛应用于数据的存储、处理及分析,但随着网络技术和软件技术的飞速发展,人们发现关系型数据库系统虽然技术很成熟,但其局限性也是显而易见:它能很好地处理所谓的“表格型数据”,却对越来越多复杂类型的数据无能为力。
随着云计算时代的到来,云端的拓展也成了物联网的重要趋势之一。百度开放云天工平台此次发布的分布式时序数据库,不仅在原本关系型数据库的优势上给予优化,其非结构化的数据处理方式,也更好的迎合了信息时代下的数据多样化趋势。
时间序列数据——是在不同时间点上收集的数据,反映事物随时间变化而变化的过程。某个锅炉过去24小时内每分钟的温度就是典型的时间序列数据,它的特点是每一个时间戳对应一个数值(在上面的例子里,这个数值就是温度)。在不同的应用场景中,这个数值可以是电流、电压、转速、浓度、分贝、频率,无论是哪种度量,每一个数值都对应一个具体的采集时间戳。
天工平台的时序数据库(TSDB)是一种非关系型数据库。区别于传统的关系型数据库,TSDB针对时间序列数据的存储、查询和展现进行了专门的优化,从而获得极高的数据压缩能力、极优的查询性能,特别契合需要处理海量时间序列数据的物联网应用场景,在工业制造、环境、能源、水务、物流等领域有着巨大的需求。
具体来说,基于云端去中心化架构的TSDB,能够实现数据的海量存储;与传统数据库相比存储效率提升数十到数百倍,极大节约存储空间;高速的检索使数百万条数据的查询得以秒级响应;不仅支持十几种聚合操作,强大的Open API还能使企业得以方便的对接各种第三方物联网应用;此外,基于分布式架构的TSDB采用多副本存储策略,在确保服务更加稳定的同时,更为用户提供快速弹性扩展能力,用户不用再担心丢数据或者无法处理不断增长的海量数据。
此外,TSDB更好的延续了工业用户使用实时历史数据库的习惯,所采用的分布式区中心架构打破了传统架构在性能和容量上的瓶颈,能更好地满足工业等领域处理海量时序数据的需求,方便工业物联网应用更加便捷地搭建在云端,实现海量数据上云,进而与开放云大数据产品与服务快速对接,实现更加高效的数据分析,洞察数据价值。
通过持续技术创新和不断积累行业经验,天工平台日益成为更懂行业的智能物联网平台,在工业制造、能源、零售O2O、车联网、物流等行业提供完整的解决方案。至此,天工智能物联网平台已经发布包括时序数据库在内的物接入、物解析、物管理等一系列产品,据悉后续还会有规则引擎、流式处理等重量级产品推出。随着天工平台的完善和发展,百度开放云将成为争夺物联网市场的重要玩家。