云计算平台的自动化运维挑战与解决之道
在信息发达的当今社会,随着线上和线下的各类数据不断增长,科技技术亦随着人们的需求而不断地进步。在随时能拥有海量数据的前提下,大部分企业均能通过云计算的处理和提取后,从大数据中获得有用的信息,从而获取额外的收益。
云计算环境带来的运维挑战
云计算技术的出现改变了传统的数据处理模式,高效并行的大量设备使得计算效率得到数十倍甚至上百倍的提升。目前云计算技术的应用范围极为广泛,给各行各业带来了数之不清的利益与好处,然而同时也给企业用户带来了新的运维挑战,异构的网络环境与多设备的并行给运维工作带来了极大地挑战。传统的运维可能只需维持数十台、上百台的小型机设备,并且各业务系统相对独立,即使出现故障也不会互相影响;但在云计算时代,运维人员需要同时面对成千上万台设备,并且,云平台往往承载着众多业务系统,一旦故障发生,将会影响所有运行在云平台上的业务系统。
云计算环境下的自动化运维
自动化运维是IT运维成熟度的重要指标之一,在云计算时代,随着设备的不断增加,以往简单靠运维人员手工处理的方式,已经很难再适应新的需求,企业需要更多地依赖自动化运维系统来进行处理,从而降低对运维人员的依赖,让运维人员更多的从被动走向主动,去关注企业业务发展和系统的主动优化。
以某省运营商的ITC为例,该中心一直承接着公司的运营数据管理、分析工作,是反映公司的业务情况的重要晴雨表,亦是公司未来战略制定的重要指南针。每天需要处理PB级的数据量,如何保障几千台服务器的正常运转、及时发现问题、自动处理问题是该公司ITC管理人员的重要挑战。
某著名国际商业公司的T监控运维软件是业界熟知的运维管理系统之一,品牌知名度高、在传统小型机时代应用案例也很多,这个也成为该公司的最初选择,但在应用的过程中他们发现该软件的二次开发量很大、而且需要严格遵循国际厂商的产品标准,灵活性差且成本极高。
经过反复甄选,最终用户决定寻找新的解决方案,新炬网络基于开源技术的自动化运维平台在众多候选方案中脱颖而出!据新炬网络执行副总程永新先生介绍,用户之所以选择新炬网络的开源解决方案,首先是其产品灵活的个性化定制能力和成本优势,更重要的是因为该产品沉淀了新炬网络多年的电信级系统运维经验,领先的自动化运维理念及其产品实现,成为可以快速落地的自动化运维整体解决方案。
该省运营商通过快速部署、实现了过万台设备的自动发现、监控告警和自动化故障处理功能,极大地降低了对运维人员的依赖、提升了运维质量与效率,使运维人员的关注点可以聚焦到企业业务上来、轻松应对云计算环境下的业务变化和设备增加。