云计算体验与成本双赢背后:需平衡集约、分布部署
云计算本质是一种基于互联网访问的IT服务能力,它具备按需随选的特点,具有良好的可视化体验,同时还具有经济性。按需分配以及弹性伸缩是云最为重要的特征,这种特点意味着云计算不仅可以及时满足各种需求,而且可以动态满足需求的变化。
弹性伸缩特性使网络成本降低
笔者先解释一下什么是云计算的按需分配以及弹性伸缩。以虚拟机为例,如这个时刻网络需要5个虚拟机,下一时刻增加到10个虚拟机,再下一时刻仅需要3个虚拟机,传统的IT模式很难满足这种动态伸缩需求,这种伸缩称为Scale Out/In,适合于原生云应用。而另一种伸缩体现在虚拟机本身资源能力的扩大和缩小,例如这一刻需要4vCPU/8G的虚拟机,下一刻扩大到8vCPU/16G,再下一刻回到4vCPU/8G,还可能包括虚拟机硬盘的伸缩,在这种伸缩的实际操作中,资源扩大比较容易,资源缩小则比较困难,通常不建议操作,这种伸缩称为Scale Up/Down,比较适用于传统IT平台,另外这种弹性伸缩一般是自动化的,不需要或很少需要人为干涉,由监控系统监控资源负载情况,基于预先定义的策略自动去调度资源、扩展和回收资源(对于Scale Up/Down这种伸缩在自动化伸缩情况下极其容易出现问题)。
弹性伸缩这种特性对于互联网/移动互联网类应用是至为重要的,而要实现弹性伸缩就要求资源池共享程度高。资源池具有较大的规模,能够实现较好的“错峰填谷”,否则可能造成资源浪费(为了实现扩展,资源冗余度过高)或弹性不足(冗余不足,难以实现按需扩展)。
除了弹性伸缩,云计算还具有经济性和低门槛的特点,成本优势是云计算之所以大获成功的关键之一,成本的降低促使中小企业和个人使用IT的门槛也随之降低(按需弹性也降低了用户使用云的门槛)。而云计算之所以有成本上的巨大优势,并非简单地引入虚拟化技术就能实现的(仅仅实现了单物理机的简单共享能力),而要涉及到全局资源调度能力、产品模型优化(成熟度高的云服务提供商会提供上百种产品规格,以满足各种用户需求,避免用户资源浪费,实际也是资金浪费)、规模化经济效应、服务器高度定制化、 软件定义技术、自动化部署与运维技术、DC机房选址以及制冷电力节能技术的引入等,但集约规模化是最主要的降低成本的手段,有效降低建设、部署、运维的成本。
另外,云计算的应用使得用户体验更优,而复杂度降低。传统IT的部署、应用复杂度都较高,需要专业人员操作,同时准备周期也长,而云计算用户能够像使用互联网应用一样使用云服务,例如可以自助服务、服务迭代优化、用户界面友好等,可以将大量的配置和运维工作交给后台的工程师。
云架构要在集约和分布间平衡
因此,云计算的基础设施需要尽量集约化和规模化,以保障最大化的共享、按需提供资源以及降低成本,但过于集约化和规模化可能无法保障最终用户的访问体验,所以需要在集约和分布两者间实现平衡,为了保证用户使用体验,同时还要保证规模化效应。
公有云服务商通常在数据中心的布局上费尽周章,例如AWS(亚马逊云计算公司)典型的数据中心架构(Region+Available Zone),既要保证有规模,还要离用户需求更近一些,同时更要保证HA,在这方面AWS为行业(公有云)树立了标杆,目前大部分公有云提供商都按照AWS的云数据中心架构进行全球布局。
同时,随着运营商网络功能虚拟化(NFV)的推进,运营商未来将需要构建面向NFV的规模庞大的云基础设施(即NFVI),虽然承载的绝大部分将是软件化的网络网元,但NFVI的部署同样面临着集约化与分布式部署的矛盾。
集约化部署的好处是建设、部署门槛较低,运营、运维成本更低,能够集中实现冗余和灾备,网络架构较为简单,管理统一较为容易,但是比较适合于承载计算存储型的网络VNF(网络虚拟化网元),例如vIMS以及网元转控分离后的控制功能等,不适合于实现接入型、流量型和高转发型的网元。而例如OLT、BRAS、EPC转发设备等(严格说OLT和BRAS如果实现控制分离,控制功能的NFV可以实现一定的集约),涉及到用户网络体验、网络架构调整和部署成本等问题。
分布式资源池体系挑战巨大
因此,运营商的NFVI,无法做到像IT、VAS资源池那样集约化,需要参考网元现有部署位置以及网元虚拟化特点进行分层部署,甚至实现转控分离后,转发功能还需要进一步下沉,以提升用户体验,包括满足未来VR、4K、物联网以及自动驾驶等对带宽和时延要求高的业务需求,例如在本地网的边缘和核心层面的数据中心上进行部署,这样必然导致运营商NFVI的资源池节点体系非常分散,分布式的资源池体系带来的挑战巨大。主要面对的挑战有以下4点。
第一,本地网目前并没有合适的可部署NFVI的机房,需要充分利用本地网CO机房进行DC化改造,这带来CO选址、改造的挑战(有些CO机房改造成本过高,而新建机房又没有资源条件)。
第二本地网NFV容量较小,资源池规模较小,这就带来了大量的分布式的资源池建设问题,资源池的分裂(以及网络条件限制)难以实现共享和调度,建设部署成本也较高(需要分别进行规划、设计、集成部署等),同时每个本地网的DC都需要有容灾的部署,增加了部署成本,另外在资源的维护上压力也较大,人工成本较高。
第三,各地部署节奏、需求和CO资源差异较大,这可能带来的问题是未来NFVI资源池五花八门,很难统一(例如软硬件厂商类型过多,架构封闭性,自成体系,形成一个个烟囱),如何实现资源池统一部署架构,包括与已有资源池的管理架构融合,将是一个巨大的挑战。
第四,管理部署和集成难度很大,未来的分散的每个资源池如何实现统一管理、调度和编排,管理层次和架构如何设计(NFVO、VIM、VNFM等),与现有的OSS、网管如何配合和接口,都带来更多的复杂度。
总而言之,未来的NFV资源池部署既要考虑电信网络设备特点和网络架构带来的分布式部署必然性,又要充分利用云资源池集约化部署优点,充分做好业务和DC规划,通过包括转控分离技术、业务流量分离技术(例如将VOIP、ITMS等业务从MSE/BRAS中分流)等技术实现一定的集约,同时也需要从资源池的部署架构(包括备份、容灾)和管理架构上进行统一规范,避免因为分布式部署带来的架构分裂和管理分散,而形成众多的烟囱式、小规模、封闭式NFVI资源池,同时为将来条件成熟时统一部署NFVI DCI网络,实现统一调度和业务编排创造基础条件。