雷葆华:电信迈向云计算的最后一公里
中国电信2009年开始做云计算部署,并在内部启动天翼云计算计划。2010年成立上海、广东、四川实验室,2011年明确提出云计算专项运营思路。2012年成立云计算分公司,并开始启动两大云基地建设,内蒙和贵州。
中国电信北京研究院云计算产品线总监雷葆华表示,“中国电信最初部署云计算尤其是虚拟化的想法特别简单,提升服务器的资源利用率、降低我们硬件的采购成本、节省电力等。但伴随着带来了一些新问题,传统的物理机部署模式,如果一个硬件出现了故障,只影响业务的一个单一部分。但是虚拟化程度下就会影响一片。”
存储成本上升
雷葆华指出,向云跨越的时候最大的挑战是存储和网络两方面。中国电信希望未来形成一个软件基地的数据中心,能够实现分钟级和秒级的虚拟机生成,包括虚拟机迁移等。
“仔细分析存储和网络方面存在的问题来看,存储有几个方面,一个是存储设备的管理比较复杂。因为存储在传统的产业里面有无数的分支,所以各个厂家都有自己的操作界面。另外一方面工厂存储成本比较高,目前一个云资源的建设当中,成本的比例服务器存储和网络基本上5:4:1。而且现在虚拟化之后,存储要求很低,这时候带来一个问题,因为我们很多时候并不知道虚拟机上面的业务是否重要,看不到上面的业务是被虚拟化抽象掉了。如果这个资源的配比效率不合适,后续就会影响业务。所以为了保证业务相应性能的问题,要配置高配存储,所以也带来了成本进一步上升。”雷葆华说。
最后就是有效保障SLA,因为如果上面云计算的业务出现问题后,其他的LAN集中在一个硬盘上或者是一个站上,这个时候还会带来一定的资源争抢,会对存储带来很大的问题。业界现在提出了一个新的技术范畴,它在中间提出了逻辑的中层,把存储抽象出来,由上面的软件定义层定义真正的SLA。也就是把存储资源实化之后,根据不同的物理设备,分成不同的SLA块。根据业务的要求,高要求、高敏感的业务,分给不同的存储。这样带来两个好处,一个是存储共享了,二是能够满足业务的响应需求。
打通传统IT系统和云网络
雷葆华指出,“业务要求把新的虚机放在新的机房里,要跨越很多网络的问题,这带来了IP地址分配的问题,还有网络维护的复杂性。另外由于用虚机,访问量比较大,这时带来信息的爆炸问题,所以对WLAN的数量限制都是一个新的挑战,最后就是传统的IT系统和云化系统不通。”
云化是一个持续的过程,不是一个断点跳跃的过程。这时很多业务不可能存放在云里面,IT系统还是以传统方式继续维护的,这个时候如何把网络打通成了中国电信亟需解决的问题。
“因为存储的问题用成本还可以解决,但是网络没有突破很难解决这些问题,这也是我们为什么提出了SDN的方法。”雷葆华说。
SDN三种方案
SDN有三种解决方案,首先是基于专用接口的方案,这个是传统的网络设备厂家提供的,目标是简化运维和配置,会有一个集中的控制点,在园区网络里面有核心交换机会作为集中配置点,统一配置全网动态生成,这样能更敏捷的应对IT的变化。
第二种方案是基于开放协议,这个也是业界最新的技术标准。他的本质是将可控制层和转化层进行了分离,分离了以后我可以根据要求去制定流表,根据业务需要改写流标规则,然后放到交换机里面做。这个用的最多是互联网公司,因为互联网提供了一个可能,我可以根据要求定制相关的模式,这样跟我的业务更匹配。他们不需要很大的功能,整个网络的部署和我们的业务的运维达到一体化的整合效率。
第三种是基于叠加网络。这个特点就是将传统的网络向下压,只要求传统物理网络是稳定、可靠、简单的网络,所有的逻辑网络是通过虚拟化的。我们将逻辑网络的传统工作迁移到虚拟化服务器里面管理,这个是实现整个网络的灵活透明管理。
雷葆华认为,SDN从08年开始提出,到现在一共五年时间,现在还处于建一个雏形的阶段。这个时候还有很多的问题,技术难点从下往上,首先是网络设备,主要是在设备的产品和芯片,因为新的字节数要远高于传统的字节数,所以真么样实现芯片上的高效的转发是一个关键问题。也是芯片厂家要攻克的领域。
第二是控制器,控制器的算法、策略、抽象算法等等。这里面还有一个难题就是怎么样做集群?控制器带来了很多好处,但是就带来了一个单点的隐患,如何消除这个隐患?如何保证性能?雷葆华指出,我们的意见是SDN在芯片上是分局域、分专业部署,这也是控制器方面重点研究的方向。
第三是开放接口规范化、标准化。这个目前还在创新初期,但更多的是尝试可能性,找用户的需求在哪里。
如果把网络和存储问题解决,技术上就可以实现网络定义数据中心的架构。雷葆华表示,中国电信正在积极探索和实践。