刘忠:基于开源技术构建沃云自愈服务能力 沃云联通2018年的发展方向主要包括以云为核心的云网络整合,包括集团级专线、省级专线和安全类型。在云与网络融合的背景下,沃云平台的建设思路是在全国范围内建设7个大型沃云基地和各省的本地节点,并围绕这些数据中心建设边缘节点。架构通过集中式云管理平台,包括自助服务系统、运营系统、运维监控系统、云接入和调度中心,可以将业务扩展到全国不同节点。 2018年3月21日至22日,由中国信息通信研究院主办、中国通信标准协会支持的“奥斯卡”在国家会议中心举行。
随着技术的不断发展及其进入深水领域,开源技术与云计算的融合进一步深化,成为工业发展的重要支撑。“OSCAR云计算开源产业大会”将邀请业内众多大公司讨论和交流云计算开源技术、研发、治理和产业化方面的经验,探索开源和云计算创新发展的新途径。
中国联通沃云云计算研究部主任刘忠出席会议,并发表了题为“基于开源技术建设沃云自愈服务能力”的主旨演讲。
以下是这次演讲的文字记录:
刘中:大家早上好!很荣幸能参加这次会议。我来自中国联通。我今天分享的主题是基于开源技术构建沃云的自我修复服务能力。
在讨论之前,有必要回顾一下沃云联通的发展历程。在中国联通混合改革的推动下,沃云进入了一个新的发展时期。沃云成立于2013年,发展至今。在联通的混合改革政策下,一些新的理念得到了调整。在右边,中国联通构建了自己的云,提供公共云、私有云和混合云。在这个阶段,我们提供的服务主要是IaaS。现在,在我们合作的背景下,我们希望丰富我们的产品,并不断丰富我们的业务。我们目前的发展思路是以云为核心,整合政府-企业专线和应用相关产品。此外,我们还丰富和增加了云网络,其中有代表性的包括云宽带、云互联、云专线和云祖先网络。从我们在沃云发展的角度来看,它们为我们提供了促进浩瀚云海发展的原则支持。非常典型的,例如,我们使用DCI技术,混合云两端的私有网络互连是通过DCI实现的。此外,沃云联通的发展方向之一是部署行业云。更多的工业应用将在沃云云的主机上运行。现在我们正在实施医疗云和教育云。在教育云方面,我们主要推广教育云桌面系统。
让我们介绍一下沃云体系下沃云产品的整体系统观。从三个方面来看,公共云、私有云和混合云。公共云不再是新闻。它与阿里和腾讯有合作关系。这是中国联通思维的转变。现在阿里和腾讯的一些产品可以在沃云的公共云上开放,主要包括计算、网络、存储、安全和PaaS。中间是私有云,这也是我近年来的主要方向。我们联通的私有云客户主要是政企客户,如大型省级电子政务云,如辽宁的政务云、河北的政务云、青海的政务云,以及大型企业的私有云,如最高人民法院和铁塔公司。沃云在服务这些客户方面积累了很多经验,这表明私有云的应用业务系统负载很重。这些是我们沃云在构建公共云时没有面临的问题。现在随着时代的变化,例如,我们在私有云,沃云也将与其他云服务提供商合作。省级政府云通常由多个云服务提供商联合完成,一个云服务提供商单独签约省级政府云的时代已经结束。在私有云方面,我们将与阿里、腾讯和华为进行一些合作。混合云,我们引入云管理平台,以联通云管理平台为入口,实现混合云。
沃云联通2018年的发展方向主要是云网络融合,包括集团级专线、省级专线和安全类。下文介绍了沃云的总体技术框架。从底层开始,沃云定义了操作系统,并基于openstack和KVM实现了我们的底层功能。除此之外,沃云尝试了许多技术来提供存储能力。目前,它主要是一种超集成方法。如果遇到恶劣条件和高性能场景,它将引入其他存储后端。在网络组件方面,openstack提供的原始方案更具实验色彩,沃云在这方面做了优化。除了这些基本功能,我们还包装和定义沃云产品。云平台是一个高度复杂的系统,它承载着租户业务和我们云平台本身的组件。我们需要照顾和监控它。我们已经完成了分布式健康检查。
以下是今年在云网融合的背景下,卧云坪站的主要思路。沃云在这里建设的主要思想是,我们在全国有七个大型沃云基地,每个省有一个本地节点,围绕这些建设边缘节点。这是合作背景下沃云公共云合作平台的能力。有一个集中的云管理平台,包括自助服务系统、运维系统、运维监控系统、云接入和调度中心,可以将我们的业务分散到全国不同的节点。这样,可以实现资源池分布在32个省份,统一运行,统一调度管理,并通过同步复制技术实现资源池之间的互通和互备。
这是我的主题的核心部分。当我们构建一个复杂的平台时,每个组件服务的自我修复就实现了。春节期间,谷歌云出现了一个客户扩展。从故障分析来看,有一个网络组件卡在里面。谷歌自己的自我修复系统无法处理它,或者杀戮过程是手动重启的。这给了我们很大的启示。一个是自愈组件的必要性及其在大规模系统中的使用范围。因此,经过考虑和实际使用,我们加强了云平台常见组件和开放堆栈中更重要组件的自我修复。自我修复和监控是不可分割的。我们监控资源池中的资源和云平台本身的组件。
以下是我们如何提高沃云资源库的容量。这是我们部署的总体框架。我们首选的部署框架是超级融合。故障域中的节点数量不会像独立框架中的节点数量那样多。我们根据存储池的故障域划分沃云故障域。我们有3-4个细胞。我们将单元下的故障域划分为每个单元3个AZ,适合私有云和公共云的一般部署需求。下面是一个更深入的内容,开放堆栈的优化实践,这是我们的中子-dhcp-agent高可用性,为每个网络设置两个dhcp-agent,并且这两个DHCP-agent位于不同的节点。另一个优化是最初的openstack通常由三种类型的节点部署。独立的网络节点实现L3网络功能,南北流量集中,容易造成性能瓶颈。我们优化了它。我的沃云部署没有网络节点。我将dhcp服务和网络节点的其他定制放在计算节点上,并将它分配给左边服务的中间计算节点。这是我们L3代理的转型。我们使用VRRP协议。我们在两个节点上生成实例,共同提供虚拟路由器服务。
这是沃云对高可用性存储的实践。煤渣卷的实现是开源社区的一个难点。然而,去年有办法做到这一点,使用分布式锁。沃云的方法更直接。我们在每个AZ部署多个卷,并进行定期测试。如果我发现故障卷,我们会将其迁移到系统存储后端进行管理。总而言之,通过开源实现的高可靠性系统架构的增强,第一步是添加冗余硬件或软件,并采用灾难恢复方法。此外,在正常情况下,我们优先考虑本地和内部技术。我们不会为了高可用性而使用其他外部软件,基本上是用openstack内部的软件来实现它们。高可用性包括管理节点的高可用性、前面提到的DHCP/L3高可用性、卷高可用性和沃云管理节点的高可用性。我们所有的openstack无状态都可以高度用于负载平衡。贵宾。管理无状态服务的warm是沃云联通对openstack的贡献之一。warm本身不在openstack中,但它最初是由沃云创建的。其初衷是关注我如何管理虚拟机托管的应用程序,虚拟机托管的应用程序如何合理公开,以及应用程序如何参与租户网络。基于热服务集成组件,我们开发了云缓存和云备份服务。这是温暖的基本框架。通过消息队列,真正做事情的代理服务被访问,这是下面的服务行。这对应于我们不同的服务类型。
业内许多从事openstack的朋友都说联通的沃云openstack什么时候会升级。我也这么认为我们的态度是openstack只是一个为沃云服务的框架,我们对它的定制是深入的。沃云现在所做的定制可能在我们下一个K版本的时候不可用。这是我的态度。
最后,我想引用伟大诗人泰戈尔的《鸟类收藏》来结束我的分享。云谦卑地站在天空的一角,晨光给它戴上了玫瑰色的云朵。云朵填满了河流的水杯,但它们隐居在遥远的山里。
心灵鸡汤:
标题:刘忠:基于开源技术构建沃云自愈服务能力
地址:http://www.yunqingbao.cn/yqbxx/436.html