本篇文章4869字,读完约12分钟
阿里巴巴基础设施事业部网络平台事业部资深专家陆睿:开放光模块的意义和挑战 9月27日,在云计算发展与政策论坛和数据中心联盟的指导下,由开放数据中心委员会主办,由百度、腾讯、阿里巴巴、中国电信、中国移动、中国信息与通信研究院和英特尔主办的“2016ODCC开放数据中心峰会”在北京隆重举行。在下午的“数据中心网络”子论坛上,阿里巴巴基础设施业务集团网络平台事业部高级专家陆睿发表了题为“开放光模块的意义和挑战”的演讲。 9月27日,由百度、腾讯、阿里巴巴、中国电信、中国移动、中国信息与通信研究院和英特尔主办的2016ODCC开放数据中心峰会在发展与政策论坛和联盟的指导下,由开放数据中心委员会主办,在北京隆重举行。当天下午,阿里巴巴基础设施业务集团网络平台事业部资深专家陆睿在数据中心网络分论坛发表了题为《开放光模块的意义和挑战》的演讲。以下是演讲的全文:
阿里巴巴基础设施事业部网络平台事业部资深专家陆睿
大家好,我是阿里巴巴基础设施事业部网络平台部的陆睿。今天,我很高兴与大家分享我们在过去一年中开放光学模块的经验。首先,让我们谈谈我们对分裂光模块的理解。至于开放数据中心,我们从两个方面理解了开放的含义。首先,从硬件的角度来看,我们希望将光模块变成一个独立的组件,不受系统设备的约束。同时,我们不会局限于一个或几个光模块供应商的解决方案。我们希望通过系统设备和模块之间的互联互通。另外,从软件运维管理的角度来看,我们希望光模块有统一的规范,在运维特性上实现真正的统一,这是我们的理解。
事实上,关于光模块,组长杨说,ODCC网络可以从一开始就开放光模块开始。原因是光学模块在开始时固定在板上后会变得可插拔。技术也非常不同。这些特性使我们可以很容易地从系统设备上拆卸下来。我今天分享的题目是开放式光学模块的重要性和挑战。我主要想谈谈当我们制定开放式光模块方案时,会给数据中心客户带来哪些好处。好处是什么?在同时做这件事的过程中,你会遇到什么样的问题?我们需要建立什么样的能力来解决这个问题?在谈论开放式光学模块对我们的意义之前,我想先谈谈当前数据中心的背景。只有了解了背景,我们才能知道我们在用开放式光学模块做什么。首先,云计算和互联网服务的推广使IDC越来越大,基础设施投资逐年增加。作为一个昂贵的组件,考虑到成本,光模块自然需要一个优化的空范围。一些专家报告了第二个数据中心对高带宽的需求。数据中心的带宽需求几乎每三年升级一次。大约三年前,我们的10,000千兆字节网络进入了数据中心,现在已经引入了25G网络平台数据。预计三年后将对200克和400克网络平台进行评估。第三个背景是光互连市场迅速变化的形势。光互连市场的快速变化使得数据中心客户需要深入介入解决方案。第四个SDN发展促进了白盒开关的应用。谈到光互连解决方案,它落在数据中心客户的肩上,不能依赖交换机制造商提供解决方案。第五是对低能耗的需求。众所周知,数据中心网络设备的功耗不是很大,主要是服务器。然而,光模块本身的功耗是最低的,从1.5W到4.5W。功耗仍然有很大的不同。从功耗的角度来看,还有一些优化空,如何做一些绿色环保的考虑?光学模块也有一定的意义。
第二个背景是数据中心光互连的成本。10G和40G平台的光互连成本占数据中心网络成本的一半以上。预计在未来评估的25G和100G中,光互连成本的比例将会上升。
第三个背景是,奥特长期以来一直在评估和研究北美的开放式光学模块。首先,facebook披露了他们在OCP的开放式光模块管理计划。在北美的一家OTT公司,ODM开始变得更加开放。
背景技术完成后,我自然会谈到打开光学模块带来的好处。主要有五个好处。第一个非常直接,降低了成本。第二是帮助我们的数据中心客户为自己选择最合适的互连方案。第三是帮助找到光模块制造商,使定制的功能,并可以进行有针对性的操作和维护管理。第五,在光互连技术的发展过程中,可以选择多种适合自己的技术来引领行业的发展。
许多数据中心客户打开光模块的最早原因是为了打破交换机的绑定,实现不同交换机的互连。一是数据中心客户直接从光模块制造商那里购买光模块。系统制造商和交换机制造商的供应链不同,因此不同交换机购买的光学模块的成本也不同。如果开关制造商有强大的供应链能力,他们可以获得更好的光模块价格。如果白盒供应商带来高价格。此外,在我们移除绑定之后,我们不需要为每个交换机准备库存,这可以简化库存管理。第二是与光互连提供商直接通信,以获得更好的服务。此外,我们可以与光模块供应商建立战略合作关系,并拥有灵活的业务战略。最后,它引发了IDC客户的光互连产品供应商的技术和成本创新。
第二个好处是可以控制自己的最佳方案。许多人都见过这个数字,这是一个常见的数字。当解决不同连接长度时,它用于评估不同光学模块类型的成本优势。对于不同的曲线,蓝色的是最贵的光缆单价,并且光互连的成本每隔一段距离就快速增加。当我们制作这张地图时,我们需要根据我们自己的实际情况画这张地图来做一个计划。我们不能根据供应商提供的数据制定计划。我们可能得不到最好的计划。第二个假设是这张地图做得很准确。接下来,根据不同的情况,最长连接长度是多长,平均连接长度是多长,以及管理成本的考虑。例如,您的最大长度已达到500米,这意味着必须使用CWDM4。如果连接长度集中在100米,在制定计划时应特别优化100米以下的连接长度,并选择SR4。对于100米至2公里的少量连接长度,建议从管理的角度只选择一个CWDM4。
定制,光模块本身就是一个非常标准的产品,有很多标准定义得非常清楚,大家一定有很多疑问为什么要定制?定制在最早的时候,许多设备制造商都在定制,在光模块标签中植入他们自己的信息,以区分公共光模块之间的差异。事实上,我们可以这样定义它,这便于我们跟踪制造商提供的光学模块之间的差异。此外,定制将对光模块供应商的设计或生产产生很大影响,并且不会影响太多成本。事实上,还有非标准产品。还有进一步的定制以直接控制上游供应链。
开放式光模块带来的另一个好处是操作和维护管理。我们的许多交换机都以光互连作为物理传输的基础。如果这个地方的光互连出现故障,如果我们没有技术能力,故障往往要靠交换机供应商现场解决。如果我们控制开放式光模块解决方案的技术,我们可以解决由光互连引起的故障,而无需依赖供应商。二是制定相应的日常监测方法。如果光缆点不良或光学部分脏污,则说明已达到临界状态。随着时间的推移,在光老化后,可能会有变化,导致整体接收质量下降。如果建立了日常监控方法,我们可以很早就发现异常连接,尽早制定一些解决方案,并在早期解决问题,而不会出现影响网络性能的严重事件。最后,由于我们可以使用自选的光模块作为质量监控手段,我们可以统计数据中心光模块的效率,甚至是工作中的效率,这直接要求光模块供应商进行质量改进,对运营和管理也很有意义。
最后,关于技术发展,如果你参加了会议,下一个200克,400克,和目前正在评估的25克,100克,这些速度,加上越来越多的光模块封装形式的出现,新的QSPD等。,产生了新的编码方法。去年,CWDM从以前的SR和一些波分技术引入。这些技术可以被安排和组合成许多光模块解决方案。哪种解决方案适合我们?如果你不知道技术,也不知道光互连的要求,你最终可能会选择错误的方向。因此,上述原因导致打开光学模块的巨大好处。
打开光学模块会带来很多好处。我们不擅长照明。我们可能会带来许多挑战。这些问题需要通过建立一些相应的能力来解决。首先,第一个测试规范,我们测量什么?我们会错过一些测试吗?错过测试的潜在风险是什么?第二光模块和开关具有高速信号,这是一个相对专门的领域,容易引起问题。第三个光模块识别,由转换机做软件切换,你的模块是否能被它正确识别。对于第四个数字诊断,如果在数字测试中忽略什么会导致什么后果?最后是温度范围。光模块的温度不仅取决于其自身的功耗,还取决于开关。最后,运行维护管理中需要解决哪些问题?
首先,我们认为光模块分为五个主要测试项目。第一个是参数测试,不依赖于其他系统。这主要取决于所有的光学参数和电学参数是否符合标准。第二个模块配合设备的兼容性测试。我们使用很多设备。交换机数据中心客户使用多台交换机。对于模块和交换机之间的兼容性测试,该测试一方面进行业务测试,另一方面进行秘密读取。第三种异常操作测试,如快速插拔,主要考虑光模块机构设计和热插拔设计。也有极限测试,包括温度规格范围和支持电缆长度范围。测试是为了限制。对于极限试验,还建议增加一些余量,温度将在端部上下增加5度。对于长纤维,建议超过测试的支持规格。原因是我们得到的样品数量有限,而且必须有一定的设计余量。否则,大规模装运会有一些兼容性问题。在上述测试完成后,我们认为小批量样品的选择测试已经完成,最后一批灰度测试可以在丝网之间进行。
高速信号是电信号,是光模块和开关的高速信号。为什么问题容易发生?光模块是自己购买的,交换机负责该侧的配置。最容易的问题是两个设备的交接地点。影响因素之一是开关芯片侧的预加重平衡、开关印刷电路板上的布线损耗以及光模块侧的信号预加重和平衡,这些都需要我们进行评估。解决这些问题需要什么样的能力建设?一个熟悉和理解一切的人必须有测试的能力。当然,更高的层次需要高速信号完整性的分析能力。只有当你遇到问题时,这种能力才能被解决。这相对比较困难。数据中心客户通常很少拥有高速信号完整性团队。
然后是光模块识别。我们经常会遇到一个问题,因为当你将一个模块插入交换机时,首先软件会判断你是哪种类型。无论你是主机还是模块,你都看到之前那一方没有编写标准,或者交换机软件认为自己不够全面,并插入光模块来识别主机。也许在当时的测试中不一定有问题,当大量端口被发现不能工作时。然后是光模块的制造商、生产编号和序列号信息,便于光模块的管理。有必要测试心脏的显示以及读数是否正确。
然后,数字诊断功能主要用于监控我们日常操作和维护的信息。第二次,当将来有故障时,可以进行远程诊断。阅读这些信息有什么问题吗?我们主要关注的是数字诊断功能测试的准确性测试,标准中对此没有太多的定义。我们需要注意的是精确度对温度很敏感。该试验在常温下可能满足要求,但在低温和高温下可能不满足要求。这需要在测试过程中注意这些问题。
关于温度范围,这个地方的人经常理解一些问题。他们认为最终的温度范围是0到70度,IDC的正常环境温度是0到40度。事实上,他们不理解这种方式。运行中的光学模块的表面温度等于当前环境温度加上光学模块的温升。哪些因素决定了这一点?不同功耗的光模块的温升也不同。不同开关的光模块的温升不同,同一开关不同气流模式的光模块的温升也不同。因此,应特别注意光学模块的温度。尽管北美的许多客户降低了温度范围,但开关类型可能不会太多。如果数据中心的交换机类型太多,可能需要考虑不同交换机的测试结果。
最后,运维管理解决的问题主要是突破交换机软件的限制。商用交换机软件的操作界面操作系统是不同的,如果您想增加功能,您必须请交换机制造商帮助您开发此类操作。我们可以从OCP的开放式运营模式中学习。交换机具有适配权,所有操作程序都在上层开发。另一接口标准的定义优选地具有一定的可扩展性,以便于新功能的未来扩展,例如向光学模块添加新的检测。我们可能需要添加一些扩展的接口,以方便将来新功能的扩展。
最后,开放式光学模块进行了展望。数据中心网络开放光模块是大势所趋。只有具备开放式光模块的选择、维护和管理能力,才能在光互连方案的技术操作和维护中做好细节,这不是一个简单的选择方案,而是在细节上不断优化。有不同程度的开放光学模块。第一步是打开一个统一的规范,自己购买。二是在运行维护中做到个性化需求,统一运行维护管理。第三是像北美客户一样进行在线数据管理。不同的程度并不意味着好坏,只适合数据中心客户的差异化。谢谢大家。
标题:阿里巴巴基础设施事业部网络平台事业部资深专家陆睿:开放光模块的意义和挑
地址:http://www.yunqingbao.cn/yqbxx/2523.html