本篇文章2190字,读完约5分钟

百度高级系统工程师程传胜:25G网络测试与应用 程传胜:女士们,先生们,下午好。在正式开始之前,我想自我介绍一下。我叫程传胜。我来自百度系统部。我负责百度交换机和光模块的硬件。我也在ODCC测试床项目团队中担任项目经理。今天我分享了25G网络和测试应用。 以下是这次演讲的文字记录:

程传胜:女士们,先生们,下午好。在正式开始之前,我想自我介绍一下。我叫程传胜。我来自百度系统部。我负责百度交换机和光模块的硬件。我也在ODCC测试床项目团队中担任项目经理。今天我分享了25G网络和测试应用。

首先,让我们看看为什么25G被选为百度的下一个主流速度。总之,25G更高效、更可扩展、更具成本效益。虽然40g在速度上比25G快,但我们知道目前的40G是由40G实现的,比25G落后一代。假设一个交换芯片有128个局域网设备,总交换带宽和交换容量在25G速率下是最大的,连接的服务器数量和交换容量在25G速率下也是最好的。其次,25G可以更方便地升级到50G和100G。在25G技术出现之前,100G是由10g实现和应用的。现在对于25G技术,4 25G可以实现100G。如果使用PAM4级,50Gb/s的数据传输可以由25G局域网单独实现。

百度高级系统工程师程传胜:25G网络测试与应用

第三,与10G相比,单个Gbit的消耗和成本有所下降。首先,我们来谈谈功耗。我们做了一个比较。开关充满了声光控制器和光学模块。在全蛇形流条件下,25G交换机的功耗约为10G交换机的1.5倍。这样,25G的消耗/千兆比特是10G的0.6倍。再看成本,我们比较了今年年底交换机加上AOC和光模块的估计成本。25G系统的成本大约是10G系统的两倍。因此,25G的成本/利润是10G的0.8倍。我们相信,随着明年25G应用的大量出现,这一数字将会减少。

百度高级系统工程师程传胜:25G网络测试与应用

功耗:25G开关在满载时的功耗是10G开关的1.5倍左右。

第二个因素是25G生态成熟度。25G交换机的应用是一个真正的工程实践应用,所以我们需要25G生态的所有上下游环节都成熟起来,产品才能批量生产。当百度在2015年下半年决定进行25G切换时,我们了解到25G相关的工程技术已经应用或即将应用,当时外部条件比较好。以上两个是选择25G的外部条件。以下是用户需求的内部条件。对百度来说,百度将当前主流网络速度从10G提升到25G有第一和第二个原因。自去年以来,一些Hadoop集群的在线数据流量已经达到10万亿。随着百度云和百度人工智能的快速发展,对网络延时和带宽的要求越来越高。升级到25G对于准备带宽也很重要。

百度高级系统工程师程传胜:25G网络测试与应用

基于以上原因,百度选择25G作为这一代的主流速度。ODCC在2015年开始研究25G。2015年10月,成立了一个网络小组,提出了几个项目,其中一个是25G交换机项目,我是项目经理。ODCC峰会于2016年9月发布了25G TOR交换机规范1.0版。本规范详细介绍了ODCC推荐的25G TOR交换机的硬件架构和核心设计。值得一提的是,这个规范给出了两个不同的规范供开发人员参考。2017年是25G在ODCC爆发的一年。2017年4月,我们发布了25G AOC和100G开放式光模块技术规范。同年5月成立了25G测试床测试项目组,8月发布了25G系列测试规范。许多沙龙交流和工作组会议已经离线举行,一些成员组织出席了会议。

百度高级系统工程师程传胜:25G网络测试与应用

百度25G TOR设计原则。首先是解决10G交换机的痛点。第一个难点是软件和硬件没有标准化。目前,百度在线有三家10Gb交换机制造商。在CPU使用方面,一些制造商使用基于MIPS的CPU,其他制造商使用基于PowerPC的CPU,而硬件系统驱动程序不受控制。中央处理器架构和硬件系统不统一,导致在研发百度操作系统时需要相互适应。三个万兆交换机使用三个百度操作系统镜像的现象,给我们的人力和软件版本管理带来了一些麻烦。第二个是I2C。I2C总线广泛应用于开关系统。AOC、光模块、PSU和FAN的管理大多采用I2C总线。对于可插拔模块,在插拔模块时,I2C总线锁以一定的概率发生。如果这辆I2C巴士没有被隔离,整个I2C巴士都会受到影响。这导致I2C公交车无法使用,给运营和维护带来了一些不便。第三个难点是没有足够的诊断方法,报告的问题记录更少。如果线路上的开关崩溃,我们无法进行远程诊断或远程恢复。我们必须通知现场外包人员手动去商店进行回收,这也是对我们人力资源的浪费。如果交换机未能重启,我们对重启类型和重启原因的记录也较少,问题的故障预警也没有实现。

百度高级系统工程师程传胜:25G网络测试与应用

针对上述难点,我们在制定25G职权范围时采用了全面参与和深度定制的方法。首先,百度将制定详细的硬件规格和核心设计方案。百度依靠我们自己的软件设计能力和硬件设计能力来给出百度想要的交换机的详细规格。通过我们的设计,我们可以解决和避免10万亿交换机的痛点,还可以实现我们自己的一些想法。第二,我们对关键组件有统一的控制。我们选择制造商和型号,并且必须使用我们选择的关键组件。这样做的目的是促进软件的标准化和硬件质量的控制。我们参与了TOR交换机的整个开发过程。这样做的目的是理解开发过程,并确保我们的规范可以实现。

百度高级系统工程师程传胜:25G网络测试与应用

2020-02-12 18:24:58 大数据技术攻克爆发百度大数据助力科学防控 年底和年初,新型冠状病毒疫情突然出现。为了赢得这场没有硝烟的战争,我们需要动员社会各界力量克服困难,勇往直前。

标题:百度高级系统工程师程传胜:25G网络测试与应用

地址:http://www.yunqingbao.cn/yqbxx/1390.html