本篇文章4700字,读完约12分钟

财务专家:数据中心机房环境电源运行维护管理交换材料 9月27日,在云计算发展与政策论坛和数据中心联盟的指导下,由开放数据中心委员会主办,由百度、腾讯、阿里巴巴、中国电信、中国移动、中国信息与通信研究院和英特尔主办的“2016ODCC开放数据中心峰会”在北京隆重举行。在“工业数据中心技术发展与最佳实践”子论坛的下午,财务专家李宗发发表了题为“数据中心机房环境电源运行与维护管理通信材料”的演讲。 9月27日,由百度、腾讯、阿里巴巴、中国电信、中国移动、中国信息与通信研究院和英特尔主办的2016ODCC开放数据中心峰会在发展与政策论坛和联盟的指导下,由开放数据中心委员会主办,在北京隆重举行。下午,财务专家李宗发在行业数据中心技术发展与最佳实践分论坛上发表了题为《数据中心机房环境电力运维管理沟通材料》的演讲。以下是演讲的全文:

财务专家:数据中心机房环境电源运行维护管理交换材料

金融专家李宗

我将谈三个部分。一是谈论基础设施对当地的重要性。第二部分是谈我国机房环境电源的故障特征。最后,我想与您分享一些关于当前数据中心的操作和维护的更好的想法。

众所周知,在过去的几年里,这个行业的整个数据中心已经建立在一个越来越高的水平上,而后来的运营和维护实际上使得每个行业,无论是互联网、运营商还是金融业,都越来越关注其安全性和可用性。然后,正如我们近年来都知道的,更大的事情是它对社会层面有更大的影响。我给你列出来了。例如,在2011年,整个银行在下午业务高峰时停止营业两到三个小时。当时银监会也发布了风险预警,我是风险预警的起草人。

财务专家:数据中心机房环境电源运行维护管理交换材料

第二,我们都知道银行的电池在2014年着火了。我粗略地计算了一下,仅在2015年,我们行业中就有不同级别的各种业务连续性操作。中国人民银行今年的第一个风险预警是三月份的一家银行的每股收益。电池着火还导致不间断电源的全部数据中断。我粗略地研究过这个。过去,许多部门在设计照明时都使用电动助力转向系统。在我参与的各个银行的方案设计中,我们尽量不使用这个东西,而是用终端服务直接携带它。完全没有必要使用这种电动助力转向系统,因为你有这种东西,它需要维护。说到这里,就在后面,据说在数据中心的维护中,每个人都可能把注意力集中在不间断电源的电池上。事实上,数据中心有五个相当于电池的大部件,其中一个配有应急照明。或者说这是EPS电池,另一个UPS电池不用说了,第三个是大家都知道的,现在这是我们运营商的更多,运营商有很多设备使用DC电源,负24伏,它也有电池,还有一个高低压控制系统二次回路控制电源,很多也需要110伏DC,也需要电池。另一个是发电机的启动电源。众所周知,驱动电池对我们来说非常重要。重要性实际上是一样的。这是电动助力转向系统的房间,是不间断电源的输入和输出。这个房间是用易办事隔开的。事实上,它不会立即烧断不间断电源的输出。然而,因为首先,它有监控。我们也看到了这个房间并对其进行了监控。然后,没有报告监控警报。在第二个房间,甚至还有煤气灭火。它还设置了气体灭火系统。气体灭火系统碰巧在那个区域。它的控制系统坏了,不起作用,不能喷射。当时房间里没有门禁。这不是电子门禁。那是个防火锁。然后电工很紧张,把错误的钥匙还了回去。这又耽误了120分钟。该银行还有一个市中心。市中心此时正在翻修。从这个事实来看,连锁反应引发了这一事件。

财务专家:数据中心机房环境电源运行维护管理交换材料

当然,我们最近也看到主机公司的不间断电源在升级过程中被切断了电源。原因是发电机失去了磁性。理由写得很好。事实上,存在设计问题以及操作和维护问题。例如,它被设计成所有的系统都是并行的单总线系统,并且被在线替换。此时,因为它拥有数十家银行的业务,所以又是一个换班的下午,这在金融业是完全不允许的。不用说,这是一个并行的单总线,每个人都知道它害怕被取代。因为总线的中间将被旁路,电源将供电,他们喜欢使用发电机,并认为我可以控制发电机。我将发电。我切断了电源,提前启动了发电机,他们担心发电机不会动。他们只是把空接通电源,然后整个负载就是不间断电源。众所周知,不间断电源发电机最大的恐惧是负载。如果电容提前9.5,其电负载能量实际上将继续下降。事实上,我也做过实验。当负载很小时,不间断电源和它后面的大功率不间断电源可能会说,即使三分之一的额定功率也达不到。

财务专家:数据中心机房环境电源运行维护管理交换材料

下面也很有影响力。半个城市和几乎四分之一的城市天气最热,因为我有亲戚正遭受着这种天气。停电是我们的电力部门。它实际上是下面的35kV站。当时,根据供电局的惯例,向35kV变电站供电的站内电缆头不太可能以虚拟方式连接。否则,它将由于长期过载而导致峰值。当时,气温持续接近40摄氏度。事实上,电缆头的绝缘层损坏了,导致了故障。最初,35 kv电源位于一个大城市。没有多少家庭。然而,它完全切断了110 kv和220 kv电源。最后,我明白了原因。这个短路恰好发生在供电站的上端,也就是我刚才提到的二次回路控制系统的电池。一旦短路,它必须通过电池DC 110 v来保护上极的其他电站。结果,它的电池没有连接到次级电路。它烧毁了许多变压器、公共汽车和电缆。这导致了相对较大的影响。当然,金融业和所有其他行业一样,其重要性不言而喻。人们多次说过,停留一秒钟将花费数百万美元。现在,这个数字远远超过了这个数字。也许这甚至对广告来说还不够。在金融领域,由于银监会和中国人民银行的监管机构越来越关注这一领域,之前可能已经说过,省级银行的范围将得到通知。现在,事实上,在二级分支机构,这相当于一个地级单位的失败,整个国家将得到通知。特别是《证券法》通过后,金融部门的数据中心也将纳入安全范围。现在,各大银行总行都建立了数据中心,银行安全生产委员会都是领导和董事。

财务专家:数据中心机房环境电源运行维护管理交换材料

那么让我们看看这个断层的特征。这也是从别人那里借来的。根据我20多年来操作和管理数百个数据中心的经验,机房的故障可能最终会达到一半以上,即53%。如您所见,有多种因素可能会导致数据中心出现问题。数据中心故障通常有三个主要来源,一个是先天不足,也就是说,我前面提到的许多城市在设计时就有问题,从设计、规划、建设,然后是供电方案和制冷方案。第二项是设备故障。没有办法买到最好的设备。它永远不会达到1并且会失败。此外,紧随其后的是其早期安装的前三年。许多行业的每个人都知道,在招标时,你将被保证有2到3年的保修期。事情就是这样发生的。这一次是最容易失败的。无论设备有多好,加上它的类型选择和配置将占用一部分。

财务专家:数据中心机房环境电源运行维护管理交换材料

另一个非常重要的问题是操作和维护。一切都是操作和维护管理不当造成的失败。我们看了所有以前的案例,有设计问题和设备问题,但大多数肯定有管理问题。由于时间的限制,每个环节实际上都是可能的,因为我有大量的案例和我们遇到的各种问题。现在你可以看到,最近似乎发生了很多电池事故。当你设计这个的时候,尤其是在金融行业,我们得到了一个二元结构。当然,我不讨厌说TI942。我会告诉我们的国家信息技术小组。事实上,在我们设计了这一系统后,电源系统和制冷系统几乎没有造成数据中心停机。相反,我们现在已经数过了。最后,停止供电。当你设置了很多关键点时,不使用发电机,也不使用电池。这是最典型的例子。因为时间关系,我不需要它

财务专家:数据中心机房环境电源运行维护管理交换材料

然后我总结了事故的全部原因,我会根据我们的经验告诉你。个别设备出现质量问题,再就是设计不合理,日常维护和管理工作不到位,另一个就是很多事故,就是计算机房的旧寿命老化,有应急措施和管理措施,当出现故障时,应急不当造成二次事故。另一个是机房改造过程,因为现在有大量的金融行业,而且大多数数据中心已经工作了十几年。这是因为这也是整个行业发展的一个变化。许多电脑室至今已有十多年的历史了。在这种情况下,很多事情发生在大量机房的装修过程中。众所周知,深圳的一家银行在装修过程中也发生了事故。

财务专家:数据中心机房环境电源运行维护管理交换材料

然后我会给你一个简单的解释。每个人都可以看到,海恩定律每个人都知道,在每个严重事故的背后,一定有29个小事故,300个事故和1000个潜在事故。所有的事故都是数量的积累。起初,所有的电气火灾和开关跳跃都不是一次性的。也许是你的长期过载,或者是长期散热不好,导致绝缘逐渐老化,从而导致其短路。事实上,这说明了一个这样的问题。

财务专家:数据中心机房环境电源运行维护管理交换材料

然后我们将监控银行的环境。我们的综合管理体系将建立相应的管理体系措施。这是一个大概的轮廓。根据这个大纲,我们将制定自己的工作手册、维护手册和应急手册。最后,我们将把本手册细化成详细的工作流程,包括维护方法和工具。这是一个简单的流程。当然,管理办法和细则一般会明确各单位的工作职责,也会有一些一般的要求。事实上,对计算机房的安全有更多的要求。在此基础上,我们将制定机房的操作和维护规范。众所周知,最近住房和建设部以及工业和信息技术部正在联合建立一个标准研究所。当前的数据中心行业过去被称为计算机房,但现在已经转变为数据中心。现在已经颁布了两个国家标准。现在它们只是初稿,还没有正式颁布。另一个验收数据中心已经发布,目前正在进行的是数据中心建设的规范。这是国家发展和改革委员会和工业和信息化部。我们正在努力。这是电子标准协会正在制定的规范,也是设备操作和维护的规范。两个草案都已发表,最近正在讨论一些新的东西。

财务专家:数据中心机房环境电源运行维护管理交换材料

那么我想也就是说,我们认为数据中心的实际运行和维护分为三个部分,一个是日常维护,这包括你日常的值班检查工作。此外,我在预防性维护上花了很多时间,包括定期定性维护、定期维护、定期检查,有些可能是外包的,有些可能是自我维护的,这里做了很多工作。这一切都是为了确保当我在后期有故障时,我能尽早发现故障。然后事情真的出了问题,我们必须做好应急管理工作。事实上,有三大块。

财务专家:数据中心机房环境电源运行维护管理交换材料

那么这些紧急场景,每个单位都会根据不同,根据一些场景的重要程度。但事实上,核心,我们这更重要,需要紧急。那我们来看看整个机房的智能管理。在早期,最早的不间断电源制造商可以给我们带来一个原始的监控板。此时,用户通常使用Excel表格来建立他们自己的资产和设备关系。后来,HCAD发展起来了,我们只是自己做。到2010年,一些制造商已经开始进行免费检测。后来,环境控制被开发出来,现在智能检测成为可能。现在,在环境控制的基础上,我们都知道环境电源管理平台已经建立了近两年,不仅在这方面,而且在热成像,可视化,然后有一些专业和精细的管理系统。此外,环境控制与设备配置管理和资产管理相结合。这两年也很受欢迎。当然,也有一些管理工具被制作出来,也就是让你直接用它作为工具来扮演一些操作者的角色。这是一些管理工具的功能。我们来谈谈这个。

财务专家:数据中心机房环境电源运行维护管理交换材料

还有一些电源管理和控制系统。在原有环境控制系统的基础上,电能质量现在可以处理了。我想一直监控电能质量。如果你面前有这些东西,你会尽早发现它们,直到你真正做出转变,你才会发现错误。当然,有了智能管理,一个意味着有了这一套东西,我可以在活动之前、期间和之后进行分析。这是我的角色,另一个可以解决单位人力不足的问题。第三,有了这个,我可以提高工作效率。第四,通过自动数据收集和分析,可以提高工作效率。有了这个系统,我们都知道,整个银行是实时的,PUE。当时,设置E时没有时间限制。可以说也可以使用节点PUE。你可以说一个月或一年。现在我们都是连续的PUE。你可以用一个月或半年。没有这样一个系统,我们单靠人力无法达到这样一个要求。

财务专家:数据中心机房环境电源运行维护管理交换材料

这样,当我们以后做事的时候,工行不仅是PUE,也是创新。这在银监会获得了二等奖。我们也做了一些事情,说你不仅要考虑你的电力效率,还要考虑空和机柜之间的效率。只有通过全面的方法,我们才能展示您的数据中心是如何节能的。好的,今天我会和你分享很多,谢谢。

标题:财务专家:数据中心机房环境电源运行维护管理交换材料

地址:http://www.yunqingbao.cn/yqbxx/2514.html