近段时间,由于持续高温,导致用电量急剧增加。我们公司今天就遇到突然停电的情况,致使二号机房整体瘫痪。
早上上班后,也没有接到相关停电或限电通知,同往常一样,整理报表及每日工作计划,可是9:15分的时候,正当笔者在电脑前飞快的敲击键盘将昨日的工作计划快整理完毕时,啪,屏幕一黑,不是吧。我快写完了呀,这个时候停电,肺都要气炸了。事情还没完,过了不到1分钟,就接到二号机房负责人的电话,说是机房全部断电,问我该怎么处理?
怎么可能呢?二号机房不是有UPS吗?我在电话里询问发生什么事,二号机房负责人小刘说他也不知道是怎么回事,“不知道赶紧去查呀”,我几乎在电话里吼起来。我之所以这么急是因为公司虽然有两条线路,一条主用线路,供日常Internet使用,另还有条备用线路,此线路就是以备不时之需时使用,方便同国外开电视电话会议,二号机房就承担着备用线路的所有工作。
9:20分,依旧没有找到问题根源,眼看着10:00老板就要同国外的一位重要客户谈订单签合同的事,此时如果因为IT部门故障导致订单取消,后果可想而知,老板不高兴,后果很严重的道理我还是懂的,于是一路小跑赶到二号机房,亲自排查,从接入线路开始查起,分批进行,每两个为一组,果然10分钟不到的时候,找到了原因,因为电量骤增的原因,其中一个主用空开跳闸了,导致UPS跟核心层路由器、三层交换机、接入层路由器交换机之间断开。
问题总算找到了,当惊魂过去后,10:30分,召集IT部所有员工开会检讨此次事件并要求每天定时巡检机房情况,巡检内容包括线路、设备状态(路由器和交换机)、设备接口及其他外在原因(空调是否正常运行、UPS是否工作正常等)。
本文地址:http://www.45fan.com/a/Router/2530.html