1、 1 / 18 机房基础设施运行维护管理规范 为保障机房基础设施的安全、可靠、连续、 稳定运行,提高机房基础设施运行维护的科学化、规范化 水平,根据管理办法以及机房运维管理相关 制度,制定本规范。 第一章 总则 第一条 制定本规范的目标是保证机房基础设施稳定运 行。通过落实制度要求,强化机房基础设施基础管理工作, 促进机房运行管理标准化、规范化。 第二条 本规范所指的运行维护对象是指部署在总行机 房的基础设施系统及设备。 第三条 机房基础设施指机房内为生产系统提供运行保 障和运行环境的场地设施。包括容纳生产系统的机房、支 持生产系统运行的供电系统(含UPS 系统) 、空调系统、消 防系统、安防
2、系统、监控系统等配套设施及维护IT 系统的 辅助设施。 运行维护管理指对机房基础设施进行日常运行和维护, 确保各项基础设施安全稳定地运行。运维管理包括日常管 理、人员管理、设备管理、运行巡检、故障管理、应急处 置、档案管理等内容。 2 / 18 第二章 机房运行环境日常管理 第四条 为保证机房生产设备及基础设施稳定运行,机 房应持续保证以下环境要求: 一、机房各区域内的温度、湿度、空气洁净度等环 境条件应符合要求,确保机房各区域良好的工作环境,保 证设备的正常运行,并采取相应的节能措施。 主机房、网络机房、UPS室温湿度标准:温度: 232,湿度:40%-70% ,机房设备不得结露。 二、机房
3、各区域内应清洁、少尘,无悬浮颗粒物,无 积水,无异味。 三、定期完成机房环境清洁工作,保持地面干爽、整 洁、卫生,门、窗、玻璃保持明亮干净,门牌和标签标识 清楚,墙面干净无污迹,贴挂整齐,没有杂物。 四、机房内不得有食物存放,采取措施严防鼠害、蚁 害等。 五、物品如清洁用具、安全用具、记录资料、仪表工 具、门禁卡、设备钥匙等应摆放在指定位置,标识清楚, 整洁有序。 六、温湿度、水浸、烟雾、红外、门磁、摄像机等监 测探头保持性能良好、运行正常。 七、配电柜、箱内外要保持干净整洁、无蜘蛛网和杂 物。闸刀必须使用额定保险丝、禁止使用铜、铁、铝丝等 3 / 18 代替。 八、任何人不得擅自变动机房各区
4、域现有环境及设备 设施。 第五条 机房禁止带入易燃、易爆和危险物品,不得在 机房内、走廊、通道和窗口附近堆放杂物,消防通道、紧 急疏散通道应确保畅通,对机房各区域的电缆井、管道井、 孔洞的防火封堵进行检查,确保封堵严密。 第六条 机房禁止使用各种炉具和电热器具等大负荷用 电设备,严格执行有关明火管理的制度要求。 第七条 机房各区域实施 7x24 小时实时监控,监控录 像最短保存三个月,并能随时调阅。 第八条 机房各区域应实施严格的门禁管理措施,未经 授权不得进入,门禁系统的出入记录应最少保存一年,超出 一年的须下载保存。 第九条 建立定期检查计划,对机房空调、供电、消防、 监控、防磁、防雷、防
5、静电、防水、防盗、防鼠及门禁等 相关设施进行检查、维护。 第十条 机房电气管理应遵循以下规定: 一、机房禁止乱拉临时电源线,必须使用临时线时要 采用双护套线。 二、机房使用的微机必须使用固定电源插座,禁止临 时电源线和活动插线板长期使用。 4 / 18 三、机房配电柜、PDU 和其他输供电设施部件配备的 防雷装置要定期测试与维护。防雷装置受到损坏的、动作 迟缓不起作用的要及时更换。 四、所有电力线、地线线缆必须为一条完整线缆,禁 止中间驳接。 五、电力线截面积应与负载相符,禁止超负荷运行。 增加设备超出原设计供电容量或电力线截面积负载的,应 进行相应扩容或更换电力线。 六、机房应有严格的防尘、
6、防静电措施。进入机房的 人员在对生产设备和基础设施设备进行操作时必须严格按 照防静电操作要求进行。 七、在机房开展安装和使用动力设备、配电设备及供 电线路工作,应严格遵守用电管理规定。未经负责安全保 卫和信息技术部批准,任何部门和人员不得将用电设备擅 自接入供电系统。机房内部用电必须报负责安全保卫和信 息技术部批准、备案后方可实施。 八、所有基础设施电源线室外部分(如空调室外机等) 穿放的保护套管以及室外电源端子板、压力开关、温湿度 传感器等的防水防晒措施应保持完好。 第十一条 机房消防管理应遵循以下规定: 一、机房工作人员必须做到“三懂”“、 “三会”、 “三能”。 “三懂”即:懂得本岗位工
7、作过程和设备的火灾危险性、 5 / 18 懂得预防火灾的措施、懂得火灾扑救的方法。 “三会” 即:会用消防器材、会处理事故、会报警。 “三能” 即:能自觉遵守消防安全规定制度、能及时发现 火险、能有效扑救初期火灾。 二、任何人不能随意更改消防系统工作状态、设备位 置。需要变更消防系统工作状态和设备位置的,必须经机 房运维管理部门负责人批准,重要变更须经部门主管负责 人审批核准。机房工作人员应保护消防设备不被破坏。 三、根据实际情况配备消防设施,对消防设施禁止擅 自搬动和挪作他用。 四、禁止对机房生产设备和基础设施设备使用水、干 粉或泡沫等易产生二次破坏的灭火剂。 五、对于机房内可能发生的局部范
8、围的小型火情,可 以采用现场配备的手提式消防设备进行灭火。 六、一旦出现消防安全事故,应按照机房消防应急预 案处理。 第十二条 机房各区域内设备的安放应符合承重、散热、 抗干扰等方面的要求,不得超出用电和承重负载。 第十三条 机房施工作业指对机房各区域、生产设备与 基础设施的巡检、维护、测试、清洁、勘察和施工改造等; 设备作业指生产设备和基础设施设备检查、安装或变更。 施工作业和设备安装必须遵循以下规定: 6 / 18 一、维护(巡检、测试、清洁等)作业应按照维护规 程要求和作业计划实施。实施非维护作业需有相关主管部 门核准的作业计划及方案。 由外单位人员实施的施工作业和设备作业计划应取得 相
9、关主管部门批准,并按要求安排陪同人员。 二、施工作业和设备作业人员必须遵守各项机房管理 制度,禁止在机房内吸烟、饮食。外来作业人员必须服从 机房工作人员及陪同人员的管理。 三、施工作业涉及线、缆布放及设备、器件安装的, 必须严格遵照机房工艺规范要求和其他技术要求,不得因 作业而破坏机房原有工艺规范或降低机房安全标准。 四、陪同人员对施工作业和设备作业人员必须严格监 督管理,并配合对施工作业和设备安装全过程的安全、工 艺、环境卫生等管理,及时制止可能影响机房安全的操作 及其它违章操作,发现问题及时报告。施工作业和设备作 业结束后,陪同人员应负责检查和验收,并督促现场杂物 和垃圾的及时清理。陪同人
10、员需详细记录过程中所发生的 任何重要问题。 五、因施工作业和设备作业需要使用电缆槽道、桥架、 竖井、爬梯时,需获得维护部门的同意;需要对电缆孔洞 进行拆封的,必须征得负责安全保卫同意;完成后必须遵 循“谁拆封,谁恢复”的原则,进行规范封堵。 7 / 18 六、禁止设备外包装在机房内开箱、并禁止在机房内 堆放设备包装、材料等。 七、施工作业和设备作业禁止使用明火(如焊枪、喷 灯等) 。确因工作需要的明火作业必须经负责安全保卫批准、 核发动火证 ,并制定安全防范措施后方可实施。 八、禁止使用卤钨灯等高温照明灯具作临时照明,如 确需使用,必须经负责安全保卫批准、核发动火证 ,并 制定安全防范措施后方
11、可实施。 九、使用油机等含油设备、工具时,禁止使用明火。 十、涉及墙、顶、地板等易产生灰尘的施工作业和设 备作业,必须采取严格、有效的防尘措施,并及时清理。 十二、施工作业和设备作业人员每日离场时必须清理 现场,将使用过的机房物品、设备复位,带走临时使用的 设备和工具,不得遗留作业垃圾。施工作业和设备作业完 成后,作业人员应彻底清洁现场,保证机房环境整洁。机 房工作人员应严格监督检查上述清理工作,对违反现场清 理要求的行为及时制止。 十三、禁止将机房作为施工作业和设备作业人员的休 息场所。 十四、设备安装或变更后,作业人员或陪同人员应及 时更新机柜上的设备标签,并向机房工作人员提供设备信 息,
12、包括设备名称、型号、用途、安装位置、设备用电功 8 / 18 率、重量等。 第十四条 机房各区域设计和施工技术资料、机房基础 设施使用手册、机房维修和维护指南,以及设备、供电、 布线等配置文档,应由专人保管,及时更新,保证资料的 有效性。 第三章 机房人员管理 第十五条 由于机房基础设施中与电气相关的工作存在 着固有危险,涉及电气工作必须由具有资质人员和具备合 理安全工作流程的前提下进行操作,并应利用防护设备和 其他控制手段,如上锁挂牌设备,以防止现场人员受到电 击、烧伤、电弧和其他潜在电气安全隐患。 电气工作人员在进行相关工作时应遵守相关法规标准, 包括但不限于:GB 26860 电力安全工
13、作规程、 DL 408 电 业安全工作规程。 不具有电气工作资质的人员不能擅自操作电气设备、 线缆。 第十六条 机房应建立人员出入区域控制:主机房允许 部门负责人、信息安全处、系统网络处、机房运维管理部 门及系统技术负责人进入;网络机房允许部门负责人、信 息安全处、系统网络处、机房运维管理部门人员进入; UPS室允许部门负责人、信息安全处、机房运维管理部门 人员进入。机房各区域出入控制通过机房门禁权限设置控 9 / 18 制。 外部及本部门人员进入未授权区域需按照机房出入管 理规定进行审核、登记,并由有权人员全程陪同。 第十七条 非授权人员不得触碰、移动、损坏机房基础 设施、各种控制开关;不得
14、改变机房基础设施系统、监控 系统配置。 第十八条 机房工作人员要接受基础设施安全培训,包 括安全原则、危险识别、控制风险等内容,掌握基础设施 安全操作技能,确保机房工作人员人身安全。 第十九条 为确保机房工作人员具备履岗能力,应进行 全面培训。包括:机房基础设施的工作原理、操作流程、 应急预案、以及管理制度等。对于机房工作人员应不断提 升理论知识,以便在缺乏操作程序的应急状态下进行正确 的处置。 第二十条 机房工作人员应将机房基础设施历史事件的 总结分析作为培训的重要素材,进行全员培训;对于新员 工应在上岗前予以培训,以避免相同的事件再次发生。 第四章 机房基础设施设备管理 第二十一条 机房应
15、建立完整的基础设施设备登记,并 及实时更新。基础设施设备登记应包括所有基础设施设备 的清单,关键设施设备应记录事件情况、变更情况、维护 保养频次等信息。 10 / 18 基础设施登记应至少包括以下信息:种类、设施设备 说明、制造厂家、产品型号、规格、位置、序列号、投产 日期、维护频次等。 第二十二条 机房基础设施的所有操作,均应事先制定 详细的标准维护流程,经过审核后存档并严格执行。 标准维护流程用于规范和明确机房各项基础设施各项 设施的检查和维护操作步骤。应将操作步骤和要求以统一 的格式描述出来,用来指导和规范日常的运维工作。制定 标准维护流程还应包括所有关键基础设施设备在各种情况 下都能执
16、行的常用操作。例如手动重启UPS的操作流程、 精密空调的温湿度范围控制等。 基础设管理员岗位人员负责制定标准维护流程。 第二十三条 对机房关键基础设施设备的重大维修、安 装操作,应事先制定标准维护流程。可要求外部技术支持 公司提供制定标准维护流程的标准和操作建议,机房运维 管理部门负责最终确认审核,并由部门主管负责人批准实 施。 第二十四条 机房基础设施属于关键设施,应确保外部 技术支持公司及派出人员具备机房基础设施的运维服务资 质。机房运维管理部门应在开展运行维护作业前审查资质 证明、考察专业能力和经验。 第二十五条 外部技术支持人员在现场工作时要严格遵 11 / 18 循机房基础设施操作流
17、程和安全要求,机房工作人员应监 督并及时纠正与制度要求不符的工作方式和行为。机房运 维管理部门负责人应及时协调和处理现场问题。 第二十六条 对外部技术支持公司及其派出人员的现场 管理应符合外包和合作方管理的制度要求。外部技术支持 人员在现场执行维护程序之前,应接受机房相关制度的培 训,并获得机房运维管理部门以及部门主管负责人批准。 在执行维护活动的过程中要严格遵循操作流程。操作 时需由机房工作人员陪同并监督记录流程的执行情况。 外部技术支持人员的巡检、维护、修理工作应提交现 场服务报告并存档。陪同人员登记机房基础设施检修记录。 第二十七条 对于具备条件的机房基础设施冗余设备 (如精密空调等)应
18、设立轮换运行机制,以延长整体设备 的生命周期和节约能耗。 第二十八条 对机房基础设施设备和物理环境应建立完 整的、清晰的标签标识,便于清晰、快捷地掌握区域及整 个机房系统的配电、制冷、消防等关键提示。应至少包括: 设备标识:包括设备名称、型号、编号等; 警示标识:如“设备已带电/ 危险”、 “禁止合闸”、 “禁止 分闸” 、 “自动/手动”等; 12 / 18 物理环境标识:如位置标识、区域标识等。 第二十九条 机房运维管理部门应明确在机房的生产设 备摆放区域、基础设备设施摆放区域、临时设备或工具摆 放区域。 第五章 机房基础设施巡检 第三十条 机房巡检分为每日巡检、每月巡检和每季巡 检。巡检
19、对象包括机房机房环境、基础设施运行、生产设 备运行、机房环境监控系统和集中监控系统等。其中生产 设备运行和集中监控系统巡检要求按照相关制度要求执行。 第三十一条 每日巡检由机房工作人员完成,至少保证 每两小时对机房所有区域进行现场检查,如发生运行故障 或可能影响生产设备和基础设施设备运行的异常情况时, 应视情况缩短巡检时间间隔。 每月巡检和每季巡检由外部技术支持公司和机房工作 人员共同完成,是对机房基础设施、机房环境等的专项检 查维护。重点排查设备运行隐患、解决遗留问题、定期完 成设备部件更换等。 第三十二条 每日巡检应包括以下内容: 一、检查机房设备标识、标签,保持标示、标签清晰 牢固。 二
20、、对机房物品码放进行整理。保持设备、设施和环 13 / 18 境整洁。 三、检查机房环境监控系统运行状况,包括温湿度、 水浸等运行情况,保持性能良好和工作正常,发现异常和 报警信息应及时报告、处理。 四、检查生产设备和基础设施设备的指示灯状态、面 板信息,发现异常和报警信息应及时报告、处理。 五、检查门禁运行情况,检查机房各区域门开合情 况是否良好,有无变形。检查机房外墙窗户的密闭情况, 保持外墙窗户密闭。 六、检查机房各区域上下水管、阀门、供暖等装置有 无漏水、破损、阀门关闭不严的情况。 七、检查机房天花板、墙体、地面有无漏水、渗水、 破裂等情况。 八、检查机房精密空调附件地板有无油污。 九
21、、检查机房各区域温湿度控制是否达标。 十、检查机房各区域配电柜、箱电闸开关闭合情况等 有无异常;检查UPS室和强电间UPS设备有无异常。 十一、对UPS 室和强电间的 UPS蓄电池组各单体进行 外壳鼓胀、开裂、极柱变型、爬酸、渗漏等现象检查,对 各单体电池间连接部位检查是否牢靠。 机房工作人员每日至少需使用测温仪器对UPS室和强 电间的UPS 蓄电池组进行一次全面温度检测,及时发现蓄 14 / 18 电池温度异常情况。 十二、检 查 机 房 各 区 域 内 消 防 报 警 探 测 器 和 消 防 设 备 ,及 时 报 告 异 常 并 处 理 火 警 信 号 。 检 查 内 容 包 括 机 房
22、的 火 灾 探 测 器 ( 烟 感 和 温 感 探 测 器 )、 喷 淋 头 、 防 火 门 、 防 排 烟 设 备 、 消 防 器 材 ( 灭 火 器 、 防 毒 面 具 、 消 防 栓 等 )、 疏 散 标 志 、 指 示 灯 和 其 他 各 类 安 全 设 施 , 发 现 异 常 、 报 警 、 损 坏 等 情 况 应 及 时 报 告 和 处 理 。 十三、检查机房钢瓶间是否存在钢瓶压力不足、阀门 和连接线是否牢靠;检查机房各区域消控设备、阀门是否 存在异常情况。 十 四 、 检 查 机 房 各 区 域 消 防 通 道 、 紧 急 疏 散 通 道 , 应 确 保 畅 通 、 张 贴 疏
23、散 路 线 图 、 应 急 照 明 设 施 有 效 可 用 。 第三十三条 每月和每季度巡检是对机房基础设施设备 运行的专项检查和维护,包括对基础设施设备各部件运行 状态的检测、对易损耗部件(如空调滤网等)和损坏部件 (如损坏的蓄电池等)进行更换、对基础设施设备进行维 护(如清洗空调室外机、清除UPS设备风扇灰尘等) 。由具 有专业资质的外部技术支持人员和机房工作人员共同完成。 外部服务公司应在巡检完成后出具巡检报告,机房工 作人员登记机房基础设施检修记录。 第三十四条 机房工作人员对在巡检中发现的报警信息、 15 / 18 设备仪表提示的异常情况、受损的设备部件、其他影响或 可能影响机房设备
24、运行的异常情况等应及时报告、处理。 第六章 机房基础设施故障管理 第三十五条 机房基础设施发生运行故障或发现各类可 能出现的异常情况,机房工作人员应按照突发事件处理, 必须立即确认,马上处理,不得拖延。 突发事件响应和处置应按照不同等级事件下相应的处 理流程开展。当故障暂时无法排除时,需要逐级报告,进 入事件升级流程。如遇特殊情况,与直接负责人联系不上 时,可越级向上一级负责人报告。 第三十六条 机房基础设施故障处理完毕后,机房运维 管理部门应及时组织故障分析,基础设施管理人员负责记机 房基础设施运行故障登记。重大运行故障应提交故障分析 报告,包括发生的时间、设备、位置、故障影响、故障分 析和
25、原因、故障处理过程说明、故障风险和后果、优化建 议等。 第三十七条 应建立机房基础设施应急预案,并及时更 新。基础设施应急预案应适用于有可能发生的严重故障情 况。基础设施管理人员负责制定应急操作流程。应急预案 用于规范应急操作过程中的流程及操作步骤,确保运维人 员可以迅速启动,确保有序、有效地组织实施各项应对措 施。机房基础设施严重故障场景包括但不限于: 16 / 18 一路市电供电时中断; 双路市电供电时同时中断; 发电机组启动失败; 发电机在带关键负载时故障停机; 单个空调故障停机; 全部空调故障停机; 单台UPS故障停机; 机房发生消防报警; 机房发生严重漏水、渗水,影响生产设备或基础设
26、施 设备运行等。 第三十八条 机房运维管理部门应针对应急操作流程开 展演练工作,演练形式包括桌面推演(可以采取口述与现 场模拟方式) 、实战演练。实战演练应充分评估演练风险, 并针对可能出现的突发事件场景提出应急处置措施,避免 演练过程发生突发事件。 应急演练参与人员应准确掌握应急预案的场景判断和 应急操作步骤。 第七章 机房环境监控管理 第三十九条 机房环境监控系统是对动力、温湿度控 制、漏水等机房环境状态提供实时不间断监测及故障报警 的监控系统,便于机房工作人员及时了解基础设施运行状 态和及时发现异常情况。 17 / 18 第四十条 基础设施管理人员负责管理机房环境监控系 统。对机房基础设
27、施运行阈值的设定应基于安全性、运行 效率和节约能耗的综合考虑,同时相应设置监控报警阈值 等。 第四十一条 基础设施管理人员应根据机房环境监控系 统记录的基础设施运行数据、故障发生情况、设备维修情 况等每年出具基础设施运行报告,针对存在问题提出改进 建议。 第八章 机房基础设施档案管理 第四十二条 机房基础设施档案包括基础设施运行文档 和技术文档。 第四十三条 机房基础设施运行文档包括维修记录、故 障处理记录、巡检记录、值班记录、安全生产检查记录等。 第四十四条机房基础设施技术文档包括但不限于:机 房的规划设计资料及竣工图纸(含建成后变更、改造的) 、 基础设施设备的清单及相关操作文档和保修保养
28、资料、与 基础设施相关的自动操作系统的逻辑图及说明文档、机房 环境监控系统控制点配置表、基础设施验收测试文档、机 房建筑设计资料和竣工图纸。 完整并准确的技术文档是机房基础设施后期运行、维 护、维修、故障诊断、优化改造的基础。 18 / 18 第四十五条 机房基础设施文档管理应严格执行总行及 信息技术部关于档案管理的制度要求,设定文档的起草、 变更、审核、批准、保存、分发等职责权限和工作流程。 第四十六条 机房应建立完整的机房基础设施文档登记 表,并及时更新。机房基础设施文档登记表应包括文档收录、 保存、上交、更新、废除等信息。 第九章 附则 第四十七条 本规范由信息技术部负责解释。 第四十八条 本规范在发布之日起执行。