1、IT故障处理流程规定.doc

上传人:sk****8 文档编号:4073431 上传时间:2019-09-23 格式:DOC 页数:10 大小:1.66MB
下载 相关 举报
1、IT故障处理流程规定.doc_第1页
第1页 / 共10页
1、IT故障处理流程规定.doc_第2页
第2页 / 共10页
1、IT故障处理流程规定.doc_第3页
第3页 / 共10页
1、IT故障处理流程规定.doc_第4页
第4页 / 共10页
1、IT故障处理流程规定.doc_第5页
第5页 / 共10页
点击查看更多>>
资源描述

1、 IT故障处理流程规定 Page 1 of XDocument Number: xxx-xxxx-xxx Doc Rev: BPI Internal Use OnlyD a t eP r o p r i e t a r y a n d C o n f i d e n t i a lD o c . N o .P r o d u c t R e a l i z a t i o n a n d D e s i g n / D e v e l o p m e n t T a s k s P a g e 1 o f 1 4Template number: 950-0001-001 Rev 05Revis

2、ion Change HistoryRevCreation Date (YYYY/MM/DD) Originator Originators functionDescription of Change (ECO#, Brief description)Note 1: Can keep the latest three revision change records;Note 2: Use red triangle marked in the changing area. Printed copies are NOT controlled unless marked “CONTROLLED“Th

3、e information in this document is the property of Boston Power. No part of this document may be disclosed, reproduced, or distributed without the express written permission of Boston Power. Boston Power reserves the right to alter the design and specifications of its products at any time without not

4、ice, as part of its continuing program of product development.“Boston-Power”, “Sonata” and “Swing” are registered trademarks of Boston-Power, Inc., which retains sole rights to their use. Boston-Power, Inc., 2009. All rights reserved.IT故障处理流程规定 Page 2 of XDocument Number: xxx-xxxx-xxx Doc Rev: BPI I

5、nternal Use OnlyD a t eP r o p r i e t a r y a n d C o n f i d e n t i a lD o c . N o .P r o d u c t R e a l i z a t i o n a n d D e s i g n / D e v e l o p m e n t T a s k s P a g e 1 o f 1 4Template number: 950-0001-001 Rev 05目录1. 目的: .32. 范围: .33. 定义: .34. 职责与权限: .35. 系统管理员的职责和权限 .46. 内容 .57. 故障上

6、报方式和故障升级 .68. 应急措施与行动计划 .79. 需要启动的其它紧急管理计划 .810. 紧急计划的终止 .811. 中等故障以上事件处理完成通报和事后总结 .812. 证据保存方式和内容 .913. 维护与解释 .914. 附件 .9IT故障处理流程规定 Page 3 of XDocument Number: xxx-xxxx-xxx Doc Rev: BPI Internal Use OnlyD a t eP r o p r i e t a r y a n d C o n f i d e n t i a lD o c . N o .P r o d u c t R e a l i z

7、 a t i o n a n d D e s i g n / D e v e l o p m e n t T a s k s P a g e 1 o f 1 4Template number: 950-0001-001 Rev 051. 目的:加强和规范 IT 事故/故障的处理和报告流程,保证事故/ 故障的快速恢复,使损失降低到最低。 2. 范围:IT 部提供但不限于以下设备、系统和区域的事故/ 故障2.1 硬件类:IT 办公设备(包括复印机、打印机、传真、扫描仪、投影仪、一体机、主机、显示器等)语音通信设备(但不包含移动智能手机、平板电脑)2.2 网络类:企业互联网(泛指公司与 ISP 连接

8、的 Internet 线路)MPLS、VPN 专线网络/线缆接口2.3 应用和业务系统类应用服务器(包括硬件和操作系统)、业务型 ERP、生产型 MESIT 监控与门禁系统数据库系统互普准入系统视频会议系统考勤就餐系统防计算机病毒系统3. 定义:3.1 一般事故/故障:影响范围限于单个或者少量用户(不超过 10 人)的 IT 故障,不会对其它用户的 IT 系统使用造成大的影响和业务的中断。3.2 中等事故/故障: 关键系统小面积中断,不会造成重大业务影响,不会造成关键系统数据大量丢失或者错误。3.3 重大事故/故障:关键系统全局性或者大面积中断,或者造成关键系统数据大量丢失或者错误的,并且无法

9、在短时间(30 分钟)内恢复。3.4 关键系统主要指中断后会造成业务和管理无法进行的系统:如 AD、DHCP 、DNS、核心交换、路由、VPN 系统、ERP 系统、MES 系统、存储系统、虚拟服务应用。4. 职责与权限:4.1IT 部所有员工均负有处理紧急事件的责任;4.2面对紧急事件,一切以公司利益和人身安全为重;IT故障处理流程规定 Page 4 of XDocument Number: xxx-xxxx-xxx Doc Rev: BPI Internal Use OnlyD a t eP r o p r i e t a r y a n d C o n f i d e n t i a lD

10、 o c . N o .P r o d u c t R e a l i z a t i o n a n d D e s i g n / D e v e l o p m e n t T a s k s P a g e 1 o f 1 4Template number: 950-0001-001 Rev 054.3IT 经理包括 IT 各组(Infra 系统、ERP 业务支持、CIM)经理;4.4IT 经理作为 IT 流程中的控制结点,主要负责对其所辖关键 IT 系统的重大事情进行审批、管理和监控;4.5IT 部门主要负责 IT 事故/故障发生后的事故处理和故障的排除,故障排除过程的记录,故障排除

11、后事故发生原因的调查,后续改进或者预防措施的落实;4.6用户按要求途径报告事故/故障(IT 故障申请单)。5. 系统管理员的职责和权限系统管理人员包括网络管理员、服务器管理员、数据库管理员和客户端管理员。5.1网络管理员1) 提供网络运行保障,确保网络系统的稳定与正常运转,及时解决网络故障;2) 负责网络系统的管理和维护,确保高效、可靠地管理网络资源;3) 负责对网络设备操作系统和配置信息进行备份及恢复;4) 负责或协助服务提供商进行网络设备的调试和安装;5) 负责或参与网络工程的设计和网络设备的选型。5.2系统管理员1) 负责安装和配置服务器操作系统及其它相关软件;2) 负责监控并优化服务器

12、系统资源的使用;3) 负责计划和实施服务器系统备份及恢复方案;4) 负责服务器操作系统及程序的升级;5) 负责服务器系统用户和安全管理;6) 负责为服务器操作系统打补丁;7) 负责或协助供应商进行服务器硬件管理和故障诊断。5.3数据库管理员1) 负责确定数据库的信息内容和结构,并可操作数据库;2) 负责制定数据库的存储结构和存取策略;3) 负责定义数据的安全性要求和完整性约束条件;4) 负责监控数据库的使用和运行,分析数据库的性能并进行问题诊断;5) 负责数据库的改进和重组重构; 6) 负责数据库的安全与日常维护,制定并实施数据库系统的备份和恢复方案。5.4客户端管理员1) 负责客户端用户(网

13、络终端结点的用户)设备的维护;2) 负责客户端用户的安全管理、软件维护和设备的配置及环境管理等。IT故障处理流程规定 Page 5 of XDocument Number: xxx-xxxx-xxx Doc Rev: BPI Internal Use OnlyD a t eP r o p r i e t a r y a n d C o n f i d e n t i a lD o c . N o .P r o d u c t R e a l i z a t i o n a n d D e s i g n / D e v e l o p m e n t T a s k s P a g e 1 o

14、 f 1 4Template number: 950-0001-001 Rev 056. 内容6.1异常情况和紧急事件一般处理流程和响应机制1) 员工发现网络设备、服务器设备相关的异常情况和紧急事件,直接联系 IT 相关经理。同时,对网络设备、服务器设备均有监控系统对其工作状态进行监控,一旦发生服务不可用事件,监控系统会及时监测并就异常情况报警;2) 对于员工电脑或信息系统使用问题,通过提交 IT 故障申请单或通过拨打 IT 热线 3155、3565、3576 电话向 IT Helpdesk 进行报修故障,IT Helpdesk 人员会根据故障现象直接处理问题,或指派专人进行处理;3) 对异常

15、情况和紧急事件应进行分类和记录,应在事后对事件进行分析和汇报。6.2常见异常情况的安全控制措施6.2.1 电力故障应急方案1) 在非正常工作时间,任何人发现电力系统出现异常,有义务及时通知厂务部和安保。厂务部和安保部负责马上联系 IT 部员工说明情况;2) 电力系统出现故障,厂务部安排人员负责检查处理电路故障,同时向 IT 部提供估计停电持续时间和恢复时间;3) IT 部为机房配备 UPS(不间断电源)并定期对 UPS 进行充放电测试;4) 发生电力系统异常后,在 UPS 第一次报警后(估计还能维持半个小时),电话通知正在使用业务系统的 key user 后,开始关闭服务器和网络设备,以防止

16、UPS 耗光损坏计算机设备;5) IT 部跟踪停电详细情况及处理情况,并做好记录,上报给公司安全管理责任负责人。6.2.2 火灾应急方案1) 在机房门口(里外各一个)部署专用气体灭火器(二氧化碳灭火器);2) 当出现火情、火灾时,任何人员都应保持镇静,应及时采用一些简单可行的方法作初步处理,如:使用灭火器、水源、或采用一些灭火措施、手段。如果火情危机机房或在机房发生,必须使用机房专用气体灭火器(二氧化碳灭火器);3) 在对火情、火灾进行初步处理的同时,应在最短时间内通知设施部 EHS 和保安部;4) 若火情较严重时应迅速打电话报警,同时注意个人人身安全。在判断到火情失控情况下,应马上撤离火灾现

17、场到安全的区域;5) IT 部了解火灾情况并做好详细记录,上报给公司安全责任负责人;6) 机房均为电器设备,应定期检查这些设备,减少由于电器故障引发火灾。6.2.3 网络系统瘫痪应急处理方案1) 发现网络故障,立即通知网络管理员;2) 网络管理员检查网络情况,初步确定故障原因;IT故障处理流程规定 Page 6 of XDocument Number: xxx-xxxx-xxx Doc Rev: BPI Internal Use OnlyD a t eP r o p r i e t a r y a n d C o n f i d e n t i a lD o c . N o .P r o d

18、u c t R e a l i z a t i o n a n d D e s i g n / D e v e l o p m e n t T a s k s P a g e 1 o f 1 4Template number: 950-0001-001 Rev 053) 如网络设备发生严重故障,导致网络无法正常运转,应立即通知相关人员或设备供应商,同时启用网络备用设备;4) 如果是线路故障,应立即启用备用线路;5) 如果是网络协议或设备配置故障,应联系供应商及外部技术支持进行诊断,及时确定故障原因并排除故障。6.2.4 病毒应急方案1) 在计算机发生病毒感染情况时应立即拔掉网线,并立即通知网络

19、管理员和安全管理员,对受感染计算机上的病毒进行分析和处理;2) 如果服务器被病毒感染,立即停止服务器的程序和服务,防止病毒进一步扩散。如发现对网络性能或其他应用运行造成影响,应及时拔掉网线后进行处理;3) 使用最新的病毒引擎和病毒库,查杀受感染服务器上的病毒,同时查杀受感染服务器管理的计算机上的病毒;4) 从防病毒中心控制台检查确保所有公司电脑已经更新到最新的病毒引擎和病毒库,防止再次感染相同病毒;5) 如果病毒将系统破坏,导致系统无法恢复,应将受感染计算机上的数据备份到其它存储介质,确保数据不会丢失。对备份的数据也要进行病毒检测,防止病毒再次感染其它计算机;6) 应记录整个事件的分析和处理过

20、程,并形成报告向信息安全负责人汇报。6.2.5 资料备份应急方案1) 发现数据丢失,首先记录故障时间和相关信息,报至 IT 相关业务部门经理;2) IT 部分析故障原因,并采取相关措施;i. 如果是硬件错误,马上启用备用硬件或联系硬件厂商提供服务。如果是硬盘数据丢失,首先尽力采取措施修复并恢复数据,确实无法挽救数据后,作废弃处理。ii. 根据记录,找出距发生故障时点最近的备份,恢复最近时间的备份数据,尽可能降低风险。iii. IT 部做好处理灾难恢复记录。3) IT 部只负责保存在文件服务器的用户数据,不承担个人计算机和个人备份介质上的数据安全责任。7. 故障上报方式和故障升级7.1 涉及适用

21、范围内的所有事故或故障采取先上报后处理的原则,各级人员应严格如下规定在规定时间内向相应管理层上报处理情况。(日常应用业务系统维护除外,该故障升级主要范围指影响全局用户使用业务系统时发生的故障)IT故障处理流程规定 Page 7 of XDocument Number: xxx-xxxx-xxx Doc Rev: BPI Internal Use OnlyD a t eP r o p r i e t a r y a n d C o n f i d e n t i a lD o c . N o .P r o d u c t R e a l i z a t i o n a n d D e s i g

22、 n / D e v e l o p m e n t T a s k s P a g e 1 o f 1 4Template number: 950-0001-001 Rev 05可参考以下表格方式(可根据故障事件的实际发生情况判定)事故/故障类别 上报时限 上报方式 上报对象 上报/通报对象 事件升级时限一般事故 任意方式 IT 部员工 IT 相关经理 根据具体事件处中等事故 30 分钟 任意方式 IT 相关经理 IT 相关经理/总监 8 小时重大事故 15 分钟 任意方式 IT 相关经理/ IT 相关经理/总监注:表中“上报时限” 列中规定的时间均为从发现事故时刻起计算,“事件升级时限”按

23、照上报时间起计算。7.2 对有应急处理预案的事故或故障,相关 IT 人员应严格按照应急预案处理。7.3 事件上报后,超过事件升级时限,此次事件将自动升级,并进入相应的事件通报和处理流程。7.4 紧急支持联系方式IT 服务热线:3155、3576、3565直接电话联系相关 IT 经理或者任何一位 IT 部员工。可参考以下流程导向,进行中等及以上的故障事件处理流程中 等 /重 大 故 障故 障 现 象发 生 时 间处 理 方 式IT工 程 师 /经 理故 障 分 析解 决 故 障建 立 存 档IT总 监预 防 措 施 季 度 汇 总8. 应急措施与行动计划8.1 关键 IT 系统管理责任人没有在第

24、一时间内到达现场的情况下的处理流程:1) 联系系统管理员,得到针对此次紧急事件处理的建议;2) 根据紧急事件的具体情况,选择相应的操作步骤。主要包括如下 3 种情况的处理方法:因具体情况,需要立即停止应用服务或环境,必须立即关闭系统服务或电源的情况;紧急关闭电源后,需要重新开机的情况;因电源、网络故障或其他未知的故障,造成 ERP、MES 的操作系统无法运行,需要尽快恢复关键的 IT 系统运行;IT故障处理流程规定 Page 8 of XDocument Number: xxx-xxxx-xxx Doc Rev: BPI Internal Use OnlyD a t eP r o p r i

25、e t a r y a n d C o n f i d e n t i a lD o c . N o .P r o d u c t R e a l i z a t i o n a n d D e s i g n / D e v e l o p m e n t T a s k s P a g e 1 o f 1 4Template number: 950-0001-001 Rev 053) 在执行过程中,尽量记录屏幕上所显示的信息提示(特别是错误或警告的信息);4) 处理之后,将此紧急事件处理过程、错误信息记录发送给系统管理员;5) 系统管理员按照事件级别分别分类(红、黄、蓝)通报相关人员:紧急

26、级别:红第一时间内通知应用业务的相关 IT 经理,另外根据整个故障的影响程度,通知相关范围的人员,比如关键 IT 系统的用户(例如财务、生产和 HR 部门),或者全公司;紧急级别:黄及时与业务应用的相关 IT 经理联系,并对处理过程做详细记录。将整个故障的情况记录总结,并邮件发送其 IT 经理;紧急级别:蓝对发生的问题,做详细记录。 之后将整个故障的处理过程,整理后存档;如果处理应急情况中,需要重新启动 ERP、MES 的服务或者其它原因,导致关键 IT 系统或者数据库不可用的情况,需要发邮件告知相关系统的使用人员;8.2系统管理员的处理流程:1) 如果系统管理员在场、或者能够及时到达现场,由

27、其负责处理此紧急情况,并同时记录整个执行过程系的警告和错误;2) 按照事件级别分类的 关键 IT 系统紧急事件,邮件通知相关人员;9. 需要启动的其它紧急管理计划9.1如果在公司业务应用需要很快恢复系统的时期发生硬件故障,请紧急联系 DELL 或 HP 的售后服务工程师,在最短的时间内更换硬件;9.2如果是软件故障,可以通过恢复操作系统和数据库的办法尽快使系统可用,参考数据备份流程。10. 紧急计划的终止10.1 查明此次故障发生的原因,解决并采取相关预防措施后才能算本次处理完全完成;10.2 故障处理完毕后,需要填写信息系统故障表。11. 中等故障以上事件处理完成通报和事后总结11.1 IT

28、 工程师在处理完成后应立即向相关业务 IT 经理、总监通报情况,内容包括事故/故障发生时间和内容、各级上报时间、上报人、上报/通报对象、事故处理方式等;IT故障处理流程规定 Page 9 of XDocument Number: xxx-xxxx-xxx Doc Rev: BPI Internal Use OnlyD a t eP r o p r i e t a r y a n d C o n f i d e n t i a lD o c . N o .P r o d u c t R e a l i z a t i o n a n d D e s i g n / D e v e l o p m

29、 e n t T a s k s P a g e 1 o f 1 4Template number: 950-0001-001 Rev 0511.2 IT 相关经理和总监在上报工作完成后应及时组织事故分析会(内容包括:追查事故原因、检讨和总结处理过程、研究可采取的预防改进措施),并负责推动总结出的预防改进措施的落实;11.3 IT 相关经理(每季度)汇总较大以上的故障/事故汇总报告给 IT 总监;11.4 中等以上的事故处理过程及相关分析总结需填写IT 事故处理及分析报告存档;11.5 对 IT 事故/故障分类分级管理,一般故障可不记录故障处理办法。12. 证据保存方式和内容12.1 中等级以

30、上故障书面或邮件描述并签字、回复邮件存档保存;13. 维护与解释本规定由 IT 部每年复审一次,根据复审结果进行修订并颁布执行。本规定的解释权归 IT 部。本规定自发布之日起生效,凡有与该规定冲突的,以此规定为准。14. 附件IT 事故处理及分析报告 (但不局限于此模板)IT 故障处理总流程IT故 障 处 理 流 程处理过程阶 段用 户 提 交 故 障是 否 IT故 障3155/3576通 知 用 户结 案 处 理否IT工 程 师是是 否 完 成 是二 线 工 程 师供 应 商否是 否 完 成 是三 线 工 程 师厂 商否是 否 完 成是变 更 事 件 流 程否电 话 /邮 件 告 知IT故障

31、处理流程规定 Page 10 of XDocument Number: xxx-xxxx-xxx Doc Rev: BPI Internal Use OnlyD a t eP r o p r i e t a r y a n d C o n f i d e n t i a lD o c . N o .P r o d u c t R e a l i z a t i o n a n d D e s i g n / D e v e l o p m e n t T a s k s P a g e 1 o f 1 4Template number: 950-0001-001 Rev 05事故原因及分析预防及应对措施讨论人IT事 故 处 理 及 分 析 报 告日 期 :事 故 时 间 : 事 故 地 点 :

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 重点行业资料库 > 自然科学

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。