1、 业务支撑网网管系统规范-服务管理流程分册1中 国 移 动 业 务 支 撑 网 网 管 系 统 规 范服 务 管 理 流 程 分 册中 国 移 动 通 信 集 团 公 司2004 年 4 月业务支撑网网管系统规范-服务管理流程分册2目 录1 综述.32 运维管理流程详述.42.1 事件管理 .42.1.1 事件管理描述 .42.1.2 事件管理目的 .42.1.3 事件管理范围 .52.1.4 相关定义 .62.1.5 流程职责 /角色 .112.1.6 主要内容 .122.1.7 流程衡量标准 .132.1.8 流程图举例 .162.1.9 事件信息项 .182.2 问题管理 .192.2.
2、1 问题管理描述 .192.2.2 问题管理目的 .212.2.3 问题管理范围 .212.2.4 相关定义 .212.2.5 职责 /角色 .252.2.6 主要内容 .252.2.7 流程衡量标准 .262.2.8 流程图举例 .282.2.9 问题信息项 .312.3 变更管理 .322.3.1 描述 .322.3.2 目的 .332.3.3 范围 .332.3.4 相关定义 .332.3.5 职责 /角色 .382.3.6 主要内容 .392.3.7 流程衡量标准 .412.3.8 流程图举例 .442.3.9 变更请求信息项 .46业务支撑网网管系统规范-服务管理流程分册32.4 配
3、置管理 .472.4.1 描述 .472.4.2 目的 .482.4.3 范围 .482.4.4 相关定义 .492.4.5 职责 /角色 .522.4.6 主要内容 .532.4.7 流程衡量标准 .542.4.8 流程图举例 .552.4.9 常见配置元素属性表 .573 运维管理流程关系和运维支持体系.673.1 运维流程相互关系 .673.2 整体运维支持体系 .694 附录.714.1 ITIL 国际规范简介 .714.1.1 ITIL 国际规范简介 .714.1.2 分阶段实施方法 .734.2 名词解释 .761 综述本文作为中国移动业务支撑网网管规范附件之一,将详细描述本期中国
4、移动业务支撑网网管的四大管理功能,及四大管理功能之关的关系,并借助于流程图的实例进行详细说明。运维管理流程包括:事件管理、问题管理、变更管理、配置管理,本附件将分别对其进行定义和描述,包括:管理目的、管理范围、主要内容、职责/角色规划、流程示例等。在本附件最后,还简单介绍 ITIL 的相关内容和实施方法。业务支撑网网管系统规范-服务管理流程分册42 运维管理流程详述根据本期业务支撑网网管系统建设目标,本期运维管理主要实现事件管理、问题管理、变更管理和配置管理,而管理流程是运维管理的主线,它将整个运维管理工作有机地联接起来,下面将对每个流程的内容及其实际应用做一个详细介绍。2.1 事件管理2.1
5、.1 事件管理描述事件管理流程是为IT用户尽快回到正常工作状态而设计,其关心的重点是快速响应、快速恢复,使故障对业务的影响最小化。事件管理流程受事件触发和驱动,所谓事件,是指发生了非常规的运作情况,包括系统崩溃、软件故障、任何影响用户业务操作和系统正常运作的事情、以及影响业务流程或违背服务水平协议的情况。事件也包括一个用户的请求,如,重设用户密码。不是所有的事件都由用户产生,监控管理平台产生的告警也可引发事件。通常由帮助台负责记录事件相关信息,向用户提供对已知问题的处理方法,报告事件和尽快恢复服务,目的是在事件管理阶段获得尽可能高的事件解决率。所有的事件应该基于相关配置元素的关键等级和影响度进
6、行优先级分类。事件管理的责任是记录、分类、调查/诊断、解决已知问题、监控跟踪事件、与用户和问题管理流程交流、最终解决事件。2.1.2 事件管理目的事件管理流程的主要功能是尽快解决环境中出现的事件,保持 IT 环境的稳定性,其目的包括: 在成本允许的范围内尽快恢复服务 快速响应系统监控产生的故障或用户的电话请求业务支撑网网管系统规范-服务管理流程分册5 在线获得帮助 沟通问题解决的状态 进行事件控制 记录事件 就事件的优先级、紧急性和严重性进行分类 分析、诊断,必要时进行升级 监视,并结束事件 支持业务运行 对业务应用提供二级支持 解答有关如何使用的问题 记录关于新服务的需求 记录关于改变的请求
7、 提供一个与业务部门的日常接口 提供关于服务状态的信息更新 新服务的报告 关于即将到来的新服务或事件的通知 进行事后回顾 提供 IT 管理信息 人力利用情况 服务可用性 产品质量 支持效率 供应商服务情况2.1.3 事件管理范围 在BOSS系统运维范围内所指的事件,包括所有与IT基础架构和业务相关的如下事件: 申告 故障业务支撑网网管系统规范-服务管理流程分册6 咨询 业务处理 维护作业工科事件的产生有两类: 由监控管理平台自动发现并产生的告警事件 由用户/IT 维护人员报告的事件但不包括: 外部用户汇报的事件 在开发和测试环境中的设备或系统产生的事件 “事件管理”流程不一定必须找到问题发生的
8、根本原因,其重点在于如何在尽量短的时间内,恢复已经中断的IT服务,提高服务的可用性。2.1.4 相关定义 重分配规则事件的及时、正确分配和接手处理是确保事件在解决时限内解决的关键因素。一线和二线技术人员可以拒绝并根据重分配原则重新分配不属于自己运维范围的事件。 事件性质根据移动的业务要求和管理要求,按照事件性质定义如下六类事件:性质 描述申告 针对 BOSS 系统的 IT 用户投诉故障 指因 BOSS 系统错误或非正常因素由监控管理平台发现的告警事件咨询 指对系统操作、业务流程等方面的求助和询问业务处理 指需要运维人员进行后台数据处理的要求维护作业 指运维人员的日常维护作业或临时进行的维护作业
9、其他 其他性质的事件。 事件来源当接到一个问题时,帮助台人员需要记录事件来源的类型。帮助台的事件来源可业务支撑网网管系统规范-服务管理流程分册7以包括以下:来源 描述用户 来自 IT 用户的事件可以有以下几种记录方式: 电话/邮件/传真-来自用户/IT 维护人员报告的事件 自助开单-用户/支持人员发现问题,直接在服务台系统客户端开单 客服平台-来自客服平台的事件 其他- 其他方式进入帮助台的事件监控管理平台监控管理平台发现的告警事件,通过与服务管理平台接口发送告警信息到服务管理系统中 事件优先级优先级是事件管理的一个关键要素,优先级决定处理事件的顺序及所需的资源,事件优先级可分为四级,如下表所
10、示:事件的优先级分两个层面来定义和确认: 帮助台帮助台在接到来自监控管理平台的告警事件或IT用户报告的事件时,迅速根据事件相关的业务/子业务或IT系统/设备的关键级别及事件的性质,定义该事件的优先级别。如果为紧急事件,立即升级到一线。对于监控管理平台上传的报警事件,应包含该事件相关联的配置元素的搜索代码,帮助台人员据此确定配置元素及其关键级别。帮助台人员可参考下表确定事件优先级:编号 优先级1 紧急2 高3 中4 低业务支撑网网管系统规范-服务管理流程分册8本次事件所对应 CI 的关键级别事件优先级1 2 31 紧急 高 中2 紧急 中 低故障3 高 低 低申告 高 中 低事件性质咨询/业务处
11、理/维护作业中 低 低 一线一线人员在接受到帮助台升级上来的事件后,根据该事件相关的业务或IT系统/设备的实际故障情况,并结合其他相关因素,再次确定事件优先级,如确实为紧急事件,则启动升级机制。确定事件优先级后,即可以确定事件的处理时限,优先级对应的事件解决时限参考下表:优先级 紧急 高 中 低解决时限(小时)4 8 24 48 事件的升级事件升级的目的是确保基于事件的优先级等级及时通知有关技术人员和领导,引起更多的重视,提供合适的资源,从而快速找到解决事件的方案。可根据所要求的处理时间定义事件优先级升级规则,包括不同等级的事件在不同的时间被升级到不同级别的人员:时间优先级即时响应 +15 分
12、钟 处理时限 30% 处理时限 40% 处理时限紧急 A B D E F - -高 A B C D E中 A B C - D低 A B C - -升级组群:A 帮助台 B 一线支持人员业务支撑网网管系统规范-服务管理流程分册9C 二线支持人员D 事件经理E 管理层F 集团公司各省可以根据业务的实际情况调整升级标准。 事件分类根据移动目前的事件种类,事件的分类层次设计不超过三层,第一级分类,称之为“类别”,第二级分类,称之为”子类”,第三级分类,称之为”条目”。本规范给出第一级、第二级分类。各省市根据自己的情况决定是否要定义到第三层。下表为事件分类表举例:类别 子类 条目网络通讯系统服务器基础架
13、构存储系统操作系统数据库中间件双机热备软件系统软件系统监控软件采集计费结算业务客服业务支撑网网管系统规范-服务管理流程分册10业务管理账务管理账务处理一级 BOSS拨测其他空调UPS机柜照明温湿度传感器外设配套设施其他 事件状态代码事件状态代码表明事件所处的处理状态,本规范规定的事件状态如下:事件状态代码 描述新建 新开事件记录分配 事件在帮助台一线处理 一线支持人员已接手处理事件 二线处理 二线支持人员已接手处理事件供应商处理 由供应商处理已解决 事件已找到解决方案关闭 确认解决方案,事件得以关闭 事件结束代码事件结束代码说明了事件是在何种情况下关闭的,本规范规定的结束代码如下:事件结束代码 描述暂时解决 用变通办法暂时解决帮助台 由帮助台人员成功解决已解决一线解决 由一线人员成功解决