民族证券自动化运维管理系统
- 发布时间:2017-08-21
- 来源:
- 大 中 小
- 打印
项目背景
中国民族证券有限责任公司成立于2002年4月,是经中国证监会批准的综合类证券公司,公司总部位于北京市西城区金融大街,在全国共设有50家分支机构,主要分布在北京、上海、深圳等大中城市及若干省会城市,并且在鞍山、通化、乐山等多个地区确立了绝对竞争优势。公司是上海证券交易所、深圳证券交易所的会员单位,目前公司拥有上交所席位30个、深交所席位19个。截至2010年末,公司资产总额116.06亿元,净资本14.98亿元,未分配利润4.20亿元。全年累计实现营业收入12.33亿元,累计发生营业支出8.16亿元。实现净利润3.13亿元,公司连续五年盈利。
随着民族证券各项业务的迅速发展、运营管理需求的不断增加以及外部监管要求的不断加强,公司的信息系统数量和系统用户数量不断增加,网络规模迅速扩大。面对越来越多的应用系统、网络设备、主机、数据库、安全设备等IT系统越来越多、越来越复杂,运行维护的工作内容和复杂度随之大幅度增加,对信息系统运维保障的质量要求也越来越高,现有运行维护手段的局限性就愈见突出,具体表现在:
(1) 运维工作占用了大量的人力资源
由于缺乏系统化自动化手段,需要较多的运维人员才能完成对关键信息系统的运行监控和维护操作,运维人员的数量会随着信息系统的增加而不断增加。要改变这种局面,需要梳理整个运维工作流程,建立一个综合自动化运维平台,减少人力资源占用。
(2) 运行维护过分依赖人工操作,效率偏低
各类系统的启动、停止、运行等例行操作和关键业务系统的主从切换、灾备切换操作等均由运维人员手工操作,操作的效率和准确性依赖于人员的技能,操作周期较长并存在误操作的风险。特别地,在主从切换、主备切换等应急处置的时候,由于操作的系统数量较多,完全手工操作无法保证切换的时效性,存在业务中断时间较长的风险,可能引致公司重大损失。只有通过自动化的工具来减少人员的手工化操作,才能保证操作的准确性和效率。
项目目标
随着IT系统的发展及内部用户的增加,一方面系统维护和管理人员的工作负担增加,工作效率无法提高;另一方面系统的安全要求越来越高,当前的运维模式在一定程度上存在安全隐患,从而在实质上降低了系统的安全性。因此,迫切需要一个能为各应用系统、各种硬件基础设施等提供一个自动化的运维管理平台,实现集中的、实时的、可视化的、智能化的运维操作流程自动化处理,确保公司各项业务的持续稳定运作。
因此,本项目的最终目标是实现自动化作业调度操作,使用自动化/标准化操作替代当前的大多数的人工运维操作。在不更改任何应用或只对应用有限更改的情况下,将当前的主要运行操作进行梳理,针对能够标准化操作的日常重复行工作固化至平台中。
实施效果
本项目通过部署神州数码ServiceJet iAuto实现了运维操作自动化,利用工作流程对现有的运维工作进行整合和优化(同时支持可选的手动和自动工作流程调用模式),通过调用已有或者重新开发的脚本,根据作业任务的运行时序及执行逻辑调度其中的作业任务,使其在指定目标设备上运行,以实现以下人工操作的自动化,并实现对作业运行状况的监控:
• 可以固化在程序中的日常标准化操作
• 不能固化在程序中的非标准化操作,即操作随意性大,需要人工判断和干预的操作
• 特殊状态下的应急操作
具体实现流程如下:
序号 | 流程名称 | 流程分类 | 内容 | 优先级 |
1 | 开市流程 | 业务维护操作 | 开盘前准备操作 | 高 |
2 | 闭市流程 | 业务维护操作 | 收盘后操作 | 高 |
3 | 温备切换流程 | 应急处理操作 | 资金服务器切换至温备,重启相关系统 | 高 |
4 | 灾备切换流程 | 应急处理操作 | 关闭数据中心相关系统,开启灾备中心相关系统 | 高 |
5 | 恒生报盘应急流程 | 应急处理操作 | 关闭主机应用、启动备机应用 | 高 |
6 | 交易所报盘应急流程 | 应急处理操作 | 关闭主机应用、启动备机应用 | 高 |
7 | 三方存管应急流程 | 应急处理操作 | 关闭主机应用、启动备机应用 | 高 |
8 | OIW库应急流程 | 应急处理操作 | OIW库切换操作 | 高 |
9 | 清算数据准备流程 | 业务维护操作 | 清算数据准备操作 | 高 |
10 | 测试环境准备流程 | 测试流程操作 | 测试资金服务器启用、行情启动、柜台初始化、报盘启动 | 中 |
11 | 备份流程 | 系统备份操作 | 规定策略备份数据 | 中 |
12 | 重启流程 | 其他操作 | 设备定期重新启动操作 | 低 |
民族证券IT运维部门通过搭建自动化操控平台,获得以下收益:
• 将日常运维操作固化为流程由计算机控制执行,减少外部影响,降低错误风险,提高运维质量;
• 实现日常事务性工作的流程化与自动化,并通过与监控平台的交互,对作业运行状况监控;
• 实现业务流程集中、安全、标准化的访问控制;
• 使用标准化步骤,强制操作合规,防止错误操作的发生。