国家电网
- 发布时间:2017-08-21
- 来源:
- 大 中 小
- 打印
项目背景
国网信通公司承担着国家电网总部、直属单位及一级部署的信息系统运维,涉及200多套业务系统及150多套灾备系统,有近2000台主机和存储系统、1000多套中间件和100多套数据库系统。随着虚拟化资源池和一级部署系统的建设,未来2年,物理设备、业务系统和平台系统的数量将井喷式增长,运维人员的工作量和工作压力进一步加大。目前,一线运维缺乏各类专业运维工具,导致一线运维工作效率不高,面对日渐庞大的数据中心软硬件设备,采用传统人工手工巡检已经难以满足日常巡检准确、及时、高效及全覆盖的要求,主要存在如下问题:
(1)需要巡检的主机、各类系统数量巨大,单纯的人力是无法完成的;
(2)人工巡检不规范,巡检结果质量因人而异,容易产生遗漏、不准确、不及时的问题;
(3)对巡检历史数据没有积累,不能为运维工作改进提供有效的数据支撑。
为此,国网信通公司决定部署自动化巡检系统,通过该系统在人员有限的情况下保证巡检到位、高效,及时预防系统故障隐患,确保信息系统安全稳定运行。
项目目标
通过自动化巡检系统自动收集操作系统、数据库、中间件的运维数据,及时掌握信息系统软件运行信息,实现系统隐患提前预警、预知,确保信息系统更加稳定运行。
系统涉及的范围包括200多套业务系统、近2000台主机系统、1000多套中间件和100多套数据库系统的自动化巡检,巡检项目包括性能、容量、日志、配置信息,实现配置的自动收集,实现定时巡检和即使一键巡检。
系统部署结构如下图所示
下图是系统巡检报告
下图是巡检结果按业务系统展示
下图是业务系统的即时一键巡检,整个巡检过程可以按步骤形象展示,巡检完成后即时输出巡检报告
实施效果
本项目达到了如下实施效果:
(1)实现了国网北京数据中心主要服务器、数据库、中间件、业务系统巡检工作的全覆盖;
(2)巡检工作例行化、标准化、自动化;
(3)异常及时预警,将可能发生的故障消除在萌芽状态;
(4)通过服务器、数据库、中间件配置的自动发现,初步实现了配置数据的自动采集和配置报告。