当前位置: 首页 > 关于新炬 > 新闻资讯 > 正文

新炬网络助力中国智造世界500强企业实现运维数字化转型

2021-07-16 18:16:03
一、项目背景
 

某大型制造业集团(简称A企业)是一家跨领域、跨行业经营的国际化公司,全球有员工9.5万人,下属十多个品牌及企业,全球多个研发中心,分子公司遍及欧洲、北美、亚洲等地区,产品远销百余个国家和地区。

 

A企业高度重视科技创新,并在全球多地设立前沿技术创新中心,确保企业技术水平始终紧跟世界前沿。经过近些年的信息化建设,建设了超百套业务系统,实现90%以上流程IT化,在业界处于领先水平。

 

\

 

A企业大量新系统上线后,IT系统现有超百套业务系统,数千个软硬件设备,信息中心启动了IT运维管理平台的建设工作,完成了硬件平台监控系统建设,实现了对主机、网络平台的实时监控管理,取得了较好的管理成效。

 

但随着近几年来业务的飞速发展,尤其是在企业数字化转型越来越深入的大背景下,单一的基础平台监控已无法满足A企业IT业务支撑管理的需求,运维压力越来越大,面临的主要问题如下:

 

1、业务压力较大,系统架构多样,故障及性能问题较多,缺少整体端到端监控管理能力,如业务、应用、数据库等监控,问题预警及分析定位困难;


2、面向全球供应链及客户,网络环境及业务复杂,缺少对用户体验的实时监控预警,对于性能问题缺少主动分析优化的工具;


3、缺少对于整个IT系统运行质量的总览及评价体系,无法实时掌握IT系统运维的总体态势,导致无法很好地践行主动优化提升。


二、新炬网络数字化运维解决方案


新炬网络以多年大型企业信息化运维管理经验,结合A企业的现状,参考数字化运维能力框架,提出精细化、集中化和可视化的数字化运维解决方案。

 

新的运维管理解决方案,建立从业务应用到基础平台的指标管理体系、质量评价体系、运营优化体系、问题闭环管理体系等,由原来的黑盒不可管理提升为白盒可度量可评价、由被动响应转向优化提升,从整体上提升运维管理能力。

 

1、构建对基础平台、应用、中间件、数据库等的专业监控管理实现精细化运维,实现监控管理的专业化覆盖,构建发现、诊断及优化的闭环管理能力;


2、通过对各运维监控子平台的数据统一管理,实现运维数据的打通融合、关联分析能力,构建以应用业务为视角的集中运维管理及端到端分析诊断能力,快速总览和诊断各业务系统运行状况;


3、通过构建运维管理指标体系,实现系统及软硬件设备运维管理的标准化及可度量,实现运维管理及运行监控的可视化,随时随地掌握IT业务系统运行状况。

 

\

方案总体架构

 

主要建设内容如下:

 

1、精细化指标体系

 

\

 

对各类资源或组织节点进行监控指标的覆盖度、完善性评估,建立规范的指标体系。以“质量、效率”为主线,基于IT运维组织结构,由“人→职能→对象”逐级精细化指标分解,建立了一份IT业务运行指标体系文件。形成了对IT生产的可用性、业务性能、错误率、健康度等系列关键运行质量指标的可视、可度量能力。

 

2、集中化统一监控

 

在原有基础平台监控的基础上,补充应用、数据库、中间件的专业监控能力,建设统一监控运维平台。同时集中采集A企业主机、网络、中间件、数据库和业务服务的性能和告警数据,在一个平台里实现基础平台监控、数据库性能监控和应用性能监控,结合拓扑关系构建可视化端到端的定位及分析能力。

 

● 统一告警管理

 

基于精细化指标体系,完成了数百项指标阈值定义;结合现有事件级别,形成了指标3级告警自定义,实现了应用性能、数据库性能和基础平台性能的采集与告警,建成统一的监控告警事件台。

 

\

 

● 用户体验监控

 

通过采集用户客户端的真实用户体验指标,如页面加载时间、访问错误率等指标对用户的体验进行监控,真实还原用户使用体验,为用户体验优化提供数据支撑。

 

\

 

● 应用性能管理

 

收集应用服务器端的应用性能数据,如服务器平均响应时间、服务端吞吐量、服务端错误率用户满意度指标、平均响应时间、健康度等指标用于跟踪交易、分析和定位性能瓶颈等场景。

 

\

 

● 数据库监控

 

对数据库多类指标(性能、安全、资源、状态)进行采集告警,支持层层下钻,快速定位性能瓶颈,自动生成SQL优化建议。

 

\

 

● 可视化端到端分析能力

 

综合拓扑关系数据、性能和告警数据构建可视化、端到端的定位及分析能力。在拓扑图上,通过指标和告警数据的关联、聚合,实现业务运行的实时数据分析及快速的故障端到端定位分析。

 

\

 

3、可视化运营分析

 

定制了平台运行质量、平台承载容量、业务应用质量和IT服务质量维度分析等数十份报表,支持定期(日报、周报、月报)报表与不定期(自定义日期)运营分析,系统运营状况一目了然,看得见才能促进运维质量提升。

 

\

 

● 全球化业务监控

 

实时掌握全球多个研发中心、分子公司的业务访问质量,及时发现故障,解决访问故障,保障业务系统7*24小时的业务稳定。

 

● 个性化运维管理视图

 

针对一线运维、专家和管理人员的个性化需求,建立了领导视图、主管视图、系统视图、告警列表、平台运行质量、业务应用质量、IT服务质量维度等多种视图,助力运维人员的日常运维管理工作。


\

 

● 运维大屏

 

基于运营数据,通过定制化的组件设计和动画视觉效果打造运维大屏,整体展现为企业IT系统的运营工作、为公司领导提供决策支撑。

 

\

 

三、价值收益
 

A企业通过数字化运维能力建设,IT运维管理水平及能力大幅提升,主要收益如下:

 

1、运维管理能力大幅提升

 

通过建立运维指标体系,形成对IT系统运行状态的可视化、可度量管理,从以前的黑盒状态、被动响应,提升为可管理、可评价、可分析、可优化的白盒状态及主动分析差距,稳步提升运行质量的管理体系。由被动救火往主动优化提升迈出了关键脚步。新的数字化运维管理体系,形成了从业务应用到基础平台的指标管理体系、质量评价体系、运营优化体系、问题闭环管理体系等,从整体上提升了运维管理能力。

 

2、建立端到端监控管理能力

 

建立基础平台、数据库、中间件、业务应用的专业化监控能力,实现相关软硬件设备的全覆盖专业管理,同时通过SaaS层(B/S客户端、服务器端)、PaaS层(数据库、中间件)、IaaS层(基础设施)运维数据的统一管理,实现应用业务视角的指标和告警数据的关联、聚合,实现业务运行的实时可视化数据分析,支持层层下钻,综合构建可视化的端到端的监控管理能力。

 

3、提升IT故障预警能力及分析处理效率

 

通过显著提升故障预警效率,大部分影响业务系统运行的问题都在萌芽状态及时预警并处理,大幅提升系统运行稳定性。同时通过统一监控管理平台端到端的可视化监控管理能力,故障处理效率大幅提升,平均故障分析处理时间,由之前的小时级提升到分钟级。


上一篇:新炬网络助力中国信通院编制《数据库发展研究报告(2021年)》,积极推动数据库产业发展
下一篇:新炬网络RPA平台助力OA流程自动化