面对企业IT基础设施规模化、异构化发展与国产化替代进程中的运维难题,本方案依托智和信通智和网管平台打造,以全域感知、智能分析、可视管控为核心,全面覆盖主机、数据库、应用、网络、虚拟化、存储等全栈IT资源,契合中台化架构、三员分立安全合规、多维度权限管控等核心要求,推动企业运维管理由被动响应向主动预防升级,为业务持续稳定运行提供坚实保障。
一、总体架构设计
平台采用中台+微应用架构,底层通过统一数据采集层,适配多源异构IT资源的接入与数据采集;中层搭建数据共享与能力中台,实现数据融通与能力复用;上层以轻量化微应用形式,交付各类运维场景服务。支持横向平滑扩展,可演进为覆盖全业务、多产品的统一运维支撑平台,充分满足企业长期发展与业务扩容需求。
二、安全权限管控
平台原生支持三员分立权限体系,按安全原则分离系统管理员、安全管理员、审计管理员权限,实现权限独立、操作互斥、行为审计,满足等保及行业安全规范。
同时支持精细化权限管控,可依据设备类型、型号、管理域、IP网段、组织架构、业务系统等多维属性,配置用户可视范围与操作权限,实现分权管理、分级运维,确保各角色仅管理权限内资源,提升系统管理安全性与规范性。
三、核心功能解决方案
(一)告警管理:统一告警中枢,智能联动处置
以告警中心为核心,汇聚全产品、全系统、全设备的事件与告警信息,实现统一接入、智能分析、闭环处理与集中展现,支持场景化智能故障定位,有效改善多系统分散运维带来的管理痛点。
告警中心与运维自动化工具深度协同,可依据预设规则自动触发场景化处置逻辑,实现故障快速响应,缩短处置前置时间。通知渠道覆盖屏幕弹窗、邮件、短信、企业微信、钉钉、数据库输出等,确保运维人员实时感知、快速处置。通过统一告警管理,实现故障快速发现、准确定位、高效闭环,全面提升运维效率。
(二)主机管理:全栈覆盖,软硬一体监控
支持全系列操作系统与服务器硬件统一纳管,实现软硬件状态一体化实时监控。系统层面兼容Windows、HP-UX、AIX、Solaris、Linux(Redhat、CentOS、Suse、红旗)及国产麒麟等操作系统,实时监控CPU、内存、进程、日志、网络流量、磁盘性能等核心指标。硬件层面支持HP、Dell、IBM、国产服务器等关键部件监控,通过IPMI协议采集温度、电源、风扇、电压等硬件状态。
提供主机趋势管理视图,支持多指标对比分析与图形化展示,自动生成CPU、内存等资源TOP排名及近一月系统负载排行。支持系统拓扑可视化,全景呈现主机与数据库、中间件、应用的实时关联状态;并提供可用率、性能、告警统计等多维度报表,为运维决策提供数据支撑。
(三)存储管理:统一视图,性能全景可视
支持多厂商存储设备与SAN网络统一管理,实现存储资源全局集中管控。
硬件管理以统一视图展示磁盘阵列电源、电池、风扇等关键部件运行状态,通过颜色标识故障类型,直观清晰;存储空间管理提供全局视角,统计已用/剩余空间、展示数据池使用率排行及未分配LUN信息,避免资源闲置浪费。
性能管理自动生成LUN读写IOPS、传输字节数、存储线路流量TOP排行,定位性能瓶颈;同时统一监管SAN网络全品类设备,支持SNMP、SIM-S协议采集指标,实现异构存储一体化管控。
(四)虚拟化管理:资源池化管控,容量智能优化
支持虚拟化全层级统一管理,实现资源集中管控与容量智能分析。
全面覆盖虚拟机中心、数据中心、集群、宿主机等全节点,实时展示性能指标与逻辑关联,一体化管理宿主机配置、状态与性能;以图形化虚拟化拓扑,清晰呈现宿主机、虚拟机、虚拟网络、数据存储的关联关系,动态展示负载与告警信息。
资源管理支持CPU、内存、存储空间容量监控与分析,提供资源现状评估与未来可用期限预测。支持虚拟机多维度性能分析,结合运行数据识别配置问题并输出优化建议;同时提供告警统计、宿主机运行率等专业报表,支撑虚拟化精细化运维。
(五)数据库管理:多库全面兼容,深度智能监管
支持ODBC、JDBC双模式数据采集,覆盖主流及国产全品类数据库,实现数据库全生命周期监控。兼容SQLServer、Oracle、Sybase、MySQL、Informix、DB2、达梦、神通、金仓、海量、OB等数据库。
实时统计数据库运行状态,包括会话数、死锁数实时排行,重点监控表空间、缓存、锁等核心指标;同时支持数据库日志实时监控,捕获异常日志并提前预警故障,多维度助力数据库平稳可靠运行,支撑业务系统高效运转。
(六)应用管理:全栈中间件覆盖,业务状态可视化
全面覆盖全类型中间件与通用应用服务,实现应用层统一监控、业务状态直观可视。
支持WebLogic、Tuxedo、WebSphere、EAServer、Cognos、MQ、Apache、Tomcat、Jboss、IIS、TongWeb、中创、TAS等中间件实时监控;通用服务覆盖FTP、SFTP、HTTP、HTTPS、POP3、SMTP、DHCP、JVM、Exchange等监控。平台以图形化展示应用所在主机状态与性能,同步显示运维负责人及联系方式,责任明确、协同高效。
(七)网络管理:全域拓扑自动生成,智能高效管控
兼容多厂商、多型号网络设备,支持混合网络自动发现,高效管控复杂网络环境。拓扑生成支持SNMP v1/v2/v3混合管理,良好兼容适配SNMP v3协议设备,可在现有拓扑中自动搜索新增设备,通过IP快速定位接入端口,以专属图标区分服务器与PC终端。
拓扑展示按性能阈值以红、橙、黄、绿四色分级呈现,阈值支持自定义配置;支持多采集域统一展示、图标跨图跳转,提供星型、圆形、树形等多种自动布局,可直接显示线路错包、丢包、实时流量等关键指标,连线支持多样式展示,可按物理线路、地域、逻辑关系分层呈现。
基础管理支持任意IP监控,可探测Ping、TCP端口、URL状态,实时展示IP节点与ICMP可达性;支持Syslog、Trap关键字接收与告警,可自动发现分配IP子网、查询IP历史变更、对异常终端接入实时告警。同时提供多类专业运维报表,实现网络运维全维度可视化。
(八)数据展示管理:拖拽式可视化,大屏灵活适配
平台内置轻量化拖拽式可视化编排能力,搭配严格的视图权限管控机制,创作者可安全共享视图,使用者仅能复制编辑、无法修改原始视图,保障视图内容安全。视图支持自由组合曲线、表格、动态文字、图片、音视频等多元元素,支持视图分组复用,配备丰富基础素材库。
采用BS架构可视化编辑模式,配置灵活便捷,适配低分辨率设备与监控大屏展示;可对接多类外部系统接口,自动抽取、汇总、标准化处理数据,充分满足监控中心、指挥大厅等场景的可视化展示需求。
四、方案价值
本方案基于智和信通自研核心网管平台深度落地,采用中台+微应用轻量化架构,破解传统分散式运维痛点,构建一体化全域运维治理体系。通过统一监控、统一告警、集中管控、全景可视化能力,实现主机、数据库、业务应用、网络、虚拟化、存储等全栈异构资源一站式纳管,打通跨厂商、跨系统、跨域的数据壁垒与管理孤岛。
平台原生内置三员分立合规管控体系,满足等保及行业安全规范,支撑运维流程标准化、闭环化管理;具备弹性平滑扩展能力,可按需演进为多业务一体化服务支撑平台,适配企业长期信息化建设扩容需求。
以集中化治理、智能预警、自动化运维、可视化决策为核心目标,依托全域数据采集、智能事件研判、全景拓扑、数字大屏、分级权限管控等核心能力,有效缩短故障处置时长、降低人工运维投入、削减综合运营成本,全方位保障核心业务连续稳定运行。方案深度适配政企、金融、能源、运营商等复杂IT架构场景,兼顾高安全、高可靠、高效率管控需求,助力客户实现运维模式数字化、现代化升级,夯实企业数字化运维管理基础。