网络运维 设备管控

如何实现网络安全监控运维?

政府单位智慧政务运维解决方案

政府单位智慧政务运维解决方案
    马上咨询

            随着电子政务建设的深入,我国政府的信息化建设已经具备了一定的规模,形成了部、省、市、县四级体系;大型政务服务事项、公文流转、行政审批、费税征缴、信息公开、网格化社会管理、三网融合、智慧城市建设等大量政府核心业务越来越依赖信息化。随着互联网+政务的进入建设期,大多数政务信息系统趋于成熟期且大部分进入维护阶段,政务信息应用系统的网络安全成为重中之重,互联网+政务的安全生产、运维已经成新战略制高点。

    第1章 电子政务建设背景

            20世纪80年代以来,我国政府投入了近万亿元的巨资进行电子政务建设。通过近20年来的持续建设,特别是“两网、一站、四库、十二金”等大型项目的阶段化建设,我国电子政务建设已经取得了初步成效。政府内部公文流转、行政审批、费税征缴、信息公开、信息统计与分析等大量政府核心业务越来越依赖信息化。城市管理和政府公共服务对信息化的依存度大幅增加,公众对政府的信息服务需求日趋迫切。

            到目前为止,投资建设的大量信息系统已进入应用维护阶段,持续可靠提供应用服务的风险已经凸显。长期以来,我国各级政府电子政务投入主要用于解决从无到有的基础设施和系统的建设,忽视了系统建设完成以后的运行维护。电子政务工作沿用建设方式的管理思路与目前发展阶段已不相适应,粗放型的外包管理与政府业务风险防范要求不相适应。

    第2章 电子政务网络运维痛点

            随着我国政府信息化建设高速发展,智慧城市、政务公开、三网融合、行政审批改革、政务云、民生信息化层出不穷。到目前为止,投资建设的大量基础设施与信息系统已进入应用维护阶段,持续可靠提供应用服务的风险已经凸显,政府机构对本土IT运维管理服务的需求逐渐提高。

    具体表现如下:

            1.运维工作定位不准确。目前政务运维工作普遍存在“重建设、轻维护”现象,缺乏专业管理人才与运维平台,太过依赖服务外包商。

            2.海量设备品牌异构,难以统一管理。政务网内的安全设备、路由交换、服务器、智能终端等网络设备品牌多样化,实行各自管理政策,出现问题难以快速发现定位。

            3.设备分布分散,网络覆盖范围大,难以集中管控。政务网延伸至区县镇一级,距离远,设备量大,往往只能维护主干设备,大量的接入设备无法统一监管起来。

            4.网络结构复杂,难以可视化管理。政府部门间通过广域网路由器、网关和防火墙等实现相关部门间的信息互联和共享,网络庞大包含各级政府机关,横纵多级网络结构复杂,运维人员难以可视化管理分布式、异构性网络架构。

            5.业务系统众多,难以实时进行业务可用性分析。从Web网站到网络系统,从政务职能到网上办公都需要IT系统的有力支撑,随着业务的增加通过网络传输的数据也越来越多,确保应用的可用性成为亟须解决的问题。

            6.故障难定位,排障时效低。日常运维工作中多处于“救火”状态,被动地处理各种故障,随着业务不断发展、系统规模不断扩大,故障根因难以定位,用于确定故障及恢复时间越来越长。

            7.运维建设不平衡,工具繁多形成数据孤岛。不同局委办规划建设自成一脉,引入了大量不同的国内外工具,包括监控、日志、数据库等,数据冗余复杂,数据资源分散,数据孤岛普遍存在。

            8.加速国产替代成为紧要目标。由于政府系统业务的特殊性,亟需实现运维平台的本土化,实现国产化IT技术栈的可监、可管、可控,建立信创适配的一体化智能运维平台。

            9.依赖厂商代运维,运维经验无法沉淀。运维工作多依赖设备厂商和外包厂商,业务异常时难界定根因,同时重复、相似故障经验依赖于运维个人能力,经验知识无法沉淀。

    第3章 智和信通电子政务网络运维方案

            “三分建设,七分运维”,运维体系的完备程度已经是决定电子政务服务能力的重要因素。新一代数据中心、网络与政务云等数字政府基础设施、政务应用大量上线,系统架构规模迅猛发展,国产化改造替代深入推进,对IT运维及运营提出了更高要求,运维厂商需应对更多挑战。北京智和信通电子政务网络运维方案,通过对各类网络场景下的跨域资源整合、数据深度挖掘、异常监测、流量分析、态势感知、自动化运维等能力,保障IT基础设施和业务应用的安全、稳定、可靠运行,并利用运维数据资源对业务运营与决策提供有力支持。


    3.1.内外网隔离架构可视化

            政务网络一般分为内部局域网、外部互联网、通信系统和专用线路。在内外网混合的情况下,方案通过内网渗透,打破内外网隔离限制,在拓扑中集中展示双网结构,展现设备实时状态,使用不同颜色、粗细、图标表示被管理对象的状态信息,助力运维人员实时了解网络架构及全网运行状态,快速感知资源、链路、流量等异常信息。

    双网隔离拓扑示意图

    3.2.核心网络架构可视化

            政务网络架构中软硬件环境涉及的技术复杂,厂商众多。北京智和信通通过网络架构拓扑可视化能力,将网络数据从离线表格转移至平台内,从静态的网络架构数据转化为动态智能拓扑,通过树形、平面结构联动展示设备间链接关系,通过按片区、按地域、按层级等多种布局方式划分网络,实现全网设备、资源、链接关系、IP等实时更新、快速定位。

    电子政务广域网拓扑示意图

    3.3.信息中心IDC机房架构可视化

            以2.5D管理视图对数据中心机房运行情况和机柜及各类设备进行统一、全方位、多层次的综合管理,实时分析资源当前性能和运行状态,直观反映资源的动态变化对支撑业务的影响,清晰直观地掌握机房运营中的有效信息。实现透明化与可视化的信息传递,提升机房资产数据的可用性、实用性和使用效率。

    2.5D机房监控示意图

    3.4.更多设备、资源类型监控

    3.4.1.视频设备集中监控

            本方案轻松对接多品牌、型号摄像头,通过onvif接口协议和智能化识别技术进行统一运维,融合网络高清、智能分析、多级管控为一体。支持监管视频监控体系涉及的视频前端设备(摄像头、卡口、编解码器)、传输设备(光纤收发器、EPON 等)、内场设备(网络与安全设备、主机/虚拟机、存储设备)、机房动力环境等多种设备,等统一接入、集中管理。

    政务大厅视频监控效果示意图

    3.4.2.精细化私有云监控

            方案基于对私有云中的系统资源、租户资源的监控,实现云资源的生命周期管理,通过可视化运维编排,进行云管理策略预设配置、云策略批量/定时执行、智能监控巡检。支持多云纳管、持续监控,对云的容量进行智能化分析,为容量优化提供依据。

    3.4.3.设备模型库监管无限制

            方案采取用户自定义设备类型及其设备资源的方式,赋予用户自定义适配设备的能力,更大可能地支持对不同设备类型的支持。通过自定义设备类型及其设备资源,更大限度上提高了智和网管平台的管理范围,真正实现了对设备及其资源的化管理,达到管控万物的目标。


    3.5.实时故障预警,及时洞察异常信息

            方案通过统一的故障管理平台,将各个模块中的监控信息统一采集、分析,实现整个电子政务网中各种事件信息、设备故障、网络异常、流量异常等告警,以智能化手段进行标准化的分析、压缩、并归关联等,通过多种方式实时传达告警信息,保证落实到指定人员进行处理,为电子政务网络提供主动式的故障解决方案。

    3.5.1.全方位采集告警信息

            采集电子政务网络内所有联网设备,如存储、服务器、路由器、交换机、防火墙、虚拟化、云、PTN等设备、资源、应用、服务等状态信息,通过对告警机制以及阈值的设置,即时获取准确的告警信息,快速定位告警设备,提升告警处理效率,降低因设备故障带来的损失。


    3.5.2.异常事件管理

            将事件和告警分离管理,接收设备/服务器主动发送的消息,集中处理后,及时地通知用户,并可以通过集中的管理界面进行管理。接收设备/服务器主动发送的消息,更大地提高了管理的主动性,通过统一界面集中管理事件,降低了管理的难度。


    3.5.3.人工运维与故障自愈结合

            将人工运维与故障自愈结合,无需针对告警进行手动处置,只需预编排告警处理流程,平台根据场景自动触发,实现故障自愈。

            通过实时发现告警,进行预诊断分析,判断告警类型和级别,如果是一般告警,平台进行自动恢复,如果是严重复杂告警则通过告警通知、运维工单等形式通知运维管理人员,进行人工处理。同时,将只能有专家处理的各类操作和判断转化为可存在于平台内的流程,形成可保留可复用的运维知识。


    3.6.IP资产监管

            政务网络安全一直是其运维工作的重中之重,一旦出现非法接入更易出现严重威胁,因此对接入网络中的IP、终端更需严加管理,本方案支持端到端规划、部署、管理和监控IP 地址。通过智能IP扫描能力,定义多层次子网,可手动、自动获取子网信息,并根据网络结构对子网信息进行管理。总览IP网络全局,掌握“IP容量”薄弱点。


            通过黑白名单功能用来检测用户所关心的设备是否在网络中出现及出现时间。支持配置黑名单或白名单,智能划拨规划表中的IP、MAC设置为白名单策略,对非法接入设备进行告警处置。

            对全网MAC和IP进行配对绑定,并周期性对MAC-IP进行检测。自动将规划表中的IP-MAC设置为绑定关系,自动扫描在线终端,当IP-MAC的绑定关系发生冲突时产生告警,保证入网终端安全可信。

    3.7.全覆盖IT资源自动巡检

            信息中心的日常运维工作中需要各类报表记录设备情况,向领导汇报工作内容,采取传统的人工巡检,尤其是应用巡检,缺乏统一的规范、标准,导致巡检的范围和深度都存在一定的局限性,并且是基于人工的手工统计,工作效率比较低,同时耗费较大的人力资源。

            本方案依托平台将以前依赖手工进行的日常巡检转换为自动化、定时执行的巡检策略。制定统一的巡检指标、巡检方式、巡检频度等,保证巡检标准化、巡检范围、巡检深度;通过设计巡检作业、数据采集方式、自动化作业调度等实现日常巡检的自动化,代替手工工作,提高效率的同时,解放管理人员,释放管理人员更多的精力,使更多的精力处理更重要的事项。


    3.8.端到端业务可用性管理

            一办四中心同时存在政府办公业务和公众服务业务,业务体系错综复杂,服务对象多元化;访问地点跨越多个办公大楼,公众服务遍布全省、全市,访问方式多样化,用户终端至业务端访问路径差异大。本方案以保障业务可用性为基础,通过对承载业务的IT基础设施构建真实的业务模型,端到端监测业务可用性,规避业务风险,保障业务可用性。

    电子政务业务系统示意图

            针对业务应用性能与用户体验进行检测分析,无需安装插件即可提供开箱即用的主动拨测试业务监测。直观、便捷地帮助运维人员对电子政务网络内视频会议业务、公务员考试报名灾备系统、行政对外服务门户网站、电子监察系统、舆情系统、行政并联审批系统及其他非固定业务等进行监控,掌握业务的运行状态和健康水平,了解业务动态变化趋势,快速定位故障源,降低运营风险。

    电子政务业务看板示意图

    3.9.全网带宽、流量监控与回溯分析

            方案基于海量流量数据的存储挖掘,实现对网络流量的侦测分析。通过网络流量分析技术,采集、分析、存储所有网络流量,回溯分析数据包特征、异常网络行为,以多维数据分析和深度挖掘为手段,实现数据包层面的流量追踪,发现潜伏于网络中的未知攻击。


            提供设备、接口、IP、服务、应用、会话等层级的带宽监控,实时监控带宽使用趋势与带宽占用分布,并通过图表展示,快速识别网络带宽滥用,分析高带宽使用情况,识别带宽消耗较大的应用程序、服务、协议或 IP 地址,避免网络容量过载,并提升更终用户网络体验。

    3.10.跨厂商设备集中配置管理

            政府部门的信息化建设的扩大,不光是基础设施包括软件应用层方面的需求也急剧扩大,网络承载的业务经常发生变更,面对业务的变更运维工程师往往要对大量设备进行操作,而不同批次购置的设备,品牌、型号不尽相同,运维人员需要在多个管理平台来回切换,此时如果依靠工程师逐一登录设备进行命令下发、策略配置,将产生大量重复性的工作,不但导致运维效率低下,也不可避免地产生人为配置错误。


            通过批量作业并行处理能力,实现多设备并发批处理操作。通过自动化流程,将简单的设备控制操作在大批量设备进行执行,并对执行过程进行监督,对执行结果进行检查。在安全合规的前提下,将运维人员从整体的变更流程及变更内容的准备中解脱出来,实现网络变更、设备配置自动化。

    针对不同类型的设备,支持进行各种控制、配置操作。

    • 对服务器/主机/虚拟化,支持一键开关机、进程管理、应用管理、容量管理等
    • 对交换机/路由器,支持ACL、QoS、流量策略、端口策略等
    • 对安全设备,支持防护管理、认证管理、NAT管理、VPN管理、内容控制等
    • 对数据库/中间件,支持空间管理、池管理、会话管理、连接控制等
    • 对传输设备,支持终端管理、链路管理、信号控制、功率配置等
    • 对其他设备,支持结合用户实际场景,通过拖拽流程的方式实现自定义管控策略

            支持不同厂商,如Cisco、HP、Nortel、Juniper、3Com、D-link、Foundry、Dell、Proxim、NetScreen、华为、H3C、锐捷、中兴等多家厂商的网络设备。

    3.11.设备策略备份对比

            方案通过配置文件批量备份、下载、周期性备份、查看等功能,为用户管理网络做出合理的建议提供数据支撑。

    3.12.全场景自动化运维

            方案将电子政务网运维中涉及的服务、命令、操作、执行组件化、策略化,将需要进行的运维服务、操作等以组件、策略的形式托管至平台中进行维护和管理,通过简单灵活地编排能力,使用者可以选择业务场景所需地测,通过可视化拖拽的编排方式进行组合,即可完成应用场景端到端的图形化编排,最后以多种方式触发执行即可完成期望的运维变更任务,从而实现高效、稳定、安全的智能运维。


            在电子政务日常网络运维服务中,重复的故障和请求约占到70%,只有30%的故障真正需要专业人员来解决,知识经验对提升重复工作的效率起到了至关重要的作用。

            通过智和网管平台自动化运维的能力,将只能有专家处理的各类操作和判断转化为可存在于平台内的流程,形成可保留可复用的运维知识,减少因误操作带来的损失,保障运维效率。以规范的流程进行运维作业,保障关键数据的完整合规。

    3.13.可视化数据分析

    利用图形、图表、图表等易于理解的形式,提取和分析大量复杂的电子政务网中各类运维数据,呈现分析结果,从而帮助运维人员在短时间内更好地理解和获得更多的信息,帮助运维部门能够实时了解业务和其所依赖IT资源的运行状况,以及提供系统运维和优化的指示和依据。

    电子政务广域网大屏示意图

    3.14.资产生命周期管理

            方案通过资产管理模块将资产实物与运维数据库一一对应,将为政务资产提供更加便捷高效资产生命周期管理,资产跟踪、维护和统计分析。从资产入库、领用、变更、维修、调拨、到报废处置,资产每一步操作均实现完整记录,支持追溯,通过平台实现资产整个生命周期的全流程闭环管理,使得IT资产每一次生命周期变更,都有流程可依、都有迹可循,从而实现IT资产监管。


    3.15.定制化工单体系

            通过方案实现运维工单“无纸化”,支持于设备和故障管理页面快速创建工单,把控故障处理进度,通过工单平台简化故障处理流程,形成自动化故障处理机制,并在每个处理流程的节点上责任到人,实现在快速响应故障的同时,实现兼顾运维流程管控。


            通过建立工单服务基准,预设工单在不同优先级、不同状态时,受理人应该响应的时间及未响应时的处理方式,生成工单自动化处理规则,并以多种方式进行通知,避免时响应提升全流程服务管理质量。

    第4章 自主研发安全可控 适配国产信创环境

            信创产业包含了从IT底层的基础软硬件到上层应用软件的全产业链的安全可控,涵盖了应用软件、信息安全、IT基础设置、基础软件四个领域。其中,基础软件是信息系统更核心的部件,是保障信息系统安全的重要阵地和防线,其创新应用与自主可控关系到国家安全和利益,也是产业自主发展的基础。


            本方案支持部署运行在中标麒麟、银河麒麟、红旗Linux等国产操作系统,支持在达梦、金仓、神州等国产数据库进行数据存储,通过东方通等国产中间件提供对外服务[8],支持龙芯、申威等国产CPU架构,并实现对国产化CPU、服务器、数据库、中间件等IT软硬件设备的综合监控与运维管理。

    第5章 方案应用价值

            北京智和信通电子政务智慧运维方案,通过构建统一的监控运维系统,以智能化的运维手段、规范化的运维过程、可视化的运维场景,汇聚融合全量运维数据,推进运维数据分析,助力各级数字型政府建设,解决其基础设施多、运维误操作风险大、运维自动化程度低,工作时效性差,缺乏统一的操作和维护标准等问题。实现“提升运维质量、降低运维成本、增加运维效率、确保运维安全”,保障政务系统安全、稳定、可靠运行,增强运维对决策和运营的支撑保障作用。

    设备统一管理

            一览掌控全局,全网状态实时监控 ,拓扑图自动发现,透明化管理,以图形化方式呈现网络设备、资源和链路状态、性能、物理连接关系,领导可以从全局对IT 资源使用进行把控。

    更速故障定位

            一键定位故障设备,细化到具体指标,判断设备关联影响,快速定位故障发生原因,提高IT人员故障排查效率

    运维效率提升

            自动化巡检代替人工巡检,提前预警,一键定位,大大降低故障率,缩短故障解决时间,保证业务连续性运行。

    保障业务高峰

            保证关键网络设备及和核心网络的带宽,提供服务器状态监控,监控安 全设备运行状态,提供网络拓扑结构图。

    第6章 标杆案例

            智和信通电子政务网络IT运维方案成果,其可靠性在电子政务网络大规模、高复杂地网环境下得到了验证,并得到用户的充分认可。

    6.1.某市委-国产化运维项目

            随着信息化建设的日益推进,各地政府的网络基础架构已经基本成熟,相应的网络设备、防火墙等都已配置得相对完备,在加紧网络安全策略的同时,各地方政府的下一步的信息化重点之一将是加强对网络的管理。因为,政府的信息化需要对网络资源进行有效使用,就是基于网络基础架构的各种应用的持续、稳定运行,而这些也都必须有自动化、智能化的网络管理软件作为保障。

    6.1.1.核心需求

            能够展示当前网络的基本状况,包括网络拓扑图和告警,能够对机房环境设备(核心空调、UPS电源、交换机、路由器等)、安全设备、存储设备进行监控,当出现故障时能够及时进行告警通知。

    • 监控、运维、领导视图界面

            主界面展示的要素包括网络拓扑图,本周运维进度,网络监控/安全监控/应用监控/机房监控情况;拓扑支持以大屏幕形式展示。

    • 资产管理

            据现有的数据分类进行数据管理维护,支持自定义资产分类管理。设备资产数据采集、资产数据变更日志。

    • 统一的服务台窗口

            包含公告、值班信息、监控故障信息、运维服务工单信息、值班日志管理和考评、个人工作日志管理和考评等工作内容或操作入口。

    • 统一的事件管理

            为用户提供了简洁、集中的告警驱动处理机制,支持事件的格式化、过滤、归纳和关联处理,帮助管理员对大量分散的事件进行关联分析,快速定位。

    • 国产化平台支持,包括国产CPU、操作系统及数据库。
    • 技术支持与服务,开发过程中遇到问题,能够得到迅速地解决。

    6.1.2.解决方案

            智和信通利用公司原有的拓扑图组件、SNMP组件、网管软件开发平台、智能化网管软件产品的基础上,为客户开发出商用的网管软件产品。针对某市委的具体需求,智和信通提出的解决方案如下:

    • 系统可以对网络中的管理对象划分安全域,并进行资产化管理,能够维护资产的基本属性、安全属性、管理属性等,并可以自定义资产标签,实现资产的动态属性扩展。系统提供基于拓扑的资产视图,支持用户自定义资产属性。
    • 网管系统的客户界面布局清晰、美观,操作便捷直观,程序启动速度和响应速度快,在万级局端和十万级终端负载情况下无操作卡死。
    • 服务台作为统一的服务窗口,职责不同人员通过自身业务看板为内部IT系统使用和维护人员提供统一的IT管理入口。
    • 硬件平台国产化:支持部署在国产X86服务器,龙芯mipls服务器平台,飞腾、申威等国产化平台也支持(与706所安管保持一致);数据库:支持多种国产数据库,包括:达梦、金仓、神通、oracle等。
    • 智和信通提供7×24小时售后服务和技术支持响应,对重大问题提供现场技术支持,保证业务的正常开展,服务方式包括电话和现场等方式。

    6.1.3.方案成果

            智和网管平台为某市委提供了综合、智能化的网络运维解决方案,降低了开发网管系统的成本,节约了时间。在智和网管定制软件完成之后,某市委网络下的所有设备都被纳入网管软件中集中管理,可以在一个管理平台上管理所有的设备,并且可以对各个设备进行故障监控。

    6.2.某地税项目

            河北省地方税务局为河北省主管地税工作的机构。在发展社会主义市场经济的过程中,税收承担着组织财政收入、调控经济、调节社会分配的职能。河北省地方税务局下辖11个设区市地税局,实行垂直领导。截至目前。全系统共有各级地税机构1275个,其中基层税务分局(所)1037个。

    6.2.1.核心需求

            由于网络比较复杂,设备数量在千台以上,某地税急需一套网管软件对网络进行管理。尤其是针对其单位性质,对单位内的网络设备监控更加的严格,某地税核心需求如下:

    • 故障告警实时显示故障信息;
    • 对提出的设备类型进行详细监控,监控指标细化;
    • 对软件稳定性要求高,可以支撑千台以上设备管理;
    • 项目周期短,比较急迫。

    6.2.2.智和信通方案

            经过多次沟通,智和信通公司决定通过智和网管平台一体化网络管理解决方案实现某地税的网管需求,具体方案如下:

    • 实现故障页面实时刷新,显示更新告警信息
    • 实现对服务器以下指标的监控:CPU使用率、物理内存使用率、交换内存使用率、磁盘空间使用率、磁盘I/O、网络I/O;
    • 实现对网络以下指标的监控:CPU使用率、内存使用率、设备响应时间(ping延时)、接口状态、接口发送\接收速率、接口输入\输出带宽利用率、接口丢包率;
    • 实现对小型机以下指标的监控:功能、cpu利用率、物理内存利用率、交换内存利用率、文件系统利用率、磁盘I/O、网卡I/O、errpt系统错误日志;
    • 实现对数据库以下指标的监控:表空间监测、redo日志切换频率、Buffer Nowait、Buffer Hit、Library Hit、Latch Hit、In-memory Sort、Soft Parse;
    • 实现对中间件以下指标的监控:服务器节点状态、服务器节点健康状况、web应用程序状态、JDBC数据源运行时状态、服务器子系统健康状况、JVM堆空闲百分比、线程池健康状况;
    • 支持对成千上万台设备的海量监控点进行秒级监控,确保海量数据的监控准确性和实时性。
    • 平台提供扩展功能,支持对设备类型、设备资源、监视器等进行自定义扩展。

    6.2.3.方案成果

            通过深入了解某地税的需求,智和网管平台即可满足其90%的功能需要,而细节化的监控指标中,有一些确实不属于常用指标,不通过定制开发一般软件难以实现。而智和网管平台在设计之初,就对其扩展性做了设计,包括:设备类型扩展、设备资源类型扩展、故障类型扩展、设备模板扩展、故障监视策略扩展;性能采集策略扩展、TRAP策略扩展,均可不通过开发实现,因此在通过一定的调试后,直接满足了某地税的设备监控指标需求。