网络运维 设备管控

如何实现网络安全监控运维?

生产制造业网络运维监控方案

生产制造业网络运维监控方案
    马上咨询

            工业2.0实现“电气化、机械化”,工业3.0实现“自动化、网络化”,工业4.0则旨在实现“数字化、智能化”。随着工业互联网的发展,新兴信息技术和制造业的融合,生产制造产业不断变革,企业开始高度重视“订单供应-生产到流通”整个价值链的信息化建设,ERP、SCM、CRM、MES、BPM以及其他外围系统等都先后建设起来,但信息系统建设的持续深入,资产规模不断扩大,与之而来的是IT架构越来越复杂,虽然信息系统深化和新技术的应用给企业业务及管理等方案带来诸多收益,但也给企业的IT运维工作带来诸多挑战。

    第1章 生产制造业网络信息化的建设背景

            《“十四五”智能制造发展规划》明确提出,到2035年,规模以上制造业企业普及数字化、网络化,重点行业骨干企业基本实现智能化。大型制造企业的厂区、事业部覆盖全国乃至全球,由于业务种类多、生产链路长,每个厂区都有自己的业务特色。

            生产制造业是多为生产现场-控制层级-监控层级-IT办公的多级网络架构,生产现场、控制层级与监控层级属于企业内网,即生产网(OT),IT办公属于企业外网,即IT网。生产现场常见设备有生产机器、IO模块、网关、工业AP、工业接入级交换机等;控制层级常见设备有PLC、工业级汇聚交换机等;监控层级常见设备有核心骨干交换机、服务器、PLC、RTU等;IT办公常见设备有无线AP、笔记本电脑、摄像头、云设施、远程会议设备等。


            纵观工业互联网的发展形势,随着IT与OT的逐渐融合,生产制造企业需面对业务多元化的应用场景。但由于诸多原因,生产制造业并没有更大程度地发挥信息化建设和IT/OT融合的价值,IT系统与业务结合不够紧密,随着企业规模的扩张以及业务需求日趋复杂,信息化显得累赘和笨拙,低效的信息化应用和持续高涨的信息化投入成为阻碍信息化在企业进一步推进的障碍。

    第2章 生产制造业网络运维需求及痛点分析

            智能制造要求生产制造企业从订单到生产再到销售,实现全流程的信息化,而产线的持续改进、网络架构的持续建设等,为网络运维管理带来诸多难题。对于数据中心,无法评估网络、应用容量的性能和网络故障对应用、业务所造成的影响,难以及时发现并定位网络问题;对于广域网,由于应用、设备分布地域等详细信息缺失,故障排查被动且效率低下;对于园区网络,由于覆盖面广,网络架构复杂,传统的人工巡检、故障排查效率低下,同时缺少网络优化依据,具体而言,包括以下几方面。

    2.1.跨越地域的多厂区网络专线,网络可视化能力差

            IT环境异构、设备跨地域多厂区分布,系统的软硬件种类繁多,造成网络结构、链路关系无法可视化展现,设备节点位置不明确。

    2.2.网络结构复杂,难以有效监管

            智能制造技术的发展与业务的转型升级使得生产制造企业的网络架构与业务系统架构变得日趋复杂,传统的基础运维工具无法应对。尤以在OT与IT不断融合的当下,难以对生产网络、办公网络中的IT资产、流量进行有效监控。

    2.3.网络故障频发,难以快速定位排查

            及时排障,是智能制造保障安全生产的关键。大量的设备、应用系统等产生大量故障,但由于缺乏有效手段对故障进行系统整合管理,难以实现告警收敛、异常检测、根因定位、故障预测等,运维人员实际的工作效率较低,分析与定位故障困难。

    2.4.业务系统繁多,缺乏可用性监测

            业务系统的合理规划与及时调整,保障业务稳定,对生产制造企业至关重要。随着业务系统不断增加,运维工作中,缺乏对 MES、ERP、OA等业务系统的有效监控,对其可用性、健康度未能把控。

    2.5.自动化程度低,人力运维难度大

            生产制造业IT运维多处于被动、低效率的手工救火状态,对于故障的处理,往往在其发生后才得到处理,不但事倍功半而且故障还常常会出现恶性连锁反应。大量变更和检查操作工作每天重复进行,占用大量的运维资源。

    2.6.运维数据分散,缺乏数据整合能力

            缺失统一运维监控数据整合,数据过于分散,无法有效整合,造成各类监控工具之间数据彼此割裂,无法联动分析的问题,无法实现监控数据更大化挖掘。

    第3章 智和信通生产制造业智能化运维方案

            伴随生产制造业信息化建设与数字化转型提速,网络和业务结构越来越复杂。工业4.0提出“信息化技术促进产业变革”,运维部门与生产制造的关系越来越紧密。生产制造企业具有规模庞大的 IT 基础设施及业务系统,运维部门为了保障生产、办公信息系统的高可用性、高可靠性、高稳定性,须建立智慧化、化的运维保障体系。

            基于此,北京智和信通推出生产制造业智能化运维方案,基于智和网管平台,以智能化、自动化、数字化为基底,为生产制造企业实现高效运维、保障业务持续稳定运行。


    3.1.智能IT架构可视化展示

            对于生产制造业网络运维而言,网络跨厂区、设备大维护量是网络运维的难点,如何通过可视化的能力,将复杂的网络直观地展示出来,是其关注的重点。北京智和信通网络结构可视化能力,通过图形化、具象化的拓扑形式展现设备间的联动关系与实时状态信息,降低运维部门的维护难度,拖动式的布局形式使配置更加灵活,帮助运维人员实时了解网络架构及全网运行状态,快速感知资源、链路、流量等异常信息。

    生产制造业拓扑示意图


            在拓扑图上展现设备状态,通过树形、平面结构联动展示设备间链接关系,或按片区、按地域、按层级等多种布局方式划分网络,使用不同颜色、粗细、图标表示被管理对象的状态信息,颜色级别自定义。

    生产制造业拓扑示意图


    3.2.动态掌控网络资源变化

            通过多维管理视图,对不同品牌、类型、版本的网络设备、安全设备、无线设备、存储、主机、中间件、数据库、虚拟化、应用服务、工业交换机、物联网设备、视频监控、PLC设备等IT资源进行统一、全方位、多层次的综合管理,实时分析资源当前性能和运行状态,直观反映资源的动态变化对支撑业务的影响。


    3.3.端到端网络全链路监控

            整体维度到局部维度展示生产制造业网络内设备链路各项指标,整体可观测、可告警、可分析、可统计,通过SNMP协议实时监控各个端口以及每条线路的通断情况和性能指标,结合专业的流量监控分析能力,对链路容量进行即时监控,并生成流量分析报告,为容量规划提供依据。


    3.4.全方位采集告警信息

            提供7*24小时稳定不间断监控,采集办公和生产网络内所有联网设备,如视频设备、无线AP、存储、服务器、路由器、工业交换机、防火墙等设备、资源、应用、服务等的状态信息,基于告警机制以及阈值的设置,即时获取准确的告警信息,并通过界面颜色、告警列表、Email、钉钉、企业微信等方式发出通知,确保告警传达到人,无错漏。


    3.5.IT资源自动巡检

            通过自定义巡检策略,对IT设备的运行情况进行统计和报表生成,并可自定义预设时间向指定邮箱发送巡检结果报表,实现对设备的定期检查,把握网络运行中的易出现问题的环节,做到预防为先。


    3.6.全网IP地址分配与管理

            方案支持端到端规划、部署、管理和监控IP 地址。通过手动或自动的方式获取子网信息,并根据网络结构对子网信息进行管理。定时获取全网的MAC-IP信息,并自动保存,可根据MAC或IP对在线设备进行查询。以端口图的形式显示当前网段内端口的使用情况。


    3.7.设备模型库监管无限制

            采取用户自定义设备类型及其设备资源的方式,赋予用户自定义适配设备的能力,更大可能地支持对不同设备类型的支持。通过自定义设备类型及其设备资源,更大限度上提高了智和网管平台的管理范围,真正实现了对设备及其资源的化管理,达到管控万物的目标。


    3.8.智能业务多维可视管理

            生产制造业内的MES、ERP、OA等业务系统不断扩展,产生巨大的业务运维压力,智和信通业务运维方案以实现业务价值为核心,以保障业务可用性为基础,通过对承载业务的IT基础设施构建真实的业务模型。

            通过智能化、自动化的业务监管方案,将IT设备对业务的价值可视化,构建业务分析模型,从业务的角度透视IT设施的分布和价值收益。在平台内将业务相关的基础设施和应用可视化显示并有效量化,将其状态映射到他们所支持的业务上,直观反映IT基础设施的动态变化对业务造成的影响和威胁,实现IT的精细化管理,掌控全局,准确衡量IT对业务的价值贡献,有力保障业务的健康、稳定运行。

    业务看板示意图

            针对业务应用性能与用户体验进行检测分析,无需安装插件即可提供开箱即用的主动拨测试业务监测。直观、便捷地帮助运维人员对企业内办公OA系统、ERP系统、MES系统、PLM系统、WMS系统、财务系统等进行监控,掌握业务的运行状态和健康水平,了解业务动态变化趋势,快速定位故障源,降低运营风险。

    3.9.智能实时监控网络流量

            方案基于海量流量数据的存储挖掘,实现对网络流量的侦测分析。通过网络流量分析技术,采集、分析、存储所有网络流量,回溯分析数据包特征、异常网络行为,以多维数据分析和深度挖掘为手段,实现数据包层面的流量追踪,发现潜伏于网络中的未知攻击。帮助用户进行流量趋势分析、网络优化、网络监控等工作,并为网络规划、优化调整和业务发展提供基础依据。


            流量实时查询展示瞬间流量状态,定位瞬间异常流量的产生及影响范围,通过TOP N排名报表,了解实时流量数据的排名情况、协议类型、应用分布等,及时发现并准确定位流量的来源和目的及其细节特性,运维人员可以及时排除网络故障,提高运维效率。

    3.10.智能故障自动触发与治愈

            方案通过统一的故障管理平台,将各个模块中的监控信息统一采集、分析,实现整个生产制造业中各种事件信息、设备故障、网络异常、流量异常等告警,以智能化手段进行标准化的分析、压缩、并归关联等,通过多种方式实时传达告警信息,保证落实到指定人员进行处理,帮助企业建立标准化、快速的故障响应机制,在遇到生产故障时,能够有条不紊地进行分析与排障,提高安全生产故障的响应与处置能力。


            将人工运维与故障自愈结合,无需针对告警进行手动处置,只需预编排告警处理流程,平台根据场景自动触发,实现故障自愈。通过实时发现告警,进行预诊断分析,判断告警类型和级别,如果是一般告警,平台进行自动恢复,如果是严重复杂告警则通过告警通知、运维工单等形式通知运维管理人员,进行人工处理。同时,将只能由专家处理的各类操作和判断转化为可存在于平台内的流程,形成可保留可复用的运维知识。


    3.11.智能IT资源远程配置

            方案提供跨厂区的设备策略远程配置管理,可以自动批量进行设备配置修改,并可对设备配置进行备份、对比、恢复。宕机后设备配置可快速复原,保障设备及时恢复运行,提升配置效率、质量和安全性。


    针对不同类型的设备,支持进行各种控制、配置操作。

    • 对服务器/主机/虚拟化,支持一键开关机、进程管理、应用管理、容量管理等
    • 对交换机/路由器,支持ACL、QoS、流量策略、端口策略等
    • 对安全设备,支持防护管理、认证管理、NAT管理、VPN管理、内容控制等
    • 对数据库/中间件,支持空间管理、池管理、会话管理、连接控制等
    • 对传输设备,支持终端管理、链路管理、信号控制、功率配置等
    • 对其他设备,支持结合用户实际场景,通过拖拽流程的方式实现自定义管控策略

            对不同厂商,如Cisco、HP、Nortel、Juniper、3Com、D-link、Foundry、Dell、Proxim、NetScreen、华为、H3C、锐捷、中兴等多家厂商的网络设备。

    3.12.智能可视化数据分析

            利用图形、图表、图表等易于理解的形式,提取和分析大量复杂的生产制造业网络中各类运维数据,呈现分析结果,从而帮助运维人员在短时间内更好地理解和获得更多的信息,帮助运维部门能够实时了解业务和其所依赖IT资源的运行状况,以及提供系统运维和优化的指示和依据。

    生产制造业大屏示意图


    3.13.建立健全资产台账,实现一机一档

            IT资产从采购一直到报废,要经历多个生命周期。分析IT资产的生命周期,实行IT资产全生命周期管理,从资产入库、领用、变更、维修、调拨、到报废处置,资产每一步操作均实现完整记录,支持追溯,通过平台实现资产整个生命周期的全流程闭环管理,使得IT资产每一次生命周期变更,都有流程可依、都有章可循,从而实现IT资产监管。


    3.14.智能定制化工单体系

            通过方案实现运维工单“无纸化”,支持于设备和故障管理页面快速创建工单,把控故障处理进度,通过工单平台简化故障处理流程,形成自动化故障处理机制,并在每个处理流程的节点上责任到人,实现在快速响应故障的同时,实现兼顾运维流程管控。

            结合生产制造业网络运维的需求实现定制化运维工单,通过自动触发与用户报修等方式快速响应运维事件,解决突发故障和请求,实现整个运维流程规范化、标准化,运维协同高效透明,运维结果可查可控。

     

     

    第4章 适配国产软硬件环境

            以JAVA编程语言为基础,从功能块、数据库、界面全部基于统一JAVA技术平台和统一数据关系模型。智和信通国产信创能力采用Java、HTML5跨平台技术,兼容国产化操作系统、数据库、中间件、CPU和虚拟化等,支持包括:中标麒麟、银河麒麟、中科方德、达梦、人大金仓、南大通用、神州通用、华为虚拟化、H3C虚拟化、深信服虚拟化等。


            方案以“管控万物、无所不能、无处不在”为理念,具备拓扑自动发现、实时监控、性能感知、故障预警、流量分析、安全管控、自动化运维、设备控制、作业编排、数据可视化、资产管理、日志分析、工单流转和二次开发等核心技术模块,可在众多国内外操作系统上应用部署,对国内主流的服务器、中间件、CPU、数据库均有完备的支持能力。

    第5章 分布式部署方案适配生产制造企业网络架构

            在智和信通生产制造业网络运维分布式部署方案中,采取核心网络部署综合运维平台,下级网络部署采集器的方式,用户可以在综合运维平台建立多个账号,进行权限划分,对下级网络进行管理。整个分布式部署方案采用综合运维平台-设备集的结构,综合运维平台获取不同设备集的监控信息,综合运维平台可以管理所有设备,实现对每个设备集中网络设备运行数据的采集、管理、存储。

    部署方案优势:

    • 增大平台容量、吞吐量,管理效率更高 
    • 可异地多点部署,网络可达即可完成监控管理 
    • 降低采集服务之间的耦合度,更易于扩展 
    • 故障影响范围小,便于排查


    第6章 方案应用价值

            通过在企业总部、下属板块、生产园区部署智和信通智能运维方案,将生产制造企业整体IT设施纳入统一管理、资源可视化与监控。实现OT网络高可靠、低时延、故障更速修复等运维能力;实现IT网络流量精细化管理、网络性能稳定、故障更速修复及网络安全回溯等能力。并通过更其灵活可控的自动化运维能力,将运维人员从简单、重复的运维工作中解放出来,通过智和网管平台将运维工作逐渐规范化、智能化、自动化。

    第7章 生产制造业样板用户

    7.1.日照钢铁可视化运维项目

            日照钢铁控股集团有限公司是一家集烧结、炼铁、炼钢、轧材于一体并配套齐全的特大型钢铁联合企业,是一家民营企业。随着集团公司的发展壮大,公司的办公网络和生产网络也在同步发展,网络结构越加复杂,网络设备数量不断增加,以人工管理的模式难以对网络进行合理的管控。

    核心需求

            为了更加便捷、高效地对办公和生产网络进行管理,日照钢铁提出了以下核心需求:

    • 支持二级代理功能;
    • 支持自动发现网络设备;
    • 具有拓扑图,可以基于拓扑图对设备或资源等进行管理;
    • 故障管理功能,能够及时发现故障,有故障统计功能;
    • 通过系统对设备进行配置和维护;
    • 提供便捷可用的接口,并提供接口培训。


    智和信通方案

            为实现日照钢铁的需求,智和信通和日照钢铁方面进行了多次深入地沟通,更终确定基于智和网管平台在二次开发的方式来实现,具体方案如下:

    • 提供SNMP代理功能,通过代理实现对防火墙限制范围内的设备进行管理监控;
    • 代理支持一级、二级代理模式。一级、二级代理仅支持SNMP和Ping监控,支持JDBC、JMX、Telnet等;
    • 自动发现SNMNP设备和IP设备、发现交换机链路,自动运行监视任务,自动监控流量,自动展示监控图表;
    • 支持在拓扑图的基础上,进一步展示设备细节,包括网络设备的网口和系统状态,服务器和计算机上的cpu、内存、磁盘、网卡、进程服务、中间件、数据库;
    • 具备故障采集、故障分析、故障定位、故障处理、故障通知功能;
    • 可以方便地查看网络设备的各种配置信息;集成Telnet、Ping、MIB浏览器、Web访问、Ftp/TFTP等日常维护工具。
    • 平台提供API接口,并提供API接口、接口使用、接口数据等。


    方案成果

            通过部署智和网管平台,日照钢铁将办公和生产网络统一地管理起来,网络设备集中管理,更大地提高了网络故障的处理效率。通过事前管理,降低故障发生率,通过事后及时处理,提高故障处理效率,为保障网络的平稳运行提供了更大的助力。