莫要为网管而网管
网络管理是一个古老的话题了。用户对网管系统普遍存在着模糊认识或过高预期,这是由于对网管系统的功能和作用认识不足造成的。模糊认识主要表现为“为网管而网管”:企业的网络和计算机系统建立起来了,就应该上网管系统;网管系统究竟起到什么作用,带来什么好处?不清楚。这样上的网管系统自然很难发挥作用。另一个极端是对网管系统预期过高:管理员不再需要懂得设备的特性、配置和部署,网管系统会自动完成所有这一切;这种用户最典型的提问是,网管软件能配置路由器吗?
本文主要针对用户的各种认识误区,澄清计算机网管系统的基本功能和实现方式,帮助用户客观认识网管系统,避免或减少盲目建设。
网管系统三大主要功能
许多人都知道网管包括配置管理、故障管理、性能管理、安全管理和计费管理五大部分。其实,这主要是针对电信运营网络而言的。对于企业计算机网络来说,一般不需要计费管理,安全管理则属于计算机安全建设领域,所以网管基本包括配置、故障和性能管理三个方面。目前,市场上各种网管产品主要是针对网络故障管理和网络性能管理这两个方面的。网络故障管理主要侧重于实时的监控,而网络性能管理更看中历史分析。它们不能代替管理员分析问题、解决问题,只能协助管理员监视网络、采集数据,及时报告问题,形成统计报表。
配置管理
目前,对网络设备的配置基本上是通过登录设备,利用设备提供的配置命令完成的。这也是唯一能够完成所有配置任务的方式。设备的制造商会针对不同型号的设备推出一些辅助的配置管理软件工具,简化设备的配置过程。但是往往只能实现部分配置功能,而且只针对特定型号的设备,缺乏通用性,没有太大的意义。由于设备的配置参数、方式没有通用的标准和协议,所以没有通用的设备配置管理软件,各种通用网管软件宣称配置管理,往往只是为了迎合用户,功能非常有限。总之,在网络设备配置管理领域,目前尚没有可以代替登录设备、手工配置的方案或产品。那种对学习网络技术和设备存在畏难情绪,希望网管软件解决所有问题的想法是不现实的。
故障管理
网络故障管理首先能够自动发现、生成和维护网络拓扑结构,形成网络模型。该模型应该与管理员头脑中的网络图像一致。通过核对该图,管理员可以纠正错误认识,或者发现用户私自增加和改变的网络连接。一般网管软件可以生成基于IP网络的拓扑结构图,高级网管软件则可以生成和维护基于交换机物理连接、帧中继永久虚电路、IPX网络、存储区域网SAN甚至IBM网络体系架构SNA网络的拓扑结构图。
然后,故障管理以此模型为基础,自动定期轮询网络设备,监视线路、设备的运行状况和故障情况。可以轮询的范围、规模以及对网管工作站、网络带宽的占用是考察网管软件的关键。
故障管理的核心是对采集到的故障信息的处理。一种方式是网管软件理解网络拓扑结构和故障来源、严重性,自动、及时、直观地在网络拓扑界面表示该故障。这对实时监视和解决问题非常有效。界面的直观、易用性是考察此类软件的侧重点。另一种故障处理方式是通过后台处理引擎对故障报警事件进行过滤、翻译、分类、关联、报警,同时通过列表的形式显示,以便从海量报警事件中寻找真正的故障信息,及时自动通知管理人员。经验证明,要真正从大量纷繁复杂的报警事件中自动找出故障根源,使故障管理软件真正发挥作用,不但需要网管软件具备功能强大的故障处理引擎,还需要针对具体网络环境进行细致地定制。因此,厂商的支持力量和力度非常关键。
性能管理
网络性能管理采集数据的方式方法与故障管理基本相同,所不同的是对数据的处理过程。性能管理系统会保存大量采样数据,同时定期对原始数据进行汇总,生成汇总化报表,以减少存储资源占用,提高数据质量。
性能报表报告是性能管理的核心。性能报表直观易懂性是基本要求,报表内容是否有效,是否能够对系统性能调整起到指导作用则是性能管理系统是否有用的关键。当然,网络性能超出门限值产生性能故障报警,并通过网络故障管理统一处理也是性能管理的基本要求。
一些高端的网络性能管理软件还具有自动的分析预测功能,可以自行学习和分析网络性能的历史和现状,给出将来可能出现的性能问题预测。
网管系统的实现
不管是网络故障管理还是网络性能管理,也不管是哪家厂商的产品,各种网络管理系统都是按照相似的模式运作的。对于计算机网络管理,所有产品都无一例外地采用了简单网管协议(SNMP)在网管工作站和网络设备之间架起沟通的桥梁。
首先,网管系统不单单是网管软件的事,还与被管理的网络设备密切相关。网络设备必须能够收集、保存本设备及其连接网络线路的相关故障和性能参数,网管软件才有可能进行收集、分析(早期某些设备不支持这种功能,需要专用的探针)。经常有人会问:网管软件能否管理什么参数?实际上,网络管理员应该首先明确设备能否提供这些参数,是否正确配置了设备以提供这些参数。
网管工作站上的网管软件负责定期、自动采集这些参数,并正确处理它们使之对用户有用。如前所述,网管软件是通过SNMP协议从网络设备收集数据的,可以定期主动轮询,获取数据;也可以被动接收网络设备发出的SNMP Trap、syslog以获取报警数据。网管软件数据采集模块的设计优劣是影响其性能、可扩展性的重要因素,也是考察网管软件的重要指标。
众所周知,网络设备是通过不同的管理信息库(MIB)来表述监控参数的,一般网络设备除了支持标准的MIB II、RMON外,还会支持一组与设备型号相关的专用MIB,以扩展管理功能。因此,网管软件支持了哪些MIB,如何支持新的MIB定义是考察网管软件的另一关键。
网管系统的发展趋势
上述介绍为用户理解网管系统,考察选择网管软件提供了一些依据。下面简单介绍新形势下网管系统的发展趋势。