第1章 系统监控概述

计算机网络中的监控是一个广义的概念。本书中的监控,指的是Windows Server系统性能监控和常用网络服务监控,着重介绍如何使用监控和调整系统性能和应用程序性能。本章简介系统性能监控的目标和监控的内容。

1.1 监控概述

网络中的服务器系统部署完成后,随着时间的推移,系统中的数据量和用户数量不断增加,系统压力越来越重,系统运行速度越来越慢,客户端用户等待的时间相应越来越长,用户的不满程度越来越高,甚至影响网络的正常运行。客户端用户从等待时间长,逐渐演变成长时间的抱怨,甚至到集体罢工的程度。如何监控和解决系统性能问题,成为管理员急需解决的棘手难题。

1.1.1 系统状态

系统越来越慢,是每个网络管理员都会遇到的问题。系统为什么慢,造成慢的原因是什么,如何解决慢的问题,如何调整服务器性能,都是管理员关心的问题。

应用系统一般包括服务器、存储、网络、数据库、软件(操作系统和应用系统),在系统建设时还需要集成商参与,当出现系统慢的问题时,将不同的供应商召集到一起,共同研究慢的问题,得出的结论基本是“设备正常,没有问题”。

由于网络中使用不同的产品,针对不同的产品均有各自的性能监控工具,通过性能监控工具的诊断分析报告,才能判断产生系统瓶颈的真正原因所在。性能监控工具是彻底解决性问题必备的利器。既然性能的瓶颈来自服务器、存储、网络、数据库、软件等不同的产品,所以监控软件必须综合不同资源的性能进行监控。系统缓慢是因为数据量增加后,长时间累积出来的现象,性能监控手段还要包含长期性能增长的趋势预测分析。

最常见的提高性能的方法就是升级。将现有产品升级到更高性能指标的产品来提升性能、降低运行压力,不同的厂商将会提供不同的产品升级方法。产品升级后,管理员可能会发现系统性能并没有根本改变,无论是采购更高性能指标的设备,还是从软件方面进行系统优化改造,多方面付出努力和投入,但收效仍然不明显。

1.1.2 监控目标

在进行性能调整前,首先要知道要调整什么,系统的瓶颈到底在什么地方,只有监控工具才能完成此任务。

1. 监控目标

监控目标主要分为四部分:硬件资源(处理器、内存、存储和网络),操作系统,数据库和应用软件。每一部分都必须同时监控,监控内容包含吞吐量、反应时间和使用率,任何一部分都有可能是造成瓶颈的原因。

2. 日志采集

日志是监控的重要内容,管理员要收集不同目标的性能日志,日志可以用来描述系统工作状态和即将出现的问题。经过历史数据的统计,可以判断哪些是正常运行的平均值和正常值,也可以判断那些是超过正常值的合理范围,甚至统计出目前资源设备可以承载的最大极限值,任何的性能隐患都可以提出告警。通过历史数据的对比分析,看到随着时间变化的性能发展趋势,这个发展趋势是递增还是持平的?有没有时间上的规律,如每日、每周、每月、或是每年,依据这些趋势和规律分析,判断和预测未来需求。

1.1.3 性能监控工具

要分析造成系统慢的真正瓶颈,首先需要性能监控工具。经由这些工具来诊断分析由应用软件、数据库、操作系统、处理器性能、内存性能、I/O存储和网络性能等方面可能带来的瓶颈。

管理员使用性能监控工具时,既可以使用专业的性能监控工具,例如Quest公司的Spotlight系列产品,也可以使用Microsoft公司的Microsoft System Center Operations Manager 2007(SCOM)产品,更方便的是使用Windows Server本身集成的性能监视器,当然也可以使用更加专业的监控系统。本书将分别介绍Spotlight、SCOM以及性能监视器在网络管理中的应用。