系统管理员工具包- 监视运行缓慢的系统

系统管理员工具包- 监视运行缓慢的系统

ID:10402398

大小:93.50 KB

页数:12页

时间:2018-07-06

系统管理员工具包- 监视运行缓慢的系统_第1页
系统管理员工具包- 监视运行缓慢的系统_第2页
系统管理员工具包- 监视运行缓慢的系统_第3页
系统管理员工具包- 监视运行缓慢的系统_第4页
系统管理员工具包- 监视运行缓慢的系统_第5页
资源描述:

《系统管理员工具包- 监视运行缓慢的系统》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、系统管理员工具包:监视运行缓慢的系统  关于本系列  通常,UNIX®管理员都拥有一套他/她经常使用的用来辅助进程管理任务的实用程序、技巧和系统。有一些重要的实用程序、命令行以及脚本可用来简化各种处理过程。这些工具中有一部分来自于操作系统,而大部分的技巧则于长期的经验和简化系统管理员工作的要求。本系列文章主要专注于最大限度地利用各种UNIX环境中可用的工具,包括简化异类环境中管理任务的方法。  导致系统运行迟缓的原因  有许多不同的潜在的原因会导致系统运行迟缓,但通常可以将它们分为以下几个方面:  进程太多。您的系统可能仅仅只是同时运行了太多的应用程序,或者正在运行少量CPU密集型的

2、操作。要么是服务器超负荷运行,要么是失控进程耗尽了系统资源。  活动内存太多。如果进程使用了大量的内存,那么系统可能会从磁盘换入大量的页面并将大量的页面换出到磁盘,这意味着您的系统花费在内存交换上的时间比真正使用内存的时间更多。  硬件故障。有时候,您会碰到导致系统运行迟缓的硬件故障。不能正常工作的网卡、硬盘或内存,都可能导致系统花费很长的时间等待信息。  要对该问题进行诊断,您需要使用大量可用的工具来检查您的UNIX系统。  选择连接方法  如果您的计算机运行得特别慢,那么第一个问题是如何连接到该计算机以便启动监视进程。运行迟缓的计算机可能无法接受Tel或通过远程Shell协议(如ssh)

3、的连接。  如果您尚未登录到系统,那么可能根本无法进行访问。相反,可以考虑直接或通过独立的硬件解决方案(如网络或基于串口的控制台监视器)来使用控制台。  这种控制台更有可能允许您登录到系统,因为已经有一个登录进程(您的Shell将会代替它)正在运行。如果在登录到系统后,您无法通过Shell运行任何进程,则表示系统已经耗尽了进程空间,那么重新启动可能是使系统恢复正常的唯一办法。  要重新启动系统,请使用init或telinit来调整运行级别,运行级别6通常表示重新启动。使用init/telinit更有可能重新启动系统,因为在进行重新启动时仅涉及到了一个进程。  在系统启动并运行后,您需要使用本

4、文中介绍的一些技巧来监视该系统的运行状态并记录其输出结果。如果再次出现系统运行迟缓的情况,您可以执行事后检查调试并分析系统运行迟缓的原因。  使用uptime  如果您怀疑计算机运行得很慢,那么您应该运行的第一个命令是uptime。Uptime报告当前时间、计算机启动和运行时间(换句话说,是从计算机启动以来的时间)以及当前的用户数。然后它会提供三幅图表,以显示最近1分钟、5分钟和15分钟的平均负载。例如:$uptime18:28:54up10days, 8:38, 2users, loadaverage:2.24,5.34,3.42  在这个示例中,该计算机在最近1分钟、5分钟和15分钟内的

5、平均负载分别超过了2、5和3。  平均负载的定义比较复杂,并且受到正在执行的进程的状态影响。通常,正在运行、等待CPU或等待I/O的每个进程都会使平均负载加1。然后对这些图表进行计算并根据时间平均。  在单CPU的系统中,平均负载大于1则表示该CPU难以承受您所分配的负载类型。但是因为UNIX的多进程的本质,在您关注到该问题前,平均负载在长时间内(换句话说,对应于15分钟的图表)达到2通常是可以接受的。  在多CPU(或多核)系统中,需要将平均负载除以CPU的个数。要确定计算机是否超负荷运行,请使用上述原则。  查看这些图表的另一种可选的方法是将它们看作百分比,换句话说,如果上面的图表来自于

6、一个单CPU系统,那么如果该计算机的速度比目前快百分之224,那么它就能够处理当前的负载。  在多CPU系统中,您应该使用CPU数目加1来确定最大负载。例如,一个4CPU的系统可以承受的最大平均负载为5。  通常在短时间内,计算机的平均负载可能比其最大平均负载高的多。例如,当构建或编译一个应用程序、或执行一项磁盘密集型任务时,平均负载可能会激增。这正是输出结果中包含1、5和15分钟平均值的原因,因为这样可以帮助消除任何瞬态负载极大值。  任何长时间的或未预料到的较高的值都可能表示存在问题,并且需要进行进一步的研究。如果这些数值较低,但系统却运行迟缓,那么可能表示存在交换空间的问题。  使用r

7、uptime  如果您管理着由许多系统组成的大型网络,那么有一种简单的方法来监视负载和网络中所有计算机的使用情况。ruptime工具收集网络上所有计算机广播的数据,并将其集中到一个本地文件中,以便对所有计算机的当前状态进行检查。  例如,清单1显示了一个小型网络的输出结果:  清单1.一个小型网络的输出$ruptimebear     up10+09:13,  2users, load0.66,0.68,0.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。