linux-系统运维new

linux-系统运维new

ID:34424379

大小:964.46 KB

页数:41页

时间:2019-03-06

linux-系统运维new_第1页
linux-系统运维new_第2页
linux-系统运维new_第3页
linux-系统运维new_第4页
linux-系统运维new_第5页
资源描述:

《linux-系统运维new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、系统运维桑昂整理(来源51CTO)系统运维(声明:以下内容由桑昂整理摘自51CTO,不负任何法律责任,详情请访问www.51cto.com,查看相关内容)系统运维秘诀:变化,监控,扩展(分三篇)(英文版)系统管理员必须了解的六大铁律系统管理员应该怎样高效的书写文档系统管理员最需要自动化的十大任务系统管理员都应该知道的系统常识系统管理员之企业生存守则资深系统管理员给Linux/Unix新人们的建议漫谈运维:半神半仙亦民工几个常用的Linux监控脚本Linux生产服务器Shell脚本分享1/41系统运维桑昂整理(来源51CTO)系统运维秘诀:变化,监控,扩展(分三篇)完全理解

2、本文内容需要一定的运维经验。您可能对这些文章也会感兴趣:1.系统管理员必须了解的六大铁律2.系统管理员都应该知道的系统常识3.漫谈运维:半神半仙亦民工以下为正文。(最后附英文原文)在运维管理的过程中,我发现了很多有价值的秘诀,本文是这些秘诀的一个总结。虽然这些秘诀可能比较“唯心”,但是我还是把它们总结出来了,相信它们会对你有帮助的。Dormando的运维秘诀分成以下三大篇:1.技术篇2.交流篇3.实践篇技术篇为变化而设计◆Google的秘诀是正确的——“为变化而设计”。“变化”就是不得不部署新的软件,升级现有的软件,进行扩展,设备损坏,以及人员流动等。◆每一件事情都是在寻

3、找平衡点。你也许会认为把你的系统和某个操作系统或某个Linux发行版牢牢地绑定在一起是一个好主意,但事实上这跟把它们完全隔离一样糟。如果实在有必要,你可以进行分层,并使用一点间接性。◆这并不意味着你的系统必须是平台无关的。其实我们的目的很简单:一变二,二变二十,一个系统必须可以应对各种突发事件。也就是说,如果一个系统管理员被公共汽车撞了,你有应对的方案!如果挂载的硬盘出现故障了,你有应对的方案!如果某些人运行了rm-rf/,你也有应对的方案!增量的进行变更。记得安全更新,以及保持内容更新。使用自动的,可重复的构建过程◆不要手动构建任何东西。如果你一定需要手动构建,那么就做

4、两遍,在做第二遍的时候把用到所有的命令都提取出来。◆下面这一点十分重要:将新硬件上线到生产环境的过程不应该超过15分钟,而且这个过程必须足够简单。否则,当一个服务器出现故障,而没有人知道如何更换它的时候,你就该倒霉了。◆下面这一条是普世真理:这个世界上不存在“一次性”的服务器构建。即使你的服务器只需要构建一次,但只要你构建过一次,就一定会有第二次。比如,当它损坏的时候,或者你必须进行一次重大的升级才能让它在在接下来的两年时间里更加稳定的时候。◆测试,检查新构建好的服务器。这应该是比较容易的,因为你的构建过程都是自动化的,对吧!◆脚本化的构建,意味着从某个Linux发行版的

5、V3升级到V4应该是很快的。安装V4,对脚本进行测试。如果有问题,参考文档并修复它,直到它可以再次正常工作。这最多应该是一个星期的工作,而不是一个长达一年的浩大工程(因为那时,刚刚完成的V5已经发布了!)2/41系统运维桑昂整理(来源51CTO)使用冗余◆容易重新构建,并不意味着你可以忽视冗余。跳转盒,邮件服务器,计费网关,等等。如果其中的一半挂掉了却并不造成客户的宕机,生活将会变得更加简单。◆按照以上方针来做的话,当某个设备在凌晨3点出现故障的时候,你可以“以后再处理那个出现故障的设备!”,把冗余的机器先替换上去。◆下面这一条是个聊胜于无的解决方案:Rsync。DRBD

6、也许也不是一个完美的解决方案,但是它可以提供令人称奇的服务。(参考阅读:DRBD笔记,DRBD实例1,DRBD实例2)使用备份◆备份是个严肃的话题。使用硬盘,烧录磁带。压缩它们,移动它们,并行地运行。对每一样东西进行备份!◆如果你的构建过程是自动的,整个过程都可以被备份。如果到目前为止的几条你都做到了,那么一个真正的“灾难恢复”计划也许并不是那么遥不可及的。监控正确的东西◆监控你能监控的所有东西,而且要用正确的方法来进行监控。如果你的NFS服务器挂掉了,不要让你的监控工具发送1000条警报。如果对你的系统来说,超时的警报没有什么实际意义,那就别让它发。要针对各种具体的情况

7、进行成功性测试:是的,这个服务可以进行一个新的TCP连接,它甚至可以响应,但是它还记得它要做什么工作吗?◆如果你有500个Web服务器,其中一个挂掉了,你可能不必马上知道这个情况。但是,如果负载均衡器没有把这台机子踢出去,导致错误报告出现在了用户的屏幕上,那么你必须知道这个情况!有关数据图形化,历史数据◆图形的作用是让趋势可视化。历史数据的作用是让你对数据进行精确的分析。不要把这两者混为一谈!对图形进行目测,很容易获得错误的数值。许多站点都使用rrd类型的系统或其他的数据聚合系统,此类系统按照时间对数据进行平均化处理,然后保存

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。