本书总结汇总了系统运维管理相关知识经验,针对当前运维工作所涉及的主流知识经验进行归纳与演绎,并捎带一些进阶提高。希望带给读者一种思路和视野。本身涉猎内容广泛,有管理流程知识、也有专业技术知识;有运维常识,也有开发介绍;既有软件论述、也有硬件介绍;既有系统常用知识、也有云计算虚拟化等专项内容。限于本人学识及篇幅,文章内容有简有繁,详略相济。本书有意从实践出发,以避免真大空的理论,但考虑授人以鱼不如授人以渔,所以理论知识也是必备的。
大型传统企业和大型互联网企业多年工作经验总结出的一部操作指南式的实战教程
序 言
当本书作者邀请我为此书做序时,我便欣然接受了。想想原因有三:一是年轻人把自己工作积累和技术沉淀整理成书并分享,实在是一件值得鼓励的事情;二是通过这本书,能让业界一窥新华网的技术现状和发展,更好地了解和推介新华网,不也是一箭双雕的事情么?当然,还有一个重要原因便是,毕竟当年自己也从事过网络和系统运维,做过开发,具有多年的IT从业经验,照理说写个序也费不了多少事。然而,当我浏览完书稿,一时竟不知道如何下笔,心中颇有些感叹:IT技术的日新月异,今天的系统运维远远不是昨天的系统运维了,需要掌握的基础知识与技能实在是太多。只有重视基础知识和技能,扎扎实实从底层做起,才能在系统运维这个岗位上做出成绩。也许,这就是这本书的价值。
在整个IT体系中,系统运维既是一项基础性工作,也是一个为业务安全正常运行提供保障和支撑的重要岗位。在许多IT从业者眼里,系统运维工作既是一个苦活累活,也是一个巧活细活;既要有吃苦耐劳、勤奋好学的精神,也要有迎难而上、灵活巧干的追求。说句实在话,对智力和体力都是一个不小的考验。
虚拟化、容器、NOSQL、HADOOP、SPARK......层出不穷,令人眼花缭乱,云计算、大数据、移动通信等互联网新技术不断演进,系统运维的技术含量越来越大,对系统运维人员的综合素质及能力要求也越来越高,系统运维也不再是部署部署系统、写写管理脚本那么简单了。而且,随着业务应用越来越复杂,设备数量越来越多,管理难度越来越高,运维人员必须高屋建瓴,全面谋划,有能力提供一个全局性、高效健壮、标准规范、自动化的解决方案并加以实现。
本书作者及运维团队主要负责新华网技术平台的网络和系统运维工作。在新华网技术平台升级换代过程中,他们全程参与了技术架构的规划、设计、实施和测试等全过程,解决了各种各样的技术问题,积累了多方面的运维经验和技术技巧。本书就是在此基础上作者结合实际工作经验和技术积累进行的系统梳理和总结。或许由于作者年轻,阅历浅,本书还略显稚嫩,在资深者看来个别地方还较为浅显,但本书好就好在实用性强,特别适合于实操。知易行难,说一尺不如做一寸,想到做到就是一种难能可贵的态度。
本书全面系统地介绍了系统运维体系的点、线、面,融入了大量的实践经验和技术技巧总结,内容涵盖广泛。既有运维管理流程和运维技术要点,也有运维常识归纳和运维开发介绍;既有运维软件论述和硬件运维介绍,也有系统常用知识汇集,还有关于云计算虚拟化及应用服务器搭建等专项内容。相信本书一定会给读者带来价值与收获。我非常期待此书能早日与读者见面。
新华网副总裁 罗毅
前 言
本书初衷
有朋友问我系统运维是做什么的,是不是类似网管天天修电脑?对此问题,我一言难尽,其实运维工作涉及的东西很多。此时我便有一种冲动,去写一本关于系统运维的书,介绍一些事实真相。
翻读《史记》让人感到历史的厚重,人类的历史就是不断认识自己、认识社会、认识这个世界的过程,人类在自导自演中创造了社会文明。但是,试想山间花果的荣枯,若你看不见闻不到,则对你来说它们似乎不存在。当然,也正是历史学家(哲学家)们传承了历史文明,使我们能够明鉴历史、知晓未来。此时,我知道了写书的意义所在。
古今中外哲学家们,由于所处环境与经历不同,他们对同一个世界的实践与认知也千差万别。他们都有各自的独到见解,都从某些方面解读了这个世界,他们的见解都是很有价值的。系统运维工作何尝不是这样?十里不同风,百里不同俗,每个企业、每个人对系统运维工作或许都有各自不同的实践与认知。因此,我有了自信和视角去阐释一道别样的运维风景。
总之,我们每一人都是这个社会一份子,共同演绎着历史,为人类历史文明的发展作砂砾而聚高山。出于此,我想我应该将自己的知识经验记录下来,分享出去,贡献自己的能量,纵是砂砾,也是高山的一份子。
IT系统运维是IT历史的一个支流,也是本书要叙述的内容。历史与哲学其实是一家,而我下面要做的不仅仅是运维知识的叙述总结,同时更是对运维体系、运维之道探索的过程。
本书总结了作者多年来的知识经验,对当前运维技术、管理与实践进行了探讨。本书力争做到简约不简单,避免将事情越说越复杂,希望带给大家的是思路和视野。至于以后的道路,我相信真正的大师高手是磨炼出来的,而不是依靠翻阅一部宝典就能即刻变大神。
限于作者的水平、经验及本书的篇幅,文章内容有简有繁,详略相济。本书有意从实践实例出发,以避免真大空的理论,但考虑授人以鱼不如授人以渔,所以理论知识还是要有的。
如何阅读本书
本书没有必然的先后顺序,但建议从前往后看。每一章开头会概括本章的主要内容、技术应用领域与价值,以及学习完本章内容后的预期效果。每章正文通常先对一些基础理论知识进行简述,然后会列举大量实践案例进行说明阐述。
第1、2、3、4章主要介绍运维体系规划、项目管理、IT服务管理、信息安全相关领域知识与技能。这些内容引导读者从高视野、大角度、全方位地审视系统运维工作,掌控运维体系。
第5、6、7、8章主要介绍操作系统运维与实践。这些内容引导读者掌握主流操作系统的应用技能。这是运维人员必要的基本功。
第9章主要介绍系统运维监控。本章内容引导读者掌握主流运维监控产品、体系原理与应用,对当前监控技术一览众山小。监控是系统运维体系的重要组成,是运维人员的必需辅助技能。
第10章主要介绍IBM小型机。本章将引导读者掌握小型机硬件管理与实践技能。这对深入理解AIX系统、IOE体系有很好辅助。
第11章主要介绍存储产品、体系原理与应用,对当前存储技术通观全局。存储也是运维体系的重要组成,是运维人员的必需辅助技能。
第12章主要介绍运维开发与运维自动化概念、技术与实践。本章内容是很多运维人员的技术软肋,当然也是运维人员成为复合型、高技能人才的杀手锏。
第13、14、15、16章主要介绍虚拟化、云计算、大数据相关产品、体系原理与应用。这些内容越来越与运维人员休戚相关,是传统运维转型新时代(云)运维的必需知识技能。
第17章主要介绍Windows性能与Debug。掌握这些内容,将使读者在Windows运维实践方面提升到一个高手的高度。
第18、19章主要介绍系统集群、Web服务器运维原理与实践。这些内容有助于读者理解大型企业系统集群体系、搭建与管理系统集群。
致谢
一本书也是一个系统工程项目,得益于很多人的参与和帮助。
首先感谢董英及她的同事(电子工业出版社),是她搭建桥梁,帮助我实现了本书的梦想。她专业、热情与随和,为本书创作花费了很多精力,提了很多中肯的建议,帮我规避了很多不足。
感谢我的团队信任与配合。参与本书创作及运维开发的同事有:彭燃、史影、童宁、高浩天、任勇斌、王天维。他们富有活力,善于开拓创新,乐于解决问题,工作因此出彩。
感谢孙经理(孙海骅 中国航信系统管理经理)、高工(高迪 中体彩科技架构师)。他们对本书稿提出了诸多专业建议。
感谢罗总(罗毅 新华网副总裁)、姬主任(姬连春 新华网研发主任)对我及运维团队的信任与支持,使得我们团队快速成长。
感谢琦总(王琦 新华网研发副总)对本书稿的审阅与建议,以及对我们日常工作的支持与照顾。
感谢我的父母、妻子及家人!
写书感悟
写书不易!本书执笔人经历了春夏秋冬,几百个日夜。自己不仅要会做一件事,而且要捋顺前因后果,还得能把事情讲明白,最难的是简明扼要讲清楚,正所谓:大道至简。因此执笔人意欲从实践案例出发,简明阐述问题,避免深奥或者空泛的理论。
本书不能穷举所有运维技术,但希望本书能够助读者开阔视野,给大家带来一束光亮,纵然不能照明所有模糊不清的地方,至少让大家看到一条路子,找到一个方向,减少大家摸索成长中的迷惑与歧路。
本书不是什么宝典,也不相信会有什么秘籍能让人看完即刻练就神功奇术。只有不断认知与实践,做到知行合一,方为至善,至运维之大道。
勘误与支持
由于作者水平经验有限,书中难免会有错误与不准确的地方,恳请广大读者批评指正,真诚期待交流互动。