在互联网行业中,云计算基础设施技术具有非常重要的作用与影响,一方面,在电商、金融科技、云计算、大数据、AI等重要战略领域发展的过程中,云计算基础设施技术的重要支撑作用已经无可替代;另一方面,云计算基础设施技术已经成为许多类型业务的直接竞争力,甚至在云计算、AI等领域中,计算能力、存储能力、网络能力都成为业务的一部分。本书将详细地阐述阿里巴巴在基础设施上的实践细节及先进技术,包括数据中心、网络、服务器、计算硬件、存储硬件,以及智能化运营与自动化运维等内容。
本书是由AIS(Alibaba Infrastructure Service)组织编写的,历时三年,AIS是负责阿里巴巴集团所有基础设施的研发、运营、维护等工作的部门。本书梳理了基础设施演进过程中的思路、得失、最佳实践、未来路径规划等,可以让IT企业的管理者、软件工程师、测试工程师、运维工程师、软件架构师、技术经理能够更清晰地知道基础设施的根本在哪里,而且还可以让IT企业客户对基础设施的发展和未来有一定的了解,以便更好地使用基础设施提供的技术和服务,让阿里巴巴在基础设施上的经验成为国家和行业基础设施发展的参考。
本书是对阿里巴巴云计算基础设施技术实践的全面总结,它不仅全方位地描述了作为阿里巴巴经济体数字化基石的云计算基础设施技术诸多细节,更是一部芯片、存储、网络,以及云计算技术演进的风云变幻史,本书是值得记入中国IT技术历史浓墨重彩的一笔!
本书得到了阿里巴巴集团CTO兼阿里云智能事业群总裁张建锋(行癫)、阿里巴巴集团副总裁基础设施事业部负责人周明、中国信息通信研究院云计算与大数据研究所所长、开放数据中心委员会名誉主席何宝宏三位的亲笔作序推荐。
主要作者简介
高山渊,花名康伯,2004年进入互联网行业,2007年加入阿里巴巴集团,先后负责过阿里巴巴的CDN运维、聚石塔、大数据平台(ODPS/Hadoop)、云计算、服务器、数据中心等运维和研发工作,现担任AIS(阿里巴巴基础设施事业部)首席架构师及IDC研发事业部总经理。
蔡德忠,阿里云智能基础设施首席网络架构师,负责阿里巴巴基础网络架构工作,主持设计了全新一代高可靠、高智能和低延时(HAIL)数据中心架构,以及基于SDN和SR的全球网络流量调度系统,领导了阿里巴巴IPv6的架构设计和大规模部署。在此之前,Dennis 作为思科 Distinguished Engineer,在美国思科担任运营商事业群全球市场产品和解决方案 Lead Architect。联合著作及贡献过多项Internet RFCs 标准和十几项美欧专利。获得清华大学工学学士,北京大学和美国 DePaul University 计算机科学硕士学位。
赵晓雪,现任阿里巴巴研究员,阿里云智能基础设施智能运维团队负责人。加入阿里巴巴之前在美国谷歌总部基础设施部门任职多年。在数据中心,云计算和网络等领域都有丰富的研究和实践经验。美国加州大学伯克利分校博士。拥有多项专利和论文。
前 言
随着云计算的广泛应用,特别是为创新企业带来的低成本、高效率赋能创新的优势,云计算基础设施技术成为当下创新非常活跃的领域。
为什么写本书
阿里巴巴的云计算基础设施技术的演进和发展,是阿里巴巴集团整体发展的一部分,也是阿里巴巴未来业务能否成功的核心因素。在这个过程中,我们有很多的思考和实践、尝试和创新,以及经验和教训,并取得了一定的成果,面向未来也有了越来越明确的思路和规划。我们希望通过这本书将云计算基础设施技术的过去、现在和将来呈现给读者,让阿里巴巴在云计算基础设施技术上的实践经验成为国家和行业云计算基础设施发展的重要参考。
本书主要内容
本书针对云计算基础设施技术的各方面做了概要性的介绍和说明,包括互联网数据中心(IDC)、网络、服务器计算、存储、智能化等。这些方面的每一项都是一个非常专业和复杂的技术领域,本书力图能简明扼要地加以说明。
第1章 基础设施架构综述,简要介绍云计算基础设施技术的范围、价值、挑战等。
第2章 TCO建模,介绍TCO的概念,数据中心、服务器、网络设备的TCO组成,以及如何在系统层面进行TCO分析和建模,并做出最优的选择。
第3章 数据中心能效,介绍如何系统地评估数据中心能效水平,如PUE、SPUE、IUE等。
第4章 数据中心,介绍狭义数据中心的核心技术,包括供电、制冷等的挑战、发展趋势。
第5章 数据中心网络架构和关键技术,介绍阿里巴巴数据中心的网络架构和关键技术,包括历史回顾、架构理念、高性能网络、网络可视化等。
第6章 服务器技术,介绍服务器的硬件组成、演进、挑战等。
第7章 计算硬件技术,介绍通用计算、异构计算、总线互联等。
第8章 存储硬件技术,介绍内存、HDD、SSD及阿里巴巴自研存储产品AliFlash等。
第9章 基础设施智能化运营与自动化运维,介绍大规模云计算基础设施的运营和运维的自动化、数据化、智能化等内容。
第10章 IDC、网络、服务器的一体化,介绍如何在技术演进中让IDC建筑、网络大集群、服务器协同发展,并提供最优的解决方案。
第11章 总结及展望,面向未来,云计算基础设施技术如何进一步提升能力、支持创新。
致谢
本书从策划到成稿,再到出版经历了三年多的时间,前后有百余位同事参加了规划、构思、写作、校对等工作,署名的作者及致谢名单未能将每一位参与者一一列出,在这里一并致谢。
感谢在本书写作过程中基础设施事业部的各位管理者给予的支持,给予本书大方向的把控及人力上的支持。
感谢电子工业出版社的认可,让本书得以出版,感谢孙学瑛老师及其团队细致、艰苦的工作,让本书最终能够与读者见面。
由于作者水平有限,书中不足及错误之处在所难免,敬请专家和读者给予批评指正。
高山渊
2019年12月
1