大数据:技术与应用实践指南(第2版)
  • 推荐0
  • 收藏0
  • 浏览806

大数据:技术与应用实践指南(第2版)

赵刚 (作者)  张国霞 (责任编辑)

  • 书  号:978-7-121-28150-1
  • 出版日期:2016-04-05
  • 页  数:316
  • 开  本:16(185*235)
  • 出版状态:上市销售
  • 维护人:董英
大数据是互联网、移动应用、社交网络和物联网等技术发展的必然趋势,大数据应用成为当前最为热门的信息技术应用领域。本书由浅入深,首先概述性地分析了大数据的发展背景、基本概念,从业务的角度分析了大数据应用的主要业务价值和业务需求,在此基础上介绍大数据的技术架构和关键技术,结合应用实践,详细阐述了传统信息系统与大数据平台的整合策略,大数据应用实践的流程和方法,并介绍了主要的大数据应用产品和解决方案。最后,对大数据面临的挑战和未来的趋势进行了展望。第2版,对于这几年的发展做一个补充。
1、赵刚博士在信息化领域耕耘10余年,对大数据的认识深刻且系统。
2、阐述的视角放在了大数据的技术应用上,对于想利用大数据的读者非常具有参考价值。
3、结合应用实践,详细阐述了传统信息系统与大数据平台的整合策略,大数据应用实践的流程和方法,并介绍了主要的大数据应用产品和解决方案。

随着新一代信息技术的发展和应用,尤其是互联网、物联网、移动互联网、社交网络等技术的发展,我们正在进入大数据时代。介绍大数据的理念和技术的书刊纷纷出现,但很多读者看后可能仍感到不解渴,究其原因是这些书刊没有为读者构建一座连接宏观的理念和深奥的技术细节之间的桥梁,而有关大数据系统性应用实践的书籍更是凤毛麟角。为此,我向大家推荐这本书,它从大数据技术应用的角度切入,建立了大数据业务价值与技术架构之间的映射关系,内容丰富,条理清晰,深入浅出,难易适度,使读者能够系统地了解大数据的技术应用体系。
大数据从数据挖掘、商业智能发展而来,是信息技术发展的必然产物。国家“十二五”规划要大力发展包括新一代信息技术在内的战略性新兴产业,大数据就是新一代信息技术的重要领域。它不仅是一次技术领域的革新,技术人员必须了解它、研究它、运用它,而且它还将推动企业创新和社会变革,因此各行各业的人员都必须重视它、发展它、推动它。
大数据应用不能一蹴而就,必须遵循科学的方法循序渐进。无论是从业务的角度还是从技术的角度,要将大数据应用讲清楚都不大容易,尤其是要使非本领域的专家能对大数据有一个全面的了解更非易事。为了帮助读者对大数据应用有全面、系统的认识,而不只是知道一些零散的技术或服务术语,作者站在系统论的高度对大数据应用做了高度的概括,涵盖了大数据的基本概念、业务需求、技术架构、应用集成、实践方法、产业链和制度保障等七个方面,也构成了本书的七个章节。这种结构化、系统化的思想贯穿全书,成为本书的一大特色。本书对普通读者、与大数据有关的管理人员和技术人员都有帮助,可以使他们全面、深刻地理解和把握复杂的大数据。
作者提出了大数据应用的业务流程,分析了行业中的共性业务需求和个性业务需求,并且详细阐述了满足这些业务需求的大数据技术,也介绍了新的大数据技术和现有技术架构的整合。大数据在一些互联网公司有了很好的应用,其他行业也在关注大数据。本书列举出一些实例,给出了大数据应用的流程和方法论,强调了大数据对商业社会的巨大的变革力量。虽然大数据还是一个新事物,开始时人们难免对其有所怀疑,不敢贸然使用,但越来越多的“吃螃蟹者”已经证明大数据能创造出重大的社会效益和经济效益。在当前这场大数据引领的变革浪潮面前,我们应当直面挑战、勇于创新,大胆地应用大数据技术。实际上,在激烈的市场竞争中,不创新的风险往往比创新的风险更大。
本书对大数据的写作高屋建瓴、深入浅出,这与作者的背景是分不开的。本书作者赵刚博士一直在中国电子信息产业发展研究院从事信息技术应用的研究、咨询和实践工作,承担了多项信息技术战略规划和应用实施项目,有丰富的企业级信息架构的规划和建设经验。2013年,他又创办了北京赛智时代信息技术咨询公司,致力于企业级大数据技术的应用咨询和实施工作,发布了银行、保险、电子商务等行业大数据的应用研究报告,在大数据应用领域做了很多工作。从事产业研究、信息化咨询和信息系统集成的多重背景和学术造诣,使他能把大数据的业务需求、技术架构和产业链分析在一本书中上下呼应、融会贯通地阐述清晰。
赵刚博士在本书最后提出,大数据是国内企业迎头赶上的大好机会。我们相信,国内越来越多的大数据公司将会用自己的创新实践证明这一点,中国完全有可能乘大数据的变革之机实现中国信息产业的跨越式发展。
综上所述,本书可以为一切想了解大数据技术应用、建设大数据企业级应用架构、享受大数据分析之美的读者提供一把开启大数据世界的钥匙,即使是对大数据有所研究的人士,本书的系统性的视角也可以使他们了解全局、开阔思路,所以本书具有很高的参考价值。

中国工程院院士 倪光南

前  言
随着互联网、移动互联网、社交网络、物联网、云计算等新一代信息技术的应用和推广,人类产生的数据成倍增长,数据种类繁多,数据在宽带网络中高速流动,数据的待开发价值越来越大,我们已经进入了大数据时代!短短两三年,大数据的理念已经深入人心,大数据的技术也层出不穷,但大数据技术的应用才刚刚开始。本书把阐述的视角放在了大数据的技术应用上,通过分析大数据应用的关键成功因素,希望为政府、行业和企业的大数据技术开发和应用人员提供一本框架性和系统性的技术与应用实践指南。
全书共分为7章。
第1章是大数据的概念和发展背景,回顾大数据理念和技术的发展历程,梳理大数据发展脉络,并从大数据的体量、数据类型、速度和潜在价值等4个特征定义大数据。
第2章分析大数据应用的业务需求,梳理企业级大数据应用的业务流程,剖析大数据应用对于组织的业务价值,并深入分析互联网、零售、金融、电信、能源等9个行业的大数据应用需求,总结企业级大数据应用的客户分析、绩效分析和风险分析等共性需求。
第3章阐述大数据应用的总体架构和关键技术。总体架构分析基于Apache开源的大数据平台总体架构的参考模型,涵盖了大数据处理、大数据存储、大数据访问、大数据调度、大数据分析展现、大数据与传统数据库连接、大数据管理、安全和备份恢复框架等技术,能够为企业建设大数据应用平台提供框架参考。基于这一架构,本章进一步详细介绍了大数据存储和处理、大数据查询分析、大数据高级分析和可视化等3个方面的关键技术。Hadoop是重要的大数据技术,本章详细介绍了Hadoop的三大核心技术,即分布式文件系统HDFS、分布式计算框架MapReduce、分布式数据库HBase的技术原理、技术构成和应用示例,也详细介绍了Spark等内存计算及Storm等流计算框架。针对大数据查询和分析,本章介绍了SQL on Hadoop技术,包括Hive、Impala等。大数据高级分析和可视化技术也是大数据的关键技术,本章总体阐述了大数据挖掘与高级分析的算法和技术,对非结构化的复杂数据的分析、预测分析和开源的R语言进行了重点介绍,并介绍了大数据可视化的一些工具。
第4章阐述大数据技术应用与企业级应用系统的整合策略。现有企业级数据分析是以关系型数据库为基础的,建立了涵盖网络、存储、服务器、虚拟化、云计算和信息安全等方面的企业IT架构,大数据技术的企业级应用需要实现与这些技术的高效整合,构建新一代的企业级应用架构。本章分别介绍了大数据传输、接入、集成和流程化管理,大数据与存储架构的整合,大数据对网络架构的发展,大数据与虚拟化技术的整合,大数据与容器技术的整合,云计算平台上的大数据云,以及大数据与信息安全等7个方面的内容。
第5章介绍了大数据企业级应用的实践方法论和应用案例。大数据应用的实践方法论阐述了业务需求定义、现状分析、架构规划与设计、技术切入与实施,以及试用、评估与推广等大数据应用的开发流程。通过对Google、Yahoo、Facebook、Amzon、淘宝网等互联网企业应用案例的分析,试图为大数据技术应用和实践提供技术细节和实施方法方面的参考。
第6章介绍了大数据应用的主流商业解决方案。首先介绍大数据产业链上的主要厂商,并进一步介绍了9家主流厂商的解决方案。
第7章是对大数据应用中未来挑战和发展趋势的分析。主要讨论了隐私保护、技术标准、大数据治理等应用发展中的关键挑战和应对策略,最后预测了大数据应用下商业生活的发展趋势。
全书以某商业银行基于大数据的客户分析为案例,便于读者根据案例所阐述的应用场景,结合自身的需求学习和掌握大数据技术应用。
本书的写作最大程度地得益于从事大数据技术研发、应用和研究的社区、业界同仁和爱好者。笔者起的作用仅仅是穿针引线,将大数据技术应用开拓者们分享的研究和应用心得进行了总结,希望有助于更多技术研发、应用人员和爱好者系统地学习和应用大数据。本书也提供了这些成果的网上链接,读者可以更加深入地去学习和研究。当然,本书基于作者在信息化领域多年的研究、咨询和系统集成的实践经验,也基于作者所创立的北京赛智时代信息技术咨询有限公司(www.CIOManage.com)在大数据领域的研究成果。本书引用了CIOManage(赛智咨询)的很多研究成果。感谢所有为大数据技术的应用而努力的同仁们!
本书再版之际,笔者诚惶诚恐,大数据技术远未成熟,大数据技术应用也刚刚拉开帷幕,这样一本技术应用实践指南一定存在诸多问题。但技术应用本来就是一个不断改进和优化的过程,希望笔者和读者在共同学习和应用的过程中,逐步总结出更为精确和实用的经验。欢迎读者与笔者交流,笔者的联系信息如下。
◎ 微博:http://weibo.com/blogbot
◎ 博客:http://blog.sina.com.cn/blogbot
◎ 邮箱:blogbot@sina.com
◎ 微信号:Knowbot

赵刚
2016年1月5日于北京嘉铭园



目录

目录 阅读
第1章 大数据的概念和发展背景
第2章 大数据应用的业务需求
第3章 大数据应用的总体架构和关键技术
第4章 大数据与企业级应用的整合策略
第5章 大数据应用的实践方法与案例
第6章 大数据应用的主流解决方案
第7章 大数据应用的未来挑战和趋势

读者评论

电子书版本

  • Epub

相关图书

Unreal Engine 4可视化设计:交互可视化、动画与渲染开发绝艺

Tom Shannon (作者) 龚震宇 (译者)

Shannon回答了有关UE4可视化问题的常见问题,解决了从数据导入和处理到照明、高级材料和渲染等问题。他揭示了UE4与传统渲染系统重要的不同之处,即使它们使用...

 

虫术——Python绝技

梁睿坤 (作者)

本书以大数据应用方面常用的语言Python为基础,从网络爬虫的实现原理入手,逐步引领读者进入网络爬虫的世界。在各类爬虫框架中,将Scrapy作为轴心,从多个维度...

¥99.00

Scala高性能编程

Vincent Theron (作者) 杨云 (译者)

Scala是一种表达能力非常强的语言,能够用非常简洁的代码表达丰富的业务含义。为了在生产上充分发挥Scala的能力,除了掌握其简洁的语法外,理解Scala在性能...

¥69.00

网络爬虫全解析——技术、原理与实践

罗刚 (作者)

本书介绍了如何开发网络爬虫。内容主要包括开发网络爬虫所需要的Java语法基础和网络爬虫的工作原理,如何使用开源组件HttpClient和爬虫框架Crawler4...

¥49.00

全栈数据之门

任柳江 (作者)

本书以数据分析领域最热的Python语言为主要线索,介绍了数据分析库numpy、Pandas与机器学习库scikit-learn,使用了可视化环境Orange ...

¥49.00

Druid实时大数据分析原理与实践

欧阳辰 刘麒贇 张海雷 高振源 许哲 (作者)

Druid 作为一款开源的实时大数据分析软件,最近几年快速风靡全球互联网公司,特别是对于海量数据和实时性要求高的场景,包括广告数据分析、用户行为分析、数据统计分...

¥59.00