当前,经典的数据挖掘算法日趋成熟,相关标准和技术已经在各行各业得到广泛应用。为了使数据挖掘技术满足不同层次用户的需要,可视化数据挖掘技术被提出,通过可视化的手段...
深度学习如今已经成为了科技领域最炙手可热的技术,在本书中,我们将帮助你入门深度学习的领域。本书将从人工智能的介绍入手,了解机器学习和深度学习的基础理论,并学习如...
Docker Swarm作为Docker集群原生的容器编排解决方案,是Docker生态系统中的关键组件之一。《Swarm容器编排与Docker原生集群》涵盖了S...
Gephi 是一款网络分析领域的数据可视化处理软件,开发者对它寄予的希望是成为“数据可视化领域的Photoshop”。本书介绍了Gephi 的运行方式及操作方式...
这是一本让人脑洞大开的内容玩法书,给新一代叙事者提供了十八般武器。清晰的构架、简洁的语言、坦率的态度,整本书无不流露着新一代互联网原住民颠覆传统的创新基因。 ...
面向电商企业的运营人员,数据分析人员,针对淘宝、天猫做SEO优化时,SEO优化所涉及到的十几个优化参数,例如:上下架时间、DSR动态得分、30天销量等等这些公开...
大数据是互联网、移动应用、社交网络和物联网等技术发展的必然趋势,大数据应用成为当前最为热门的信息技术应用领域。本书由浅入深,首先概述性地分析了大数据的发展背景、...
大数据时代,掌控数据首先需要掌握数据的处理能力。俗话说,“工欲善其事,必先利其器”。Informatica PowerCenter作为业界广泛使用的数据处理工具...
深入浅出地讲述了在“数据为王”的时代下,统计作为分析、解读数据的学科,如何为商业、社会、生活等领域提供决策支持。第一章概述了大数据时代统计学面临的机遇和挑战。第...
数据开发能力已成为企业核心竞争力。到底什么样的工具才能帮助企业与客户需求建立联系? 读者可以从本书中找到满意的答案。本书最大特点是指导读者用Ruby, Pyth...
R是一种可用于统计计算和作图的编程语言及环境,可提供广泛的统计(例如,时间序列分析、线性及非线性建模、经典的统计检验)及作图技术,并且具有高度的扩展性。本书中以...
本书介绍了如何开发网络爬虫。内容主要包括开发网络爬虫所需要的Java语法基础和网络爬虫的工作原理,如何使用开源组件HttpClient和爬虫框架Crawler4...
本书为非专业数据技术人员提供了一种有效利用数据解决问题的思维方法——数源思维。这种方法的简单描述,就是“从业务中来,回业务中去”。本书的上篇使用实例和典故详解了...
本书采用Python编程语言、Pandas数据分析模块、机器学习和人工智能算法,对足彩大数据进行实盘分析。设计并发布了开源大数据项目zc-dat足彩数据包,汇总...
本书对Tableau的产品、优势、Tableau 9.0的新特性及其功能做了全面的介绍,并且从十五个不同行业的案例入手,让你在阅读本书后能够从一个新手成长为能够...
《Spark GraphX实战》是一本Spark GraphX入门书籍。前5章为基础内容,即使读者对Spark、GraphX、Scala不熟悉,也能快速上手;后...
本书以实用的、可操作的视角解释了大数据——采用黑猩猩和大象的隐喻,基于棒球统计数据集,使用Apache Hadoop和Pig等工具展示了如何处理大规模数据。此外...