本书介绍的是从海量数据中发掘知识的方法。但海量仅仅是表象,随着数据规模的扩大,随之而来的整个应对方式也需要进步,就像现代大工业对应于传统手工业不仅仅是生产规模的扩大,而是整个产业革命的差距。这个差距,首先表现在算法上,如果说传统的数据分析算法是手工作坊的锤子和砧板,那么数据挖掘算法就是现代工业的机床和马达。但是本书和普通的数据挖掘教程最大的不同,就是它不仅仅是数据挖掘算法的罗列,就像现代工业不仅仅是机床和马达,更重要的是如何把机床和马达组合成流水线,并配以合适的管理制度。
数据挖掘在国内外都是一个前沿的新课题,特别是从项目管理者的角度阐释的数据挖掘更是国内首创的视角。结合作者多年国际大企业的工作经验提供的丰富案例,由浅入深,不仅仅有算法理论,还有实际解决方案的思路、规划,高屋建瓴,有更大的读者群。