伴随着大数据时代的发展,数据价值的挖掘以及产品化逐渐被重视起来。本书作为该领域的入门教程,打破以往的数据工具与技术的介绍模式,凭借作者在大数据价值探索过程中的所感所悟,以故事的形式和读者分享一个又一个的数据经历,引人深思、耐人寻味。全书共9章,第1~2章介绍数据情怀与数据入门;第3~6章讨论大数据挖掘相关的一系列学习体系;第7~9章为实践应用与数据产品的介绍。让所有学习大数据挖掘的朋友清楚如何落地,以及在整个数据生态圈所需要扮演的角色,全面了解数据的上下游。
本书可作为相关工作经验在3年以内的数据挖掘工程师、转型入门做大数据挖掘的人士或者对数据感兴趣的追逐者的轻松学习教程,引导大家有一个正确的学习方向,也可供对数据产品感兴趣的产品经理和数据挖掘工程师阅读参考。
不依赖工具包,结合场景个性化构建业务模型。
初学者的入门枕边书,传统挖掘者的进阶之路。
前 言
这是一本关于大数据挖掘与数据产品的参考读物,为了使尽可能多的读者通过本书对大数据应用有所了解,笔者以个人所感所悟引导初学者正确学习大数据挖掘。但是基础知识归纳、开发环境部署、算法原理的介绍都是不可避免的。因此,本书更适合于工作经验在3年以内的数据挖掘工程师,以及转型入门做数据挖掘的人士,或者是对数据产品感兴趣的追逐者阅读。
全书共9章,第1~2章介绍数据情怀与数据入门;第3~6章讨论大数据挖掘相关的一系列学习体系;第7~9章为实践应用与数据产品的介绍。
本书在内容上尽可能以故事的形式,轻松愉快地介绍大数据、数据挖掘与数据产品实践应用的各方面内容。但作为学习方向性的引导读物且考虑到本书主题,很多常见的算法、技术知识点未能覆盖,毕竟相关的内容在网上已经有很多了,但大多数内容只是“术”,而缺乏“神”。所以本书才另寻思路,以笔者的真实经历告诉读者在学习过程中可能会遇到的“坑”,以及该如何正确学习。因此,建议有兴趣的读者进一步钻研探索,结合更多的学习资料实践应用。
笔者认为,大数据时代的发展,已经逐渐从基础性的建设、数据的积累,慢慢转变成对于数据价值的探索以及业务痛点的落地解决。因此,建议更多的数据挖掘学习者要结合业务场景思考,多了解数据生态圈的上下游,认清数据产品价值的重要性,以及知晓自身在整个数据流程中所扮演的角色的重要性。阅读这些内容的意义远远超过对数据分析工具、算法模型的熟练度的意义。
大数据、人工智能发展极为迅速,但是数据价值的输出仍然存在瓶颈,极大的原因是由于广大追逐者在对数据探索时走向了误区,把更多心思放在了“玩转数据”,而不是真正地解决业务痛点。所以,希望阅读本书的每一位读者都能够从笔者的过往经历和所感所悟中感受到数据之禅。参与本书编写的人员还有王勇老师,在此表示感谢。
笔者自认自己还有许多需要学习的地方,同时时间和精力有限,书中不足之处在所难免,望广大读者批评指正,不胜感激。