阿里巴巴云上数据中台正服务着阿里生态中的数十个业务板块、百余家公司、千万级客户,在帮助决策层看清甚至决定业态走向的同时,在上万个业务场景中应用并催生创新。
本书基于作者在阿里巴巴的十年大数据从业经历,精彩演绎云上数据中台之道。全书基于大数据探索的大趋势,讲述阿里巴巴云上数据中台顶层设计,再以实际案例详述阿里巴巴云上数据中台建设及其业务模式的形成过程,总结云上数据中台沉淀的独特价值,并开诚布公地分享阿里巴巴以赋能为本质的大数据战略。
作者希望通过一名老数据人发自肺腑的分享,帮助尽可能多的有志于大数据构建、应用与创新者,构建自己的云上数据中台,从而拥有既“准”且“快”的“全”“统”“通”的智能大数据体系,以驱动各类业务数据化与数据业务化创新!
联动阿里巴巴云上数据中台能力与阿里云云上服务
基于十年大数据亲身经历,精彩演绎数据中台之道
推荐序
从大数据的概念被正式提出,到马云老师预言人类正从IT 时代走向DT 时代,大数据浪潮迭起。大数据同仁共同认知的一点是,大数据会对社会创新、产业变革、业务创新及每个人的角色定位产生近乎决定性的影响。
马云老师早在2014 年就提出了业务数据化和数据业务化,阿里巴巴因此付诸行动,通过全局数据监控、数据化运营、数据植入业务场景的各个链路等推进业务数据化;通过统一商家端数据产品、计量信用分,以及风险预测与防控等,推进数据业务化。但与此同时,我们也清楚地知道,在实现这个愿景的道路上存在着很多挑战,其中,如何提升大数据能力则是关键。
在2014 年以前的阿里巴巴,我们的计算资源分散各处,我们的数据指标经常相互冲突,我们的数据应用大多从数据源头向上耗费大量资源进行垂直开发。这种状况无法可持续地推进业务数据化与数据业务化。于是,阿里巴巴数据人协同起来,从业务视角而非纯技术视角出发,建设既“准”且“快”的“全”“统”“通”的智能大数据体系。其间,在极致追求技术提升的同时,我们自成OneData、OneEntity、OneService 三大体系,开发了致力于智能数据构建与管理的Dataphin、高效数据分析与展现的Quick BI 等产品,培育了一大批独具阿里特色的大数据人才,云上数据中台的建设也就水到渠成了。
今天的阿里巴巴,几乎所有的业务都运行在大数据之上,几乎所有的小二都在用大数据改善工作甚至创新。云上数据中台正服务着阿里生态中的数十个业务板块、百余家公司、千万级客户,在上万个业务场景中应用并催生创新。而每一年的双十一都在上演着数据奇迹。
以2016 年的双十一为例,当天实时计算处理的数据量达到9400 万条/ 秒,面向业务系统提供应用服务的单日数据调用约百亿次,而全链路完成数据采集、整合构建、服务展现仅需2.5 秒,这些惊人的数字背后是因为有强大的云上数据中台大数据能力在支撑。
如今,中国正处于数字化转型阶段,政府的各个部门及各行各业越来越相信大数据的力量。我们认为,这套在阿里生态内实战过的云上数据中台大数据能力及其推进业务数据化、数据业务化的云上数据中台业务模式,可以在阿里生态之外推而广之,赋能全社会!
2016 年9 月,我们不再将云上数据中台深藏于阿里生态内,开始以亲身经历的各种积淀对社会各界有志于大数据战略者伸出合作之手,帮助诸如零售、旅游、环保、地产、传媒、运营商、文教、政府部门等领域的客户构建自己的大数据能力,并在数字化转型之路上逐步走向成功!
一群有情有义、有梦想、有担当又有极强战斗力的人共同缔造了今天的阿里巴巴。但如何驱动大数据让世界更加美好呢?我们希望携手同道者,共创、开拓,进而修炼大数据能力,共同在大数据实践之路上走向成功!大数据能力本应无边界,越多地参与,才越有可能真正实现无边界。
永不停歇地奋斗,正因乐在于志!我们坚信,一切美好,都会因此开始的刚刚好!
胡晓明( 花名 孙权)
阿里巴巴合伙人,阿里云总裁
前言
正说阿里巴巴云上数据中台及云上数据中台业务模式
今天的阿里巴巴,几乎所有业务都运行在大数据之上,几乎所有小二都在用大数据改善工作、进行创新。阿里巴巴云上数据中台正服务着阿里生态中的数十个业务板块、百余家公司、千万级客户,在帮助决策层看清甚至决定业态走向的同时,在上万个业务场景中推进业务数据化、尝试实现数据业务化并催生创新。而这背后则是因为强大的云上数据中台大数据能力的支撑。
阿里巴巴的大数据观
在阿里巴巴,我们有自己的大数据观。我们坚信,“大数据拥有超能力”,大数据所具备的数据计算能力、智能数据能力和数据智能能力,就像人的经络、血液和大脑,缺一不可!围绕着“统一数据建设与数据资产化管理能力”“统一实体连接识别与标签画像高效生产能力”“统一数据服务能力”(在书中分别代称为“OneData”“OneEntity”和“OneService”[1])三大体系,阿里巴巴实践着云上数据中台,进行着一系列自我命题与自我解题。
阿里巴巴云上数据中台建设之路
从2012 年开始,阿里巴巴云上数据中台建设经历了不断革新理念和实战、不断量变和质变的过程。其中,2014 年4 月至2015 年11 月的阿里巴巴数据公共层建设和2016年9 月正式开始实施的阿里巴巴大数据能力赋能社会战略,是阿里巴巴在大数据领域的两次关键质变。第一次质变确定了阿里巴巴云上数据中台及数据中台团队,第二次质变确定了阿里巴巴云上数据中台业务模式的社会赋能战略。
2014 年,适逢阿里巴巴数据登月元年,首批登月预算数亿元且很快面临耗尽的局面,这引起了时任阿里巴巴CTO 姜鹏(花名三丰)的特别关注,OneData 体系特别是其方法论也因此进入高层管理者的视线。
经过一段时间的方案细化和多轮评审及沟通,2014 年4 月8 日,阿里巴巴数据公共层建设项目正式启动。在保障平稳支持日常业务的前提下,一期启动全局架构,二期启动18 个子项目,三期启动9 个子项目,并启动6 大数据技术领域。一年后,阿里巴巴数据公共层建设项目即取得了阶段性战果,除深度参与的淘系、B2B 等BU 外,涉及或影响小微金服[1]、阿里云等10 多个BU[2]。其数据服务20 多个BU,主打小二端统一的数据产品平台——阿里数据,统一商家端数据产品平台为生意参谋,并推出数据大屏助力双十一,同时深入业务,协助业务创新及探索数据自主创新。与此同时,以阿里巴巴数据公共层建
设为切入点繁荣发展起来的数据构建、管理和服务自成体系,其特别之处在于OneData体系的升级、OneEntity 体系方法论的提出、OneService 体系数据产品的升级。这些不仅在技术上降低成本、提高效率,在业务上验证着数据价值化的可能性,也同时促进了组织优化。此时,阿里巴巴数据中台已经在事实上存在了。2015 年12 月7 日,张勇(花名逍遥子)在给阿里巴巴全体小二的邮件《阿里巴巴集团全面组织升级,启动中台战略》中正式宣布:“构建符合DT 时代的更创新、更灵活的‘大中台小前台’组织机制和业务机制。”自此,数据中台成为阿里巴巴中台事业群的重要组成部分,阿里巴巴数据中台团队正式成立!
在此过程中,阿里巴巴独特的大数据观越来越清晰明确,也累积了独特价值,包括云上数据中台大数据技术、云上数据中台建设方法论、云上数据中台产品化服务、云上数据中台业务体感、OneTeam 协同作战思维、特色大数据人6 大方面。
阿里巴巴云上数据中台业务模式赋能全社会
在阿里巴巴,有一句众所周知的话:“今天最好的表现是明天最低的要求!”数据中台团队的正式成立预示着更高的要求和更多的挑战。与此同时,阿里生态内越来越多的全资或投资子公司提出了数据诉求,既有同时输入数据和消费数据的,也有只消费数据的,还有只输入数据的。于是,从2015 年12 月开始,整个阿里巴巴数据中台团队开始面向阿里生态内建设智能大数据体系!智能大数据体系的建设极大地丰富和完善了阿里巴巴大数据中心,OneData、OneEntity、OneService 渐趋成熟并成为上至CEO、下至一线员
工共识的三大体系,云上数据中台深入业务、赋能业务,也让数据价值及赋能业务的潜在价值越来越被认可和期待。同时,我也深深地反省将其放大到阿里生态内时的不足之处,以及在阿里生态之外,这套大数据能力是否可以推而广之,赋能全社会呢?
于是,2016 年9 月,为了使命,为了达成愿景,我们不再将云上数据中台深藏于阿里生态内,开始将阿里巴巴大数据能力同时赋能阿里生态内外!
历经了阿里生态内各种业态挑剔的实战历练,云上数据中台除自身具备的内核能力外,还向上与“赋能业务前台”连接、向下与“统一计算后台”连接,并与之融为一体,形成云上数据中台业务模式,具备了对全社会赋能的可能。关于云上数据中台与云上数据中台业务模式的关系,如图0-1 所示。
??????????????????????????????????????????????
??????????????????????????????????
???????? ????????????
????????????
????
????????
??“??”??“??”??“??”??“??”??“??”??
??????????????
????
???????????? ???????????? ???????????? ?????????????????
图0-1 阿里巴巴云上数据中台与云上数据中台业务模式的关系
云上数据中台定位于计算后台和业务前台之间,其内核能力是以业务视角而非纯技术视角,智能化构建数据、管理数据资产并提供数据调用、数据监控、数据分析与数据展现等多种服务;承技术启业务,是建设智能数据和催生数据智能的引擎。而指导云上数据中台内核能力不断积累和沉淀的正是OneDataOneEntity、OneService 三大体系的方法论。
以云上数据中台自身内核能力为中坚力量的云上数据中台业务模式,同时关注着与大数据能力相关的技术、数据、业务等,其基于技术而又深入业务,是包括数据产品+ 数据技术+ 方法论+ 场景价值实现等在内的综合性能力输出。它为智能化数据、极致提升技术和数据智能化业务负责,即,一方面专注于从业务视角建设既“准”且“快”的“全”“统”“通”的智能大数据体系,并且极致化追求技术上的降低成本及提高效率,另一方面致力于智能大数据与业务场景深度融合中的各类应用与智能化价值创新。
我们的追求与努力
为何而来?将往何处?这是我们一直思考的问题!
云上数据中台业务模式是活性的,是有血有肉、有情感的,其信念是“大数据拥有超能力”,其使命是“让大数据催生大创新”,其愿景是实现 “大数据创新无处不在,大数据人才无处不在”。所以,未来,我们将全力以赴地分享云上数据中台业务模式,不遗余力地将云上数据中台业务模式中的方法论、数据产品、数据技术、数据与业务融合的价值化经验等付诸帮助国内、国际的云上客户的实战中!希望可以有越来越多的志同道合者一起“华山论剑”!
从2016 年9 月开始,我们结合一些客户的实际诉求,分享了不少大数据领域相关经验,而本书则是应多方期望,对于阿里巴巴云上数据中台及云上数据中台业务模式的系统、全面、深入的分享。后续,我们计划推出《阿里巴巴云上数据中台的赋能实战》《大数据产品经理》《大数据大设计》《深入大数据产品与技术》《大数据大管理》等一系列大数据相关图书。对于分享,我们是认真的!
邓中华(花名 宗华)
阿里巴巴大数据人,资深产品专家
特别说明,特别感谢
本书所有内容均基于笔者十年来在阿里巴巴大数据领域实战中的亲身经历,所有图片均来自于笔者的100 余篇PPT 和数本手稿,以及笔者所在阿里巴巴数据中台团队的战友积累的20 余篇PPT。所以,这本书代表着真正意义上的云上数据中台实战。十年寒来暑往,十年风刀霜剑,相信读者可以从中或多或少感受到阿里巴巴大数据人用初心和信仰、求变与务实、不懈与努力铸就的云上数据中台及其业务模式!
特别感谢相信我、支持我、陪伴我一起战斗的阿里巴巴数据公共层建设若干期项目中的数百名伙伴、生意参谋平台中的80 名队友、新能源实验室与新行业赋能团队的120 名热血同仁!书中图片中引用的部分图标来自iconfont 平台,在此一并感谢!因人数众多,在此不一一列出姓名。
谨以此书,献给这么多年来不离不弃陪我奔跑在大数据之路上的梦想战友!献给一直包容我、疼惜我并且支持我投身大数据事业的家人!献给在本书成书过程中无欲无求给予我帮助的好友!
生命因为有你们而美好,征程因为有你们而无悔,因为相信,所以坚持,终于看见!