面向电商企业的运营人员,数据分析人员,针对淘宝、天猫做SEO优化时,SEO优化所涉及到的十几个优化参数,例如:上下架时间、DSR动态得分、30天销量等等这些公开数据是如何通过技术手段批量获取到的。解决企业电商运营人员和电商数据分析人员只懂SEO优化逻辑,不知道如何获得这些逻辑背后的数据支撑是如何获得的难题。
无数据不运营,突破抓取封锁,洞悉竞争对手运营机密 。这本书的主题,是每个电商都必须面对的——
√ 如果你正在解决,《数据运营》将带你走向极限,突破最后一道封锁线。
√ 如果你刚刚面对,《数据运营》将向你呈现完整电商数据抓取解决方案。
√ 如果你尚未遇到,《数据运营》将为你打开玩转竞业SEO数据的制胜通道。
√ 如果你不曾想过,《数据运营》将替你补上新电商运营竞争的重要一课
序
认识本书作者老邢很多年了,他是个无论在工作还是生活中都特别认真的人。在电商这个十分年轻的行业里,老邢是较早进入淘宝生态体系的技术人员,对淘宝的发展变化有着自己的理解和认识。经营过淘宝店铺的人都知道,数据对于电商来说极其重要,整个店铺运营策略都是围绕数据展开的。流量、转化、销量、DSR这些数据的变化都会影响下一步的推广策略,可以说“无数据不运营”。
马云说世界经济正迅速从IT走向DT(数据处理技术)时代,未来属于那些掌握数据的人。从人类技术文明的发展过程来看,技术总是从复杂向简单、从高端向普及演进。数据抓取及分析最初只是IBM、谷歌、百度这些大公司才有机会使用的技术,现在已经进入到普遍使用的阶段。
通常电商网站也会采取技术手段防止其他公司或个人以技术手段抓取数据(淘宝早在2008年就屏蔽了百度爬虫),本书作者有五年淘宝数据抓取实战经验,对网站数据抓取尤其是电商网站的数据抓取有深刻的认识。十分感谢作者在书中毫无保留地把淘宝数据抓取的经验进行了分享,促进行业交流。
作为一个资深技术人员,作者有深厚的技术背景,能够跳出技术人员固有的思维方式,从店铺运营的视角,通过图文并茂的形式,深入浅出地介绍淘宝页面上主要运营数据的抓取方式,十分难得。对于有心学习如何抓取淘宝数据的运营人员,本书可以让你零基础掌握如何抓取淘宝页面上丰富的运营数据;对于初入电商领域的技术人员,本书也可以帮助你快速掌握淘宝核心数据抓取方式,不必重复发明轮子。
淘宝页面上的数据信息极其丰富,本书涉及内容基本覆盖了其中最重要的搜索结果、宝贝信息、销量信息、DSR、无线端、直通车、评价等,详细讲解了每一个数据的抓取方式,读来有疱丁解牛之感。
淘宝网站本身在不断发展变化,本书在讲解案例的同时,意在让读者通过参与分析一个个具体数据抓取过程,了解其本质,淘宝页面万般变化,变化的仅是数据表现方式,离不开本质。对于一个小白读者来说,可以轻松地掌握淘宝数据抓取的关键点,稍加分析,即可根据自己的需要对书中没有涉及的数据内容进行抓取。
随着技术的进步与普及,会有越来越多的数据被保存下来,人们的行为习惯会越来越多地通过量化数据的方式被分析出来,数据产生的价值也会越来越大。
掩卷而思,从社交网络到移动互联网,再到线上线下结合(O2O),再到李克强总理提出的“互联网+”,整个人类社会近一百年创造的文明成果已远远超过过去历史的总和。数据时代的来临不可避免,希望本书可以帮助更多的人加深对数据的理解,感谢老邢为数据抓取技术普及所做的努力。
——华北区淘宝最大代运营商之一洪海龙腾公司首席运营官(COO) 陈权国
前 言
我1996年大学毕业到现在(2015年),工作19年了,一直从事的都是软件开发工作。在2011年,我出版了自己的第一本面向程序员的图书《B2B2C网上商城开发指南——基于SaaS和淘宝API开放平台》,今天我为什么想写一本面向电商运营的图书呢?
这其实与我最近5年的工作经历有关。从2011年开始的前三年(2011年至2013年),我一直都是在围绕淘宝的App后台做工具软件的开发,例如进销存软件和微博营销软件。不过,由于种种原因,这款进销存软件和微博营销软件虽然试用客户上万,却并没有带来能够支撑团队运作的资金。而到了2013年年末,我在师弟天津商业大学宝德学院高学争老师的影响下,开始研究基于淘宝、天猫的SEO优化工作一直至今。在这个过程当中,我发现了一个有趣的问题,那就是从事淘宝、天猫SEO优化的运营人员和淘宝、天猫店长们,他们对业务能力的把握是很到位的。也就是说,运营人员对如何针对淘宝、天猫SEO优化的奇门绝技是很熟悉的。但是运营人员也有个致命的缺陷,就是SEO优化技巧所依赖的数据支撑,他们是没有能力获得的,他们只知道优化理论和技巧,却无法获得相应的数据支撑和验证。例如,针对大类目下的淘宝C店SEO优化最常见的下架时间问题,大家都知道下架时间很关键,却对如何获得关键词综合排名前1页甚至前5页、前10页宝贝的下架时间的数据,无能为力,那么宝贝根据下架时间卡位也就无从谈起了。当然,目前市面上有的公司也出了一些可以批量采集这些数据的工具软件,运营人员可以利用这些工具软件来完成相应的工作,但是他们对这些软件背后获取数据的原理是一无所知的。这也是我写这本书的目的,深度揭秘淘宝、天猫SEO优化背后数据获取的秘密。所以,本书就是针对电商运营相关人员,告诉他们如何获取淘宝SEO优化所必需的运营数据,使得运营能够更好地跟自己的SEO优化绝技相结合,从而使自己从手动获取运营数据的海量工作中解放出来,做一些更有意义的事情。
我写这本书的第二个目的,是因为关于淘宝SEO优化技巧的图书,市面上也出了很多本,但是如何批量获取SEO优化技巧背后所需要的运营数据,却一本也没有。这是因为绝大部分运营人员都没有软件程序员的工作经历。而我有19年的一线软件开发经验,又深度投入到了淘宝SEO优化的工作当中去,所以对运营人员(即使是全国最顶级的运营)来讲,我是一个牛X的资深程序员,而针对我的程序员同事和其他程序员,我又是一个已经入门的淘宝SEO优化和运营“专家”。从这方面来讲,我也算是“魔”“道”双修的,用朋友的一句话来说就是:流氓会武术,谁也挡不住。其实,从软件研发的角度来讲,我的职责其实是一个业务架构师+系统架构师的角色。
话又说回来,针对电商SEO优化运营技巧,从技术上讲,我也算入门和“专家”(针对我的程序员同行来讲)了,但是对真正的一线运营高手来讲,我又是只懂皮毛的外行。所以,这本书并不适用于想获得淘宝、天猫运营技巧的运营人员,本书适用的是已经熟悉淘宝SEO优化技巧,又想深度了解如何获得SEO优化技巧背后数据秘密的运营人员。
在我写这本书的过程当中,淘宝本身也在“丧心病狂”地采取各类反爬虫技术手段,妄图防止别人从淘宝公开的网页上很容易地获取到这些公开数据。所以,很多运营人员也可以看到,以前很好用的一些工具软件,现在也不能用了。不过,有矛就有盾,敌人再任性,狐狸再狡猾,我们也是可以找到一些特定的解决方案的。所以,本书写作的过程,也是跟淘宝技术做斗争的过程,但愿这本书能给已经熟悉淘宝SEO优化技巧,又想深度了解如何获得SEO优化技巧背后数据秘密的运营人员带来帮助。