数据运营:深度揭秘SEO电商数据抓取技术
  • 推荐0
  • 收藏5
  • 浏览950

数据运营:深度揭秘SEO电商数据抓取技术

邢波涛 (作者) 

  • 书  号:978-7-121-27158-8
  • 出版日期:2015-10-09
  • 页  数:202
  • 开  本:16(170*235)
  • 出版状态:上市销售
  • 维护人:张春雨
面向电商企业的运营人员,数据分析人员,针对淘宝、天猫做SEO优化时,SEO优化所涉及到的十几个优化参数,例如:上下架时间、DSR动态得分、30天销量等等这些公开数据是如何通过技术手段批量获取到的。解决企业电商运营人员和电商数据分析人员只懂SEO优化逻辑,不知道如何获得这些逻辑背后的数据支撑是如何获得的难题。
无数据不运营,突破抓取封锁,洞悉竞争对手运营机密 。这本书的主题,是每个电商都必须面对的——
√ 如果你正在解决,《数据运营》将带你走向极限,突破最后一道封锁线。
√ 如果你刚刚面对,《数据运营》将向你呈现完整电商数据抓取解决方案。
√ 如果你尚未遇到,《数据运营》将为你打开玩转竞业SEO数据的制胜通道。
√ 如果你不曾想过,《数据运营》将替你补上新电商运营竞争的重要一课

认识本书作者老邢很多年了,他是个无论在工作还是生活中都特别认真的人。在电商这个十分年轻的行业里,老邢是较早进入淘宝生态体系的技术人员,对淘宝的发展变化有着自己的理解和认识。经营过淘宝店铺的人都知道,数据对于电商来说极其重要,整个店铺运营策略都是围绕数据展开的。流量、转化、销量、DSR这些数据的变化都会影响下一步的推广策略,可以说“无数据不运营”。
马云说世界经济正迅速从IT走向DT(数据处理技术)时代,未来属于那些掌握数据的人。从人类技术文明的发展过程来看,技术总是从复杂向简单、从高端向普及演进。数据抓取及分析最初只是IBM、谷歌、百度这些大公司才有机会使用的技术,现在已经进入到普遍使用的阶段。
通常电商网站也会采取技术手段防止其他公司或个人以技术手段抓取数据(淘宝早在2008年就屏蔽了百度爬虫),本书作者有五年淘宝数据抓取实战经验,对网站数据抓取尤其是电商网站的数据抓取有深刻的认识。十分感谢作者在书中毫无保留地把淘宝数据抓取的经验进行了分享,促进行业交流。
作为一个资深技术人员,作者有深厚的技术背景,能够跳出技术人员固有的思维方式,从店铺运营的视角,通过图文并茂的形式,深入浅出地介绍淘宝页面上主要运营数据的抓取方式,十分难得。对于有心学习如何抓取淘宝数据的运营人员,本书可以让你零基础掌握如何抓取淘宝页面上丰富的运营数据;对于初入电商领域的技术人员,本书也可以帮助你快速掌握淘宝核心数据抓取方式,不必重复发明轮子。
淘宝页面上的数据信息极其丰富,本书涉及内容基本覆盖了其中最重要的搜索结果、宝贝信息、销量信息、DSR、无线端、直通车、评价等,详细讲解了每一个数据的抓取方式,读来有疱丁解牛之感。
淘宝网站本身在不断发展变化,本书在讲解案例的同时,意在让读者通过参与分析一个个具体数据抓取过程,了解其本质,淘宝页面万般变化,变化的仅是数据表现方式,离不开本质。对于一个小白读者来说,可以轻松地掌握淘宝数据抓取的关键点,稍加分析,即可根据自己的需要对书中没有涉及的数据内容进行抓取。
随着技术的进步与普及,会有越来越多的数据被保存下来,人们的行为习惯会越来越多地通过量化数据的方式被分析出来,数据产生的价值也会越来越大。
掩卷而思,从社交网络到移动互联网,再到线上线下结合(O2O),再到李克强总理提出的“互联网+”,整个人类社会近一百年创造的文明成果已远远超过过去历史的总和。数据时代的来临不可避免,希望本书可以帮助更多的人加深对数据的理解,感谢老邢为数据抓取技术普及所做的努力。

——华北区淘宝最大代运营商之一洪海龙腾公司首席运营官(COO) 陈权国


前 言
我1996年大学毕业到现在(2015年),工作19年了,一直从事的都是软件开发工作。在2011年,我出版了自己的第一本面向程序员的图书《B2B2C网上商城开发指南——基于SaaS和淘宝API开放平台》,今天我为什么想写一本面向电商运营的图书呢?
这其实与我最近5年的工作经历有关。从2011年开始的前三年(2011年至2013年),我一直都是在围绕淘宝的App后台做工具软件的开发,例如进销存软件和微博营销软件。不过,由于种种原因,这款进销存软件和微博营销软件虽然试用客户上万,却并没有带来能够支撑团队运作的资金。而到了2013年年末,我在师弟天津商业大学宝德学院高学争老师的影响下,开始研究基于淘宝、天猫的SEO优化工作一直至今。在这个过程当中,我发现了一个有趣的问题,那就是从事淘宝、天猫SEO优化的运营人员和淘宝、天猫店长们,他们对业务能力的把握是很到位的。也就是说,运营人员对如何针对淘宝、天猫SEO优化的奇门绝技是很熟悉的。但是运营人员也有个致命的缺陷,就是SEO优化技巧所依赖的数据支撑,他们是没有能力获得的,他们只知道优化理论和技巧,却无法获得相应的数据支撑和验证。例如,针对大类目下的淘宝C店SEO优化最常见的下架时间问题,大家都知道下架时间很关键,却对如何获得关键词综合排名前1页甚至前5页、前10页宝贝的下架时间的数据,无能为力,那么宝贝根据下架时间卡位也就无从谈起了。当然,目前市面上有的公司也出了一些可以批量采集这些数据的工具软件,运营人员可以利用这些工具软件来完成相应的工作,但是他们对这些软件背后获取数据的原理是一无所知的。这也是我写这本书的目的,深度揭秘淘宝、天猫SEO优化背后数据获取的秘密。所以,本书就是针对电商运营相关人员,告诉他们如何获取淘宝SEO优化所必需的运营数据,使得运营能够更好地跟自己的SEO优化绝技相结合,从而使自己从手动获取运营数据的海量工作中解放出来,做一些更有意义的事情。
我写这本书的第二个目的,是因为关于淘宝SEO优化技巧的图书,市面上也出了很多本,但是如何批量获取SEO优化技巧背后所需要的运营数据,却一本也没有。这是因为绝大部分运营人员都没有软件程序员的工作经历。而我有19年的一线软件开发经验,又深度投入到了淘宝SEO优化的工作当中去,所以对运营人员(即使是全国最顶级的运营)来讲,我是一个牛X的资深程序员,而针对我的程序员同事和其他程序员,我又是一个已经入门的淘宝SEO优化和运营“专家”。从这方面来讲,我也算是“魔”“道”双修的,用朋友的一句话来说就是:流氓会武术,谁也挡不住。其实,从软件研发的角度来讲,我的职责其实是一个业务架构师+系统架构师的角色。
话又说回来,针对电商SEO优化运营技巧,从技术上讲,我也算入门和“专家”(针对我的程序员同行来讲)了,但是对真正的一线运营高手来讲,我又是只懂皮毛的外行。所以,这本书并不适用于想获得淘宝、天猫运营技巧的运营人员,本书适用的是已经熟悉淘宝SEO优化技巧,又想深度了解如何获得SEO优化技巧背后数据秘密的运营人员。
在我写这本书的过程当中,淘宝本身也在“丧心病狂”地采取各类反爬虫技术手段,妄图防止别人从淘宝公开的网页上很容易地获取到这些公开数据。所以,很多运营人员也可以看到,以前很好用的一些工具软件,现在也不能用了。不过,有矛就有盾,敌人再任性,狐狸再狡猾,我们也是可以找到一些特定的解决方案的。所以,本书写作的过程,也是跟淘宝技术做斗争的过程,但愿这本书能给已经熟悉淘宝SEO优化技巧,又想深度了解如何获得SEO优化技巧背后数据秘密的运营人员带来帮助。

目录

第1章 淘宝/天猫做SEO优化对数据的需求 / 1
1.1 天猫、淘宝数据抓取背景 / 2
1.2 天猫、淘宝运营数据抓取技术概述 / 4
第2章 淘宝搜索排名数据抓取技术 / 7
2.1 淘宝关键词搜索排名抓取技术概述 / 8
2.1.1 为什么要关注淘宝关键词搜索排名 / 8
2.1.2 淘宝关键词搜索排名抓取技术详解 / 10
2.2 实时抓取淘宝排名前几页宝贝的热卖属性 / 26
2.2.1 宝贝的热卖属性是什么 / 26
2.2.2 如何抓取宝贝的热卖属性 / 27
2.3 批量抓取淘宝排名前几页宝贝的上下架时间 / 36
2.3.1 什么是宝贝上下架时间 / 36
2.3.2 为什么抓取宝贝的上下架时间 / 37
2.3.3 如何抓取宝贝的上下架时间 / 38
2.3.4 如何批量获取排名前几页的宝贝上下架时间 / 40
2.4 抓取宝贝的30天销量 / 47
2.4.1 宝贝的30天销量是什么 / 47
2.4.2 为什么抓取宝贝的30天销量 / 47
2.4.3 如何抓取宝贝的30天销量 / 48
2.5 抓取宝贝的浏览量 / 51
2.5.1 宝贝的浏览量是什么 / 51
2.5.2 为什么抓取宝贝的浏览量 / 52
2.5.3 如何抓取宝贝的浏览量 / 53
2.6 抓取宝贝的收藏量 / 54
2.6.1 宝贝的收藏量是什么 / 54
2.6.2 为什么抓取宝贝的收藏量 / 55
2.6.3 如何抓取宝贝的收藏量 / 55
2.7 抓取店铺的信用 / 57
2.7.1 店铺的信用是什么 / 57
2.7.2 为什么抓取店铺的信用 / 58
2.7.3 如何抓取店铺的信用 / 59
2.8 抓取店铺的DSR得分 / 61
2.8.1 店铺的DSR得分是什么 / 61
2.8.2 为什么抓取店铺的DSR得分 / 62
2.8.3 如何抓取店铺的DSR得分 / 62
第3章 淘宝组合关键词的拆分 / 66
3.1 淘宝组合关键词是什么 / 67
3.2 为什么要研究淘宝组合关键词的拆分规则 / 67
3.3 淘宝组合关键词是如何拆分的 / 68
第4章 淘宝无线排名数据的抓取 / 73
4.1 为什么抓取淘宝无线排名数据 / 74
4.2 如何抓取淘宝无线排名数据 / 74
第5章 实时抓取直通车关键词排位 / 85
5.1 实时抓取直通车关键词排位的意义 / 86
5.2 如何实时抓取关键词对应的直通车排名 / 86
第6章 实时抓取宝贝的订单数据 / 97
6.1 实时抓取宝贝的订单数据的意义 / 98
6.2 如何实时抓取宝贝的订单数据 / 98
第7章 实时抓取宝贝的评价数据 / 111
7.1 实时抓取宝贝的评价数据的意义 / 112
7.2 如何实时抓取宝贝的评价数据 / 112
第8章 查询整店动销率 / 125
8.1 什么是店铺动销率 / 126
8.2 如何计算店铺动销率 / 126
8.3 如何整店下载一个店铺的所有商品 / 126
第9章 淘宝关键词获取技术 / 133
9.1 淘宝关键词获取技术综述 / 134
9.2 如何实时抓取淘宝搜索下拉框数据 / 138
9.3 如何生成自己的关键词组词工具 / 148
第10章 抓取生e经数据辅助SEO优化 / 157
第11章 抓取数据魔方数据辅助SEO优化 / 171
11.1 数据魔方淘词行业数据抓取 / 172
11.2 数据魔方淘词全网搜索关键词查询数据抓取 / 184
11.3 数据魔方其他功能点数据抓取 / 189

读者评论

电子书版本

  • Epub

相关图书

Python统计可视化之Altair探索分析实践指南

刘大成 (作者)

本书以Altair为核心工具,通过认识数据、理解数据和探索数据全方位地探索分析数据集的统计可视化形式,以应用数据和案例研究为实践场景,使用Altair数据加工箱...

 

实用推荐系统

Kim Falk (作者) 李源 朱罡罡 温睿 (译者)

要构建一个实用的“智能”推荐系统,不仅需要有好的算法,还需要了解接收推荐的用户。本书分为两部分,第一部分侧重于基础架构,主要介绍推荐系统的工作原理,展示如何创建...

¥119.00

Kubernetes权威指南:从Docker到Kubernetes实践全接触(第5版)

龚正 吴治辉 闫健勇 (作者)

Kubernetes是由谷歌开源的容器集群管理系统,为容器化应用提供了资源调度、部署运行、服务发现、扩缩容等一整套功能。Kubernetes也是将“一切以服务(...

 

Harbor权威指南

张海宁 邹佳 王岩 尹文开 任茂盛 等 (作者)

在云原生生态中,容器镜像和其他云原生制品的管理与分发是至关重要的一环。本书对开源云原生制品仓库Harbor展开全面讲解,由Harbor开源项目维护者和贡献者倾力...

 

集成学习:基础与算法

Zhi-Hua Zhou (作者) 李楠 (译者)

集成学习方法是一类先进的机器学习方法,这类方法训练多个学习器并将它们结合起来解决一个问题,在实践中获得了巨大成功。<br>全书分为三部分。第一部分主要介绍集成学...

¥89.00

Kubernetes源码剖析

郑东旭 (作者)

本书主要分析了Kubernetes核心功能的实现原理,是一本帮助读者了解Kubernetes架构设计及内部原理实现的书。由于Kubernetes代码量较大,源码...