Python 3爬虫、数据清洗与可视化实战-图书

Python 3爬虫、数据清洗与可视化实战

零一、韩要宾、黄园园 , 陈海城 (作者)　杨嘉媛 (责任编辑)

本书是一本通过实战教初学者学习采集数据、清洗和组织数据进行分析及可视化的 Python 读物。书中案例均经过实战检验，笔者在实践过程中深感采集数据、清洗和组织数据的重要性，作为一名数据行业的“码农”，数据就是沃土，没有数据，我们将无田可耕。
本书共分 11 章， 6 个核心主题：其一是 Python 基础入门，包括环境配置、基本操作、数据类型、语句和函数；其二是 Python 爬虫的构建，包括网页结构解析、爬虫流程设计、代码优化、效率优化、容错处理、反防爬虫、表单交互和模拟页面点击；其三是 Python 数据库应用，包括 MongoDB、 MySQL 在 Python中的连接与应用；其四是数据清洗和组织，包括 NumPy 数组知识、 pandas 数据的读写、分组变形、缺失值异常值处理、时序数据处理和正则表达式的使用；其五是综合应用案例，帮助读者贯穿爬虫、数据清洗与组织的过程；最后是数据可视化，包括 Matplotlib 和 Pyecharts 两个库的使用，涉及饼图、柱形图、线图、词云图、地图等图形，帮助读者进入可视化的殿堂。
本书以实战为主，适合 Python 初学者及高等院校的相关专业学生，也适合 Python 培训机构作为实验教材使用。

30页的url中为什么去掉_o？？？不去掉就显示KeyError:translateResult，这是为什么？

dhy发表于 2020/9/13 23:03:38
P31上装bs4步骤没有成功，请问怎么解决。步骤是先装的python，pycharm，然后装anaconda时没成功就先把python卸了，装成功后又装了python3。最后pycharm导入requests成功，但是bs4一直没成功。

lingyishan发表于 2020/8/8 12:57:23
- 你可以在pycharm中配置anaconda环境，这样所有的包就都有了，配置过程你可以去CSDN查一下
  
  douddd发表于 2021/4/7 9:55:02
天气那一章我自己更新了一下

import requests
import time
import pymongo

client = pymongo.MongoClient(‘localhost’,27017)
book_weather = client[‘weather’]
sheet_weather = book_weather[‘sheet_weather_3’]
url = ‘https://cdn.heweather.com/china-city-list.txt‘
strhtml = requests.get(url)
strhtml.encoding = ‘utf-8’
data = strhtml.text
data = data.replace(‘|’,’’)
data = data.replace(‘ ‘,’’)
key = ‘’ # 你的key值

print(data)
data1=data.split(“\n”)
print(len(data1))
for i in range(6):
data1.remove(data1[0]) # Hi
i = 0
for item in data1:
url = ‘https://free-api.heweather.net/s6/weather/now?location=‘ + item[0:11] + ‘&key=’+key
strhtml = requests.get(url)
time.sleep(1)
dic = strhtml.json()
```
#sheet_weather.insert_one(dic)
print(dic)
i=i+1
```
LJL发表于 2019/9/13 20:57:58
我建了个群，欢迎大家进来一起学习进步，群号676090824

ivivian发表于 2019/8/13 11:16:49
书P84 from items import StockstarItem, StockstarItemLoader

提示错误： from items import StockstarItem, StockstarItemLoader
ImportError: cannot import name ‘StockstarItem’ from ‘items’

大神们，请问这个问题怎么解决？

wschenchen发表于 2019/6/12 11:13:47
- 路径不太对，可以试试from ..items import StockstarItem, StockstarItemLoader
  
  baobaozi发表于 2019/9/11 18:00:23