python入门之爬虫------抓取王者荣耀英雄列表

抓取王者荣耀英雄列表及其对应的全部皮肤名称


目标

在王者荣耀官网抓取王者荣耀英雄列表,每个英雄拥有的皮肤数量,及其对应的全部皮肤名称。

过程分析

首先获得官网的herolist.json文件,里面包含我们需要抓取的信息。Chrome浏览器打开王者荣耀官网,进入英雄资料网页,打开开发者工具,刷新页面就能找到herolist.json,

这里写图片描述
这里写图片描述
http://pvp.qq.com/web201605/js/herolist.json ,就是herolist.json的网址。打开herolist.json,可以看到里面有哪些内容:
这里写图片描述
其实它是一个列表类型,里面的每一个元素都是字典类型,存储着我们需要的信息,英雄名cname,皮肤名skin_name, 再对skin_name求长度,就能得到皮肤数量。

完整代码

import urllib.request
import json

response = urllib.request.urlopen("http://pvp.qq.com/web201605/js/herolist.json")

#接受响应,读取内容
hero_json = json.reads(response.read())


for i in hero_json:
    hero_name = i['cname']
    skin_names = i['skin_name'].split('|')
    skin_num = len(skin_names)
    print('hero_name', hero_name)
    print('skin_names', skin_names)
    print('skin_num', skin_num)

注意:如果直接用sublime打开的json文件阅读不方便,可以使用json格式化工具方便阅读,这里是一个在线转换链接:http://tool.oschina.net/codeformat/json**。


猜你喜欢

转载自blog.csdn.net/pici7002/article/details/82250892
今日推荐