实践操作

查找12306网站上的车站站点信息

1.

data = None
with open('station_name.js','r',encoding='utf-8') as f:  
data = f.read()

注:'station_name.js'  表示文件的本地路径

2.

chfirst = data.index('\'')  #查找开始的单引号的位置
chlast = data.rindex('\'')  #查找最末尾的单引号的位置

3.

data = data[chfirst:chlast + 1]

#生成所需数据集

4.

keys = re.findall(r'[A-Z]+',data)
values = re.findall(r'[\u4e00-\u9fa5\s]+',data)

#根据正则表达式查找出所需的数据

5.

city_dict = dict(zip(keys,values))
print(city_dict)

猜你喜欢

转载自www.cnblogs.com/banzui/p/9234633.html