python爬虫旅游景点 - 代码天地

python爬虫旅游景点

企业开发 2023-05-18 02:29:58 阅读次数: 0

今天的目标是各地旅游景点

废话不多说，直接开始

由于本次爬取后的数据保存到Excel，所以要提前安装相关库，这里我用的是pip

win+R cmd到命令行输入以下内容(要确保python环境正常)

pip install Workbook

pip install openpyxl

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBATG9ycmV5Xw==,size_20,color_FFFFFF,t_70,g_se,x_16

接下来就可以开始代码操作了

# -- coding: utf-8 --
import requests
from lxml import html
from openpyxl import Workbook

#创建Excel
wb=Workbook()
ws=wb.active

#获取数据
url='https://place.qyer.com/china/citylist-0-0-1/'

def getpage(url):
    #请求头，模拟浏览器登录
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.88 Safari/537.36'} 

    #访问链接，获取HTML
    r = requests.get(url, headers=headers)
    retext = r.text

    # 解析数据
    ht = html.fromstring(retext)

    #使用xpath获取
    city = ht.xpath('/html/body/div[5]/div/div[1]/ul/li')
    for i in city:
        name = i.xpath('./h3/a/text()')[0]
        beento = i.xpath('./p[@class="beento"]/text()')[0]
        list = i.xpath('./p[@class="pois"]/a/text()')
        list2 = ''
        # for j in list:
        #     list2=list2+','+j.strip()
        # print(name,beento,list2[1:])
        list = [place.strip() for place in list]
        list2 = ','.join(list)
        datalist = [name, beento, list2]
        ws.append(datalist)

for i in range(1,10):
    url='https://place.qyer.com/china/citylist-0-0-{}/'.format(i)
    getpage(url)

#Excel保存
fileanme="D:\Python\Project\test4" #路径可以自己设置，我这里是python源文件同级目录
wb.save("旅游景点.xlsx")

运行代码

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBATG9ycmV5Xw==,size_20,color_FFFFFF,t_70,g_se,x_16

猜你喜欢

转载自blog.csdn.net/Lorrey_/article/details/124132050

python爬虫--旅游景点

python爬虫旅游景点

Python旅游景点推荐系统爬虫酒店旅游新闻

【爬虫实战项目】Python爬虫批量旅游景点信息数据并保存本地（附源码）

[Python爬虫] Selenium获取百度百科旅游景点的InfoBox消息盒

基于python爬虫技术的旅游景点信息采集系统的设计与实现(Django框架)

[POI 2007] 旅游景点

玩遍全国旅游景点

基于Python的云南旅游景点分析

Python入门实例：获取旅游景点的真实评价

[POI2007]旅游景点atr

曼谷旅游景点大盘点

淄博旅游景点与美食汇总

jsp旅游景点推荐与介绍平台

Nodejs实现的旅游景点的设计与实现

python爬虫吉林长春旅游景点数据可视化大屏全屏系统设计与实现（django框架）

Python Selenium爬取百度百科旅游景点的消息盒

Python爬取去哪网旅游景点保存到csv文件

Python 获取旅游景点信息及评论并作词云、数据可视化

基于PYTHON django四川旅游景点推荐系统

2.Python数据分析项目——旅游景点票价预测

Python旅游景点攻略和点评系统毕业设计作品成品（5）开题报告

python+django+mysql旅游景点推荐系统-前后端分离（源码+文档）

BZOJ1097: [POI2007]旅游景点atr

BZOJ 1097 [POI2007]旅游景点atr

[POI2007]旅游景点atr BZOJ1097

法国必去旅游景点感受法国的浪漫

清明节最佳旅游景点推荐

java毕业设计_旅游景点路线推荐系统

精品基于NET实现的旅游景点推荐系统

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)