爬虫11-途牛网 - 代码天地

爬虫11-途牛网

编程语言 2018-11-01 22:42:19 阅读次数: 0

import requests
from bs4 import BeautifulSoup


def got_html(url):
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0) AppleWebKit/537.36 (KHTML, like Gecko) '
                             'Chrome/69.0.3497.100 Safari/537.36'}
    # url = 'http://s.tuniu.com/search_complex/whole-nj-0-%E6%B3%B0%E5%9B%BD/'
    response = requests.get(url, headers=headers)
    html = response.content.decode()
    # print(html)
    return html


def parse_html(html):
    soup = BeautifulSoup(html, 'lxml')
    item_list = soup.select('ul[class="thebox clearfix"] li')
    print(len(item_list))
    for item in item_list:
        # 名称
        name = item.select('div > a > dl > dt > p.title > span')[0].get_text().strip()
        # 价格
        price = item.select('div > a > div.priceinfo > div.tnPrice > em')[0].get_text().strip()
        # 满意度
        dos = item.select('div > a > div.priceinfo > div.comment-sat.clearfix > div.comment-satNum > span > i')[0].get_text().strip()
        # 出游人数
        number = item.select('div > a > div.priceinfo > div.comment-sat.clearfix > div.trav-person > p.person-num > i')[0].get_text().strip()
        print(name, price, dos, number)


content = got_html('http://s.tuniu.com/search_complex/whole-nj-0-%E6%B3%B0%E5%9B%BD/')
parse_html(content)

猜你喜欢

转载自blog.csdn.net/qwerLoL123456/article/details/83576479

爬虫11-途牛网

爬虫11-知乎

爬虫11-爬取复杂网页，电影天堂

牛客网题库爬虫

2020-11-19 南京途牛前端现场面试

11- IO模型

11-分类category

11-依赖的范围

11-函数-方法

11-数组

11-装饰器

11-异常-python

11-常用模块

11-放苹果

11-注解

11-异常

11- client测试

11-数组操作

11-结构体

11-接口

测试开发备战秋招面试11-牛客刷题之哈希

牛客网错题集锦11

牛客网day11

牛客网第11天

牛客网---Java题库（11~20）

牛客网初阶练习（11）

Python学习之旅 -11-爬虫利器Requests-HTML使用方法

vue慕课网音乐项目手记：11-给首页加个loading的效果

HQChart实战教程11-火币网ws数据对接K线图

途牛前端面试

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

周排行

《Python 编程-从入门到实践》11-1~11-3

关于Numpy+TensorFlow+PyTorch构造NN的总结

【原创达人】制作WINPE启动盘心得

英文图片文字识别（提取）

2022cma看片网站给一个你懂的

二叉搜索树的实现（BST）（插入+删除+查找+各种遍历+高度）

搬家通知博文地址(将博客搬到CSDN)

asfd

解决错误：MISCONF Redis is configured to save RDB snapshots, but is currently not able to persist on disk

如何注册微信个人小程序

每日归档

更多

2024-06-08(0)

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)