python 爬取派米比价详情页 - 代码天地

python 爬取派米比价详情页

其他 2019-03-31 14:00:57 阅读次数: 0

目标网站
在这里插入图片描述

找到请求地址，发现没有加密，直接请求，用xpath提取数据

完整代码：

import requests
from lxml import etree

url = 'http://www.mypricemix.com/wap/goods_detail/fc73a3511f8911e98985525400a3d313.html'
resp = requests.get(url)

# print(resp.text)

eroot = etree.HTML(resp.text)
goods_name = eroot.xpath('/html/body/header/h1/text()')
print('商品名称：',goods_name)

pictures_ele = eroot.xpath('/html/body/div[2]/div[2]/div/div')
for picture_ele in pictures_ele:
    pic_src = picture_ele.xpath('./a/img/@src')
    print('图片url:',pic_src)

goods_num = eroot.xpath('/html/body/div[3]/table/tbody/tr[1]/td[1]/span[2]/text()')
print('货号',goods_num)

detail = eroot.xpath('/html/body/div[3]/table/tbody/tr[2]/td/span/text()')
print('细节特征',detail)

print('以下折合人民币价格均按照今日最新汇率计算')
update_time = eroot.xpath('/html/body/div[4]/span[2]/text()')
print(update_time)

prices_ele = eroot.xpath('/html/body/div[4]/div')
for price_ele in prices_ele:
    url = price_ele.xpath('./ul/a/@href')
    # 欧洲不一样,另外写个规则
    if not url:
        url = price_ele.xpath('./ul/li/@data-url')
        countries_ele = price_ele.xpath('./ul/li')
        for country in countries_ele:
            country_name = country.xpath('./text()')
            print('国家：',country_name)
    else:
        country = price_ele.xpath('./ul/a/li/text()')
        print('国家：',country)
    print('官网链接：',url)
    local_price = price_ele.xpath('./div[1]/span/text()')
    print('官方售价：',local_price)
    rmb_price = price_ele.xpath('./div[2]/span/text()')
    print('折合人民币：', rmb_price)
    print('*'*100)

猜你喜欢

转载自blog.csdn.net/weixin_43751840/article/details/88782001

python 爬取派米比价详情页

python3.6.4爬取裁判文书(20180925最新更新)详情页docid---------------------玉米都督

Python爬取淘宝商品详情页数据

电影天堂爬取详情页

python 正则表达式爬取新闻详情页面

Python拉勾网爬虫-获取详情页

【Python web 开发】viewset 实现商品详情页的接口

Python--天猫详情页爬虫

scrapy网页爬取(包含翻页及详情页抓取)

爬取电影天堂电影列表和详情页

scrapy爬取猫眼电影及详情页

scrapy爬取网址，进而爬取详情页问题

python学习之美多商城(十六):商品部分:商品详情页(详情页面静态化)

python爬取淘宝商品比价实例（对re库的使用，淘宝反爬虫机制的解决）

python爬虫爬取淘宝商品比价（附淘宝反爬虫机制解决小办法）

python爬取淘宝搜索页（练习）

python爬取数据多页

爬虫实战——爬取电影天堂的电影详情页信息

采用BeautifulSoup&&pqQuery&&xpath三种方法爬取电影详情页

Python爬虫实例之淘宝商品比价定向爬取！爬虫还是很有意思的！

python：知乎发现页的爬取（问题，作者，回答）

Python爬取多页糗事百科

python 爬虫（五）爬取多页内容

python爬取300个租房信息页

Python实战演练之跨页爬取

python爬取多页商品评论详解

Python：【2】使用Selenium爬取多页表格数据

python 全栈开发，Day81(博客系统个人主页,文章详情页)

Python爬虫之Scrapy框架系列（14）——实战ZH小说爬取【多页爬取】

laravel详情页

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)