python_爬虫_学习

其他 2020-06-28 17:11:25 阅读次数: 0

爬取京东商品信息

代码：

import requests
# url = "https://item.jd.com/2967929.html"
url = "https://item.jd.com/100011585270.html"
try:
    r = requests.get(url)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text[:1000])
except:
    print("爬取失败")

运行结果1：

运行结果2：

能爬取到信息，但是信息不够全面。结果2只出现过一次，没有及时保存。

曾经怀疑结果1的出现是因为没有登陆，可是登陆后仍然会出现结果1。故排除该可能。

由于偶然出现结果2，所以怀疑可能是网络原因，或者爬虫被禁止。

想尝试更改header，模拟浏览器进行访问，但是由于现在要做scratch的分型雪花，所以暂时搁置。

以上止步于python网络爬虫与信息获取（嵩天老师_MOOC）第一周第三单元第一个视频

猜你喜欢

转载自www.cnblogs.com/Jane-share/p/13203817.html

python_爬虫_学习

Python_爬虫

python_爬虫_requests

python_爬虫（爬图片）

python_爬虫异常处理

python_爬虫（初入门）

爬虫+Python_抻透

Python_爬虫小实例

python_爬虫_数据提取

python_学习2

python_元组学习

python_ 学习笔记（Ⅰ）

python_模块学习

Python_爬虫_request+urllib+xpath

python_爬虫_Selenium_Error

python_爬虫今日头条

Python_爬虫_数据解析回顾

Python_爬虫_requests小实战

【Python_爬虫】地图POI（待完成）

python_ re模块学习

python_库学习_01

Python_学习之安装

python_爬虫_使用终端运行爬报错：No such file or directory

python_爬虫_Charles手机证书安装问题

python_爬虫_multiprocessing.dummy以及multiprocessing

python_爬虫_微信公众号抓取

python_爬虫_scrapy_爬取360图片实例

Python_爬虫_xpath/bs4/re小实战

python_爬虫爬取高德地理编码

Python_爬虫_喜马拉雅音频

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)