Python爬虫--urllib - 代码天地

Python爬虫--urllib

其他 2018-12-09 20:13:49 阅读次数: 0

urllib包含模块：

-urllib.request：打开和读取urls

-urllib.error：包含urllib.request产生的常见的错误，使用try捕捉

-urllib.parse：包含即系url的方法，把一些数据进行编码

-urllib.robotparse：解析robots.txt文件

from urllib import request

if __name__ == '__main__':
    url="http://www.baidu.com"
    #打开相应的url并把相应页面作为返回
    html = request.urlopen(url)
    #把返回结果读取出来并解码成字符串
    res = html.read().decode()
    print(res)

这就是最简单的一个使用urllib爬取百度源码的爬虫

现在我们可以利用request和parse模块来做一个简单的搜索引擎

"""
简单易懂的搜索引擎
"""
from urllib import parse,request

url = "http://www.baidu.com/s?"
wd = input("请输入关键字:")

#弄成一个字典
qs = {
    "wd":wd
}
#使用urllib模块里面的parse把输入的文字编码，加密，成为电脑认识的形式
qs = parse.urlencode(qs)
#打印你输入的文字的编码
print(qs)

flag = url + qs
#打印你最终搜索的url
print(flag)

rsp = request.urlopen(flag)
html = rsp.read().decode()

#输出源码
print(html)

首先我们先把输出的文字进行编码，然后再把url和编码后的格式相接，再使用request获取源码，这就是一个简单的利用百度搜索了。

猜你喜欢

转载自blog.csdn.net/May_Xu_/article/details/83088879

python爬虫——urllib库

Python爬虫——urllib的使用

PYTHON爬虫（urllib详解）

python爬虫，Urllib库

Python爬虫--urllib

Python 爬虫 ---- urllib 库

Python网络爬虫--urllib

Python爬虫-urllib模块

Python爬虫(一) | urllib

python爬虫之urllib

python爬虫-urllib

【python】urllib库（爬虫）

python爬虫（一）Urllib使用

【Python爬虫】urllib库的使用

Python爬虫-urllib的基本用法

python 爬虫urllib基础示例

Python爬虫---urllib库介绍

python爬虫之urllib的使用

Python 爬虫02 urllib模块

python爬虫之urllib库

讲解Python爬虫的Urllib库

python爬虫的urllib与requests的对比

python爬虫笔记（一）:urllib

python爬虫urllib库使用

1.0 -Python爬虫-Urllib/Requests

python爬虫，使用urllib + 正则

python爬虫urllib库详解

Python爬虫urllib库的使用

【Python爬虫】Urllib的使用（2）

Python 爬虫：urllib.request

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)