爬虫开始路线

其他 2020-09-24 14:05:13 阅读次数: 0

爬虫之路

爬虫的一周学习计划：

下图是爬虫的准备

爬虫路线

爬虫爬取快代理案例：

网站的url=“https://www.kuaidaili.com/free/”

这次爬取我们采用的是requests第三方库

Requests 是一个 Python 的 HTTP 客户端库,我们可以用它得到HTML源码

import requests
url="https://www.kuaidaili.com/free/"
headers={
    
    
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36"
}
#这里进行了头部的伪装
res=requests.get(url,headers=headers)
res.encoding="utf-8"
html=res.text

之后我们用xpath实现标签的遍历获取到我们需要的内容

e=etree.HTML(html)
ip_list=e.xpath("//tr/td[1]/text()")
port_list=e.xpath("//tr/td[2]/text()")
#采用zip迭代的方式打印输出
for ip,port in zip(ip_list,port_list):
    str="ip:"+ip+"\t端口号："+port
    print(str)

小结

本文主要讲解了网络爬虫的结构和应用，以及Python实现爬虫的案例。希望大家对本文中的网络爬虫工作流程和Requests实现HTTP请求的方式重点吸收消化。

猜你喜欢

转载自blog.csdn.net/IT6848/article/details/108733841

爬虫开始路线

【python爬虫】如何开始写爬虫？来给你一条清晰的学习路线吧~

爬虫开始

Python爬虫学习路线

python：爬虫：技术路线

从0开始的前端学习路线

开始爬虫人生的前戏

开始入门爬虫（1）

爬虫代码开始：

爬虫进阶开始-scrapy

从零开始大数据学习路线

python3爬虫技术路线

杭州Python爬虫学习路线有哪些？

学习Python-爬虫开始。

Python数据采集-开始爬虫

Python:爬虫从这里开始

【spider】爬虫学习路线-精通Scrapy网络爬虫

Python爬虫的作用与地位（附爬虫技术路线图）

大数据学习路线（自己制定，从零开始）

从零开始——互联网学习路线(上）

大数据技术学习路线，从现在开始学习吧

大数据基础学习路线（从零开始）

大数据从0学习路线（自己制定的，基础开始）

java自学路线,从0基础开始带你学Java

iOS狂暴之路(开始篇)---学习路线总结

Xfce 4.16 路线图公布，正式开始开发

从零开始的强化学习入门学习路线

从技术出发or从场景出发：大模型开始“路线分化”？

SpringCloud学习路线（1）—— 从头开始的微服务

SSM（Spring，SpringMVC，Mybatis）学习路线（从0开始，仅仅是路线）

今日推荐

“开源信徒”周鸿祎开源360智脑大模型

华为ensp中vrrp虚拟路由器冗余协议原理及配置命令

基于Python爬虫广东广州水酒店宾馆数据可视化系统设计与实现(Django框架) 研究背景与意义、国内外研究现状

知识融合：知识图谱构建的关键技术

文心一言收费还是免费：全面解析其价格策略与服务价值

百万用户通话新风潮：仅需50秒，无界AI让彩铃变身短视频

【STM32项目】基于STM32多传感器融合的新型智能导盲杖设计（完整工程资料源码）

文生视频大模型Sora的复现经验

腾讯云函数计算技术：云原生架构下的Serverless与微服务新篇章

干货分享｜JumpServer 三种常见的文件传输方式效果对比

【榜单公布】2023年度征文活动已结束

周排行

Java中关于时间的操作及格式化

《HTML5与CSS3基础教程》第五章学习笔记图像

nginx下安装PHP发生问题的逐步解决

HDU-1048，The Hardest Problem Ever（字符串处理）

新一代多媒体技术与应用的部分课后题

Shader 绘制特殊图形

Oracle数据库三种备份方案

CodeForces - 983B XOR-pyramid(两次区间DP/记忆化DFS)

Python3基础语法——变量与运算符

（转载）KMP算法详解（原创）详解KMP算法

每日归档

更多

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)

2024-04-11(14)

2024-04-10(68)

2024-04-09(5)

2024-04-08(60)

2024-04-07(4)