python的爬虫（1）抓取链接+标题 - 代码天地

python的爬虫（1）抓取链接+标题

其他 2019-07-05 21:44:15 阅读次数: 0

前言：
对链接爬虫：
1、抓取它的图片地址
2、抓取标题

针对地址：https://bh.sb/post/44622
脚本：

import requests
from lxml import etree
r=requests.get('https://bh.sb/post/44622/').content

topic=etree.HTML(r)
html=topic.xpath('/html/body/section/div/div/article/p/text()')
img=topic.xpath('//article/p/a/img/@src')
# url=topic.xpath('/html/body/section/div/div/article/')

# print(url)

for x in html:
    print(x,end="")

for i in img:
    print(i)

# print(html)
# print(img)
# print(html[1],img[1])

# print(r)

1、xpath的取法：
点击标题：谷歌浏览器-》右键-》检查-》copy-》xpath
在这里插入图片描述

2、怎么把数组转换成正常字符-》菜鸟教程去查看
在这里插入图片描述
3、小节

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_41665637/article/details/90637175

python的爬虫（1）抓取链接+标题

python的爬虫（3）抓取全部链接+标题

python爬虫之抓取网页新闻标题与链接

python3爬虫(三)--抓取单个网页的文章标题以及其链接和抓取单个网页图片

python爬虫：抓取页面上的超链接

Python爬虫:抓取表情包的下载链接

一个简书的爬虫，可以设定页码，抓取文章标题、简介以及链接

Python爬虫1：简单抓取网页

python网络爬虫（1）静态网页抓取

python抓取网络图片保存到本地，通过url抓取文章的标题，通过链接地址，抓取内容数据

python网络爬虫抓取数个最优链接展示

爬虫学习笔记（1）-- 利用Python从网页抓取数据

使用python抓取数据之菜鸟爬虫1

Python爬虫实战（1）：抓取毒舌电影最新推送

Python爬虫实战，requests模块，Python多线程抓取5千多部最新电影下载链接

【python爬虫自学笔记】-----爬取简书网站首页文章标题与链接

python爬虫，使用BeautifulSoup模块爬取人民网新链接，标题，时间

[Python][爬虫04]Fiddler与HTTP请求：抓取豆瓣评分以及资源链接（一）

[Python][爬虫05]Fiddler与HTTP请求：抓取豆瓣评分以及资源链接（二）

Python爬虫练习之二：抓取游民星空搞笑动态图文章链接

Python爬虫:利用JS逆向抓取携程网景点评论区图片的下载链接

python超链接抓取工具

[Python]抓取豆瓣电影列表的标题

python爬虫：爬取百度云盘资料，保存下载地址、链接标题、链接详情

python爬虫pubmed论文标题

黑马python2.7的爬虫1- 爬虫原理与数据抓取

【爬虫学习四】 Python大型爬虫案例: 抓取某电商网站的商品数据（1）

python爬虫CSDN文章抓取

【Python】爬虫抓取必应壁纸

python网络爬虫抓取图片

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)