python爬虫入门（三） - 代码天地

python爬虫入门（三）

其他 2019-05-17 16:04:46 阅读次数: 0

抓取豆瓣首页菜单

地址：https://www.douban.com/

一、分析

打开豆瓣首页：https://www.douban.com/，

通过前端位置定位，找到上图中的HTML代码

这里要找的代码就是

<div class="anony-nav-links">
......
</div>

二、代码实现

 1 import requests
 2 from lxml import etree
 3 
 4 def getPage(url):
 5     try:
 6         page = requests.get(url)
 7         return page
 8     except Exception as e:
 9         print(str(e))
10 
11 def get_data() :
12     url = 'http://www.douban.com/'
13     data = getPage(url)
14     data.encoding = 'utf-8'
15     selector = etree.HTML(data.text)
16     informations = selector.xpath('//div[@class="anony-nav-links"]/ul/li')
17     for inf in informations:
18         print(inf.xpath('./a/text()')[0])
19 
20 def main() :
21     data = get_data()
22 
23 if __name__ == '__main__':
24     main()

注意：XPath 可用来在 XML 文档中对元素和属性进行遍历，这里通过xpath解析元素和属性

运行结果：

豆瓣读书
豆瓣电影
豆瓣音乐
豆瓣小组
豆瓣同城
豆瓣FM
豆瓣时间
豆瓣豆品

成功抓取想要的信息。

猜你喜欢

转载自www.cnblogs.com/UniqueColor/p/10881718.html

python爬虫入门（三）

Python爬虫小白入门（三）BeautifulSoup库

python爬虫入门之handler与opener(三)

Python爬虫入门基础学习（三）

Python爬虫从入门到精通（三）简单爬虫的实现

爬虫入门(三)

爬虫入门实例（三）

Java爬虫入门三

Python爬虫入门三之Urllib库的基本使用

Python爬虫入门之三urllib库的基本使用

python爬虫入门---第三篇：自动下载图片

python爬虫入门案例（三）保存图片、视频等文件

python网络爬虫学习笔记之三 Selenium入门

python网络爬虫入门（三、复杂HTML的解析）

Python旅途遇到游乐园——爬虫入门 ( 三 )

Python旅途遇到游乐园——爬虫入门 ( 三 )

【Python】爬虫入门强烈推荐系列三

python爬虫-入门-了解爬虫

python 爬虫入门

python-爬虫入门

python爬虫入门(解析)

(转载)python爬虫入门

Python爬虫入门：综述

python爬虫入门

python爬虫_入门_翻页

python　爬虫入门

python 爬虫入门

Python爬虫入门项目

python爬虫入门（1）

怎样入门python爬虫？

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)