爬虫初体验 - 代码天地

爬虫初体验

其他 2019-03-20 16:29:24 阅读次数: 0

import requests # 调用requests库
from bs4 import BeautifulSoup # 调用BeautifulSoup库
res =requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/spider-men5.0.html')
# 返回一个response对象，赋值给res
html=res.text
# 把res解析为字符串
soup = BeautifulSoup( html,'html.parser')
# 把网页解析为BeautifulSoup对象
items = soup.find_all(class_='books') # 通过匹配属性class='books'提取出我们想要的元素
for item in items: # 遍历列表items
kind = item.find('h2') # 在列表中的每个元素里，匹配标签<h2>提取出数据
title = item.find(class_='title') # 在列表中的每个元素里，匹配属性class_='title'提取出数据
brief = item.find(class_='info') # 在列表中的每个元素里，匹配属性class_='info'提取出数据
print(kind.text,'\n',title.text,'\n',title['href'],'\n',brief.text) # 打印书籍的类型、名字、链接和简介的文字

猜你喜欢

转载自www.cnblogs.com/baqycl/p/10565635.html

python爬虫初体验

Java爬虫初体验

爬虫初体验

Java网络爬虫初体验

scrapy 爬虫初体验(1)

Python开发爬虫初体验

python初体验-网页爬虫

爬虫——HTTP协议初体验

1. 爬虫初体验

爬虫初体验之BeautifulSoup

爬虫前置知识与初体验

Python爬虫框架--pyspider初体验

scrapy 爬虫利器初体验(1)

python学习之爬虫初体验

爬虫初体验-爬取小说内容

爬虫工具八爪鱼初体验

“黑客”入门——爬虫scrapy初体验

我与“爬虫”的“爱之初体验”

Python爬虫｜反爬初体验

网络爬虫爬取图像初体验

初体验

Python-爬虫初体验 (内有福利）

爬虫利器初体验 scrapy，爬取豆瓣电影

datax初体验 datax初体验

Django初体验

Linux on window初体验

Prometheus初体验

Docker初体验

PullToRefresh初体验

SpringBoot 初体验（一）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)