Python 爬虫入门(一） - 代码天地

Python 爬虫入门(一）

其他 2019-01-01 14:38:32 阅读次数: 0

想要从网页上爬取数据就必须先知道网页的构成，一般来说网页分为两个部分：一个是html，一个是css，html是网页的整体构造，相当于未装修的房子，而css是网页的样式表，相当于房子的装修。
而后便是解析网页，想要解析网页只需要在浏览器中点击鼠标右键，检查或查看网页源代码即可。
对于爬取所需数据来说，数据在网页源码中的路径极为重要，获取方法可用在所需数据的地方点击鼠标右键在弹出菜单中点击检查，然后在解析器中选中部分点击鼠标右键，光标移动至copy处，可显现几种不同表达的copy路径。
有了对网页的理解便可以入手学习爬虫的编写了，要获取网页，首先需要向网页发出一个请求信号，即requests函数，访问成功后可得网页的数据，例如访问简书网并获取数据
jianshu_url = 'http://www.jianshu.com/' data = requests.get(jianshu_url)
而后用bs4包中的BeautifulSoup函数对网页数据进行解析，并得到相应的网页源代码：
soup = BeautifulSoup(data.text, 'lxml')
然后就可以有所需数据的路径从中获取需要的信息,如获取简书用户的昵称：
authors = soup.select('div.name > a') for author in authors : author=author.get_text print (author)
参考教学视频链接http://study.163.com/course/courseMain.htm?courseId=1002810012

猜你喜欢

转载自blog.csdn.net/rodger_snow/article/details/78075949

Python 爬虫入门(一）

Python爬虫入门（一）

Python爬虫入门<一>简单爬虫

Python爬虫入门指南（一）

Python爬虫入门一之综述

Python爬虫实战入门一：工具准备

精选：Python爬虫从入门到出门（一）

Python爬虫入门学习实战项目（一）

Python 爬虫从入门到进阶之路（一）

Python网络爬虫实战(一)快速入门

Python网络爬虫（一）——Request入门

python网络爬虫之入门[一]

零基础入门python爬虫(一)

python爬虫（一） requests库的简单入门

Python爬虫学习（一）Requests库入门

Python爬虫入门基础学习（一）

python爬虫从入门到放弃（一）- 认识爬虫

python爬虫入门一：爬虫基本原理

python爬虫从入门到放弃（一）之初识爬虫

爬虫【一】python爬虫入门案例-爬取图片

python网络爬虫学习笔记之一爬虫基础入门

python 爬虫《百炼成佛》爬虫入门（爬虫介绍）第一个爬虫程序

【Python数据挖掘课程】一.安装Python及爬虫入门介绍

Python爬虫入门之一通用爬虫和聚焦爬虫

Python零基础入门爬虫原理与数据抓取(一)-通用爬虫和聚焦爬虫

python爬虫-入门-了解爬虫

python 网络爬虫入门（一）———第一个python爬虫实例

最详细的Python爬虫入门教程，一篇文章入门爬虫不是儿戏！

最详细的Python爬虫入门教程, 一篇文章入门爬虫不是儿戏!

最详细的python爬虫入门教学，一篇入门爬虫不是儿戏（视频分享）

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)