Python爬虫（一）：编写简单爬虫之新手入门

其他 2018-10-20 00:53:39 阅读次数: 0

最近学习了一下python的基础知识，大家一般对“爬虫”这个词，一听就比较熟悉，都知道是爬一些网站上的数据，然后做一些操作整理，得到人们想要的数据，但是怎么写一个爬虫程序代码呢？相信很多人是不会的，今天写一个针对新手入门想要学习爬虫的文章，希望对想要学习的你能有所帮助~~废话不多说，进入正文！

一、准备工作

1、首先代码使用python3.x编写的，要有一个本地的python3环境。

python下载地址页面：https://www.python.org/downloads/release/python-370/

2、然后要有一个开发工具，推荐PyCharm，一款很好的Python交互IDE。Python自带编译器 -- IDLE也可以。

PyCharm下载地址页面：https://www.jetbrains.com/pycharm/download/

3、准备工作都做好就可以做开发在IDE里编写代码程序了。

二、简单爬虫代码开发

以豆瓣网为例，爬取豆瓣官网页面，看看能获取到什么东西，代码如下：

代码：

# -*- coding: utf-8 -*-
import urllib.request

# 1、网址url  --豆瓣网
url = 'http://www.douban.com'

# 2、直接请求  返回结果
response = urllib.request.urlopen(url)

# 3、获取状态码，如果是200表示获取成功
print ('状态码：',response.getcode())

# 4、读取内容
data = response.read()

# 5、设置编码
data = data.decode('utf-8')

# 6、打印结果
print (data)

运行结果：

截取部分代码如下，第一行是状态码：200，表明获取成功，下面是爬取到的豆瓣页面代码，由于内容过多，故截取以下部分内容。

感兴趣的小伙伴可以动手试试，欢迎交流~~

猜你喜欢

转载自blog.csdn.net/qq_37811638/article/details/83146162

Python爬虫：编写简单爬虫之新手入门

Python爬虫（一）：编写简单爬虫之新手入门

python爬虫之爬取壁纸（新手入门级）

Python爬虫新手入门教学（一）：爬取豆瓣电影排行信息

2021-11-03 Python爬虫新手入门第一步

Python爬虫新手入门教学（九）：多线程爬虫案例讲解

Python新手入门之函数

Python爬虫新手入门教学（十九）：爬取ip代理，构建代理池

Python爬虫新手入门教学（十七）：爬取yy全站小视频

Python爬虫新手入门教学（十六）：爬取好看视频小视频

Python爬虫新手入门教学（十五）：爬取网站音乐素材

Python爬虫新手入门教学（十三）：爬取高质量超清壁纸

Python爬虫新手入门教学（十二）：英雄联盟最新皮肤爬取

Python爬虫新手入门教学（十一）：最近王者荣耀皮肤爬取

Python爬虫新手入门教学（八）：爬取论坛文章保存成PDF

Python爬虫新手入门教学（七）：爬取腾讯视频弹幕

Python爬虫新手入门教学（六）：制作词云图

Python爬虫新手入门教学（五）：爬取B站视频弹幕

Python爬虫新手入门教学（四）：爬取前程无忧招聘信息

Python爬虫新手入门教学（二）：爬取小说

新手入门：python的安装（一）

Python爬虫新手入门教学（三）：爬取链家二手房数据

新手必看！简易入门Python爬虫

python之新手一看就懂的小说爬虫

Python爬虫新手入门教学（十四）：爬取有声小说网站数据

Python爬虫新手入门教学（十）：爬取彼岸4K超清壁纸

Python爬虫新手入门教学（二十）：爬取A站m3u8视频格式视频

Python新手入门之字符串

Python新手入门之元组&集合

新手入门的Scrapy爬虫操作--超详细案例带你入门

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)