零基础Python爬取网页文章和图片详细教学（内附源码、教学视频） - 代码天地

零基础Python爬取网页文章和图片详细教学（内附源码、教学视频）

其他 2018-08-14 22:08:52 阅读次数: 0

Python爬虫，这个我相信对于很多人来说都不陌生！

今天小编给大家提供一份零基础Python爬取网页图片以及小说的代码并且详细的和大家讲解一下！

需要中文软件，案例源码，讲解视频可以加QQ群：838197940！进群备注“资料”！

开发环境：版本Python3.6.2！（2版本会在20年的时候停止更新库，建议大家现在想学习的话可以学习3版本，但是不建议用3.7，还存在很多库不支持）

版本

编译器：PyCharm！（新手的话pycharm比较适合）

使用的库：

在Python2.x中使用 import.urllib

在Python3.x中使用 importurllib.request

（这是在Python2和3中最直接区别）

OK！进入正题！想要完成到最后一步下载小说，之前我们应该完成什么操作呢？

1.获取主页面源代码

2.获取章节超链接

3.获取章节源代码

4.获取内容

5.下载小说

第一步：定义函数（驼峰命名法，对于刚接触编程的小伙伴来说，养成良好的习惯很重要，还有就是注释）

def getNovelContent():

pass

第二步：获取页面源代码

获取页面源代码

这里需要注意的点就在于，需要调整获取的编码，不然会形成乱码

html = html.decode('gbk')

将编码格式切换为gbk！！！

第三步：获取章节超链接

需要用到库：正则表达式

**import **re

获取超链接

第四步：获取章节源代码

获取章节源代码

同样，跟之前获取主页源代码一样，需要统一格式！

第五步：获取内容

获取内容

同样使用正则表达式！

第六步：下载小说

下载小说

代码运行到这里基本上就已经结束了，可以看到小图代码成功运行，正在下载小说

运行完成

其实这个不仅仅可以爬取免费的小说，收费的按道理也是可以的，但是因为不能侵犯别人的版权等！最好是不要去这么做！

今天就分享到这里了，感谢各位大大关注！转发哦！有什么不对的可以在评论里面直接写出来的！

需要中文软件，案例源码，讲解视频可以加QQ群：838197940！进群备注“资料”！

猜你喜欢

转载自blog.csdn.net/qq_36400378/article/details/81561938

零基础Python爬取网页文章和图片详细教学（内附源码、教学视频）

python爬虫之网页数据解析详细教程零基础教学

nginx入门基础（内附教学视频）

Python爬取文章和小说内容

网页设计视频教程之零基础学html css 以及html中css样式实例教学

python超详细零基础 bs4解析之爬取唯美图片

python学习-[小甲鱼]零基础入门教学

Python 爬取微信公众号文章和评论 (有源码)

java零基础教学------数组

frida逆向firdaHOOK零基础教学

python基础教学（超详细）

01-Python 零基础入门爬虫图片爬取

Python网络爬虫Scrapy+MongoDB +Redis实战爬取腾讯视频动态评论教学视频

Python爬虫新手入门教学（十六）：爬取好看视频小视频

Python爬虫新手入门教学（八）：爬取论坛文章保存成PDF

零基础想自学java，如何找教学视频或资料？

【Python 网络爬虫】使用 urllib 爬取网页源码、图片和视频

万字【Python基础】保姆式教学，零基础快速入门Python

网盘分享零基础学习Spring Boot入门教程 16课时视频教学课程让你入门很轻松含源码

python爬虫:爬取慕课网教学视频（福利向）

Python爬虫新手入门教学（七）：爬取腾讯视频弹幕

Python爬虫新手入门教学（十七）：爬取yy全站小视频

Python爬虫新手入门教学（五）：爬取B站视频弹幕

2.零基础系统学习Python爬虫之爬取网页的通用代码框架

零基础/小白/python萌新也能学爬取静态网页信息并解析后存储在excel中/爬虫

python爬虫小白零基础入门教程2023最新版（实战教学）

python爬取网页视频

Python爬取网页图片

【python】爬取网页图片

零基础入门学习python（附视频教程）

今日推荐

手把手教你用 LangChain 实现大模型 Agent

外星人入侵（python）

超全的免费chatGPT列表【建议收藏】

52.2k star! 自己部署gpt4free, 免费使用各种GPT

2024年（第十届）全国大学生统计建模大赛优秀论文解析——中国经济发展与碳排放库兹涅茨曲线的验证研究

【自动驾驶技术】自动驾驶汽车AI芯片汇总——NVIDIA篇

7个免费的ChatGPT网站，给大家送上

Angular v18 正式发布！

【VMware】 vCenter Converter standalone 6.6.0正式版下载

开源日报 | Angular v18；大模型价格战下的推理优化；Mistral AI以开源模型瞄准美国市场；硅谷有自己的鲁迅

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

周排行

keepalived实现LB配置

数据库相关中间件收录集

Spring Boot 入门之 Web 篇（二） Spring Boot 入门之 Web 篇（二）

gitee 搭建个人网站

Java校招基础知识总结（横扫BAT,就业经验交流会演讲稿）

工程管理器

Delphi定位TDataSet数据集最后一条记录

cocos2dx笔记1:概述

Java实现 LeetCode 110 平衡二叉树

MacBook IDEA激活码

每日归档

更多

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)