笔趣阁小说 python3爬虫实例 - 代码天地

笔趣阁小说 python3爬虫实例

其他 2018-10-23 08:59:54 阅读次数: 0

import urllib.request

import re

from bs4 import BeautifulSoup as bs

def urlopen(url):

    
    req = urllib.request.Request(url)

    req.add_header("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36")

    html = urllib.request.urlopen(req)

    html = html.read()

    return html


def list1(url):

    html = urlopen(url)

    html = bs(html,'lxml')

    list1 = html.div(id="list")
    
    #这个id是所有折链接都在这个DIV里面

    list1 = list1[0]
    #返回的是一个列表所以要取出来

    list1 = list1.find_all('a')
    #再从这个列表里面把所有的链接取出来

    urllist = []
    #这里新建一个列表来装链接

    for i  in list1:
        i = i.attrs
        i = i['href']
        i = 'http://www.biquge.com.tw'+i
        urllist.append(i)

    return urllist


def xia(url):

    urllist = list1(url)

    name = urlopen(url)

    name = bs(name,'lxml')

    name = name.h1.string

    na = name+'.txt'
    #文件名以小说名加.txt


    for i in urllist:
        
        html = urlopen(i)
        html = bs(html,'lxml')
        h1 = html.h1.string
        #这里是小说章节名字
        content = html.div(id="content")
        content = content[0]
        content = content.text
        aa = re.compile('\xa0')
        content = re.sub(aa,'',content)
        #去掉不能解码的内容

        with open( na ,'a')as f:
            
            f.write(h1)
            #写入章节名字

            f.write(content)
            #这里是小说正文

            print('已经下载'+h1)


url= 'http://www.biquge.com.tw/18_18820/'

xia(url)

猜你喜欢

转载自blog.csdn.net/AnYeZhiYin/article/details/83118841

笔趣阁小说 python3爬虫实例

Python爬虫——从笔趣阁爬小说

Python 爬取笔趣阁小说

python爬取笔趣阁小说

Python爬虫练习二：爬取笔趣阁小说

python爬虫--小说爬取--笔趣阁篇

学习笔记（爬虫）：爬取笔趣阁小说

网络爬虫之笔趣阁小说搜索下载

java爬虫爬取笔趣阁小说

用Python实现笔趣阁小说爬取

Python3中BeautifulSoup爬取笔趣阁小说网

从零开始写Python爬虫 --- 1.5 爬虫实践：笔趣阁小说批量下载

python3.6.5爬虫之四：多线程同时爬取笔趣阁小说

python3.6.5爬虫之一：笔趣阁小说爬取（首页爬取法）

爬虫-scrapy使用爬去笔趣阁小说链接+章节内容

爬虫学习：request+xpath爬取笔趣阁小说

笔趣阁小说-雪中悍刀行-爬虫源代码

学习笔记（爬虫）：爬取笔趣阁剑来小说

爬虫初学（一）：爬取笔趣阁小说（萌新用-详细讲解）

【Python项目】Python基于tkinter实现笔趣阁小说下载器（附源码）

笔趣阁（www.qu.la）小说爬取代码（python实现）

Python BeautifulSoup 爬取笔趣阁所有的小说

python爬取笔趣阁小说（TK可视化）

通过python爬取笔趣阁小说，获取图片保存本地，数据保存mysql

用Python实现笔趣阁小说爬取 GUI版

python应用：爬虫框架Scrapy系统学习第四篇——scrapy爬取笔趣阁小说

Python爬取新笔趣阁小说

python爬取书趣阁小说

爬虫练习——爬取笔趣阁

【Python项目】Python基于tkinter实现一个笔趣阁小说下载器 | 附源码

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)