笔趣看小说全部章节爬取实战 - 代码天地

笔趣看小说全部章节爬取实战

其他 2021-01-30 10:24:26 阅读次数: 0

import requests
from bs4 import BeautifulSoup
import os
# 本地写入
headers={
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'
}
def getPage(url):
    re=requests.get(url,headers=headers)
    re.raise_for_status()
    re.encoding=re.apparent_encoding
    soup=BeautifulSoup(re.text,'lxml')
    return soup
if __name__ == '__main__':
    url='https://www.bqkan.com/38_38836/'
    soup=getPage(url)
    book_name=soup.select('.info h2')[0].text
    book_author=soup.select('.small span')[0].text
    last_time=soup.select('.small .last')[0].text
    last_chapter=soup.select('.small .last a')[0].text
    print("书名:",book_name,book_author,last_time,"最新章节:",last_chapter)
    # 以书名创建文件夹
    k=os.path.exists(book_name) # k为bool类型
    if k==False:
        # 没有才创建
        os.makedirs(book_name)
    # 获取所有单章链接
    links=soup.select('.listmain dd a')
    # 前12个为最新章节，其余为正式章节，包含最新章节
    for item in links[12:]:
        href='https://www.bqkan.com'+item['href']
        print(href,item.string)
        soup=getPage(href)
        content=soup.select('.showtxt')[0].text
        content=content.replace('app2();read2();　　','')
        content=content.replace('　　','\n\n')
        print(">>>正在写入文件")
        with open("%s/%s.txt"%(book_name,item.string),'w',encoding='utf-8') as file:
            file.write(content)
    print(">>>全部章节爬取完毕！")

猜你喜欢

转载自blog.csdn.net/KK_2018/article/details/112178191

笔趣看小说全部章节爬取实战

python爬虫——40行代码爬取「笔趣看」全部小说

python爬虫——40行代码爬取「笔趣看」全部小说你都看了吗？

笔趣阁的小说爬取

爬取笔趣阁小说

Python 爬取笔趣阁小说

python爬取笔趣阁小说

scrapycrawl 爬取笔趣阁小说

爬取笔趣阁网站小说

Python基础练习（二）笔趣看《伏天氏》全文章节爬取

使用css选择器爬取全本笔趣看小说

Scrapy模块入门与实战：笔趣阁小说网爬取

爬虫爬取小说《动物农场》全部章节内容

Python爬虫练习二：爬取笔趣阁小说

爬取笔趣阁小说（一念永恒）

用Scrapy爬取笔趣阁小说

学习笔记（爬虫）：爬取笔趣阁小说

java爬虫爬取笔趣阁小说

用Python实现笔趣阁小说爬取

python爬虫--小说爬取--笔趣阁篇

爬虫-scrapy使用爬去笔趣阁小说链接+章节内容

python3.6.5爬虫之一：笔趣阁小说爬取（首页爬取法）

Python爬虫——从笔趣阁爬小说

Python3中BeautifulSoup爬取笔趣阁小说网

python3.6.5爬虫之四：多线程同时爬取笔趣阁小说

Python BeautifulSoup 爬取笔趣阁所有的小说

爬虫学习：request+xpath爬取笔趣阁小说

python爬取笔趣阁小说（TK可视化）

用python爬虫简单爬取笔趣网：类“起点网”的小说

python爬虫爬取笔趣网小说网站过程图解

今日推荐

周排行

Android Studio利用Gradle删除没有使用到的资源和代码文件

[SHOI2001]小狗散步

【网易微专业】算法原理与实践 2

Spring Cloud基于Docker进行打包部署4-容器间的连接和通信（单主机环境）

SVG 的 PathData 在 Android 中的使用

ORA-28056: Writing audit records to Windows Event Log failed.

13 副词

linux：命令行常用快捷方式

Python自动化测试框架有哪些？

java.lang.NoClassDefFoundError: Could not initialize class org.xerial.snappy.Snappy

每日归档

更多

2025-03-27(0)

2025-03-26(0)

2025-03-25(0)

2025-03-24(0)

2025-03-23(0)

2025-03-22(0)

2025-03-21(0)

2025-03-20(0)

2025-03-19(0)

2025-03-18(0)