批量制作博文清单 - 代码天地

批量制作博文清单

其他 2018-08-11 16:06:22 阅读次数: 0

import re
from urllib.request import urlopen

baseurl = 'https://blog.csdn.net/gf_lvah/article/list/'
pages = 7


def get_page(url):
    return urlopen(url).read().decode('utf-8')


def parse_content(content):
    pattern = r' <a href="(.*?)" target="_blank">\s+<span class="article-type type-1">\s+.*?</span>\s+(.*?)\s+</a>'
    return re.findall(pattern, content)


List = []

for i in range(7):
    url = baseurl + str(i + 1)
    print(url)
    content = get_page(url)

    print("爬取第%d页" % (i + 1))
    print(parse_content(content))
    List.extend(parse_content(content))

with open('csdn.txt', 'w') as f:
    l = len(List)
    for url, name in List:
        print(url,name)
        name = name.strip()
        f.write('[ 第%s篇博文 : %s ](%s)\n\n' %(l, name, url))
        l -= 1

猜你喜欢

转载自blog.csdn.net/gf_lvah/article/details/81171759

批量制作博文清单

BLOG - 个人博文系统开发总结三：批量博文导入功能

LP、HPM、HPC、HPC等工艺制作博文

制作购物清单

如何制作像新浪博客的博文列表那样显示文章部分简略内容？

测试博文

优秀博文导航

博文纪录

Java-博文

Spark 博文

git 优秀博文

java优秀博文

Python优秀博文

博文前言

博文链接

python爬博文

浏览博文

博文目录

开博文日志了

发博文

SWT 经典博文

Android 博文

博文阅读目录

nginx 博文

开始写博文

搬家通知博文

JavaScript 博文

博文声明

博文地址

Tomcat 博文

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)