python3爬虫豆瓣top250图书（并保存到mysql数据库） - 代码天地

python3爬虫豆瓣top250图书（并保存到mysql数据库）

其他 2018-09-22 15:01:56 阅读次数: 0

版权声明：转载请标明出处 https://blog.csdn.net/easy_purple/article/details/82725140

参考上篇文章

附上代码：

import requests
from bs4 import BeautifulSoup
import mysql.connector


def get_pages_link():
    # 插入到数据库
    conn = mysql.connector.connect(user='root', password='root', database='test')
    cursor = conn.cursor()

    header = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.92 Safari/537.36',
        'Connection': 'keep-alive'
    }

    for item in range(0, 250, 25):
        url = "https://book.douban.com/top250?start={}".format(item)
        web_data = requests.get(url, headers=header)
        soup = BeautifulSoup(web_data.content, 'lxml')
        for movie in soup.select('.item'):
            href = movie.find('a')["href"]
            name = movie.get_text().strip()[:20].strip()  # 片名
            star = movie.select('.rating_nums')[0].text  # 评分
            people = movie.select('.star > span')[2].text.replace("(\n", "").replace(")", "").strip()  # 评价人数
            try:
                quote = movie.select('.inq')[0].text
            except:
                print('没有quote哦')
                quote = None
            data = {
                # 'url': href,
                '评分': star,
                '评价人数': people,
                '片名': name,
                '名言': quote
            }
            sql = 'insert into bookdoubantop250(score,name,quote,people) values (%f,"%s","%s","%s")' % (
                float(star), name, quote, people)
            cursor.execute(sql)
            conn.commit()
            print(data)
            # print(movie)
        print('\n' + '-' * 50 + '\n')
    # 关闭数据库
    cursor.close()
    conn.close


if __name__ == '__main__':
    get_pages_link()

猜你喜欢

转载自blog.csdn.net/easy_purple/article/details/82725140

python3爬虫豆瓣top250图书（并保存到mysql数据库）

python3爬虫豆瓣top250电影（并保存到mysql数据库）

python3爬虫--爬取豆瓣Top250的图书

python的scrapy爬虫——豆瓣电影top250爬虫练习——保存到CVS文件

python爬虫(七、完整爬取豆瓣top250保存到excel)

python爬虫(九、爬取豆瓣top250电影信息并插入数据库sqlite)

Python数据分析----Python3操作Excel-以豆瓣图书Top250为例

Python爬取豆瓣电影Top250（数据保存到Excel中）

Python3 爬取豆瓣图书Top250并存入Excel中

python3爬取豆瓣图书Top250图片

Python3操作Excel-以豆瓣图书Top250为例

Python爬虫笔记：爬取豆瓣图书TOP250单页数据

小项目（爬虫） Python爬虫爬取豆瓣TOP250电影数据并存入Mysql数据库（附Python代码）

爬取豆瓣电影top250（python3）

Python爬虫学习-豆瓣电影TOP250数据爬取（存入mongo数据库中）

豆瓣图书Top250

python爬虫——爬取豆瓣电影top250信息并加载到MongoDB数据库中

python 爬虫豆瓣top250

python——爬虫（豆瓣top250）

python爬虫——豆瓣电影Top250

【python爬虫】—豆瓣电影Top250

爬虫豆瓣TOP250电影数据

python3抓取豆瓣TOP250结果存mysql

爬虫学习之11：爬取豆瓣电影TOP250并存入数据库

Python爬虫实战(3)-爬取豆瓣音乐Top250数据(超详细)

scrapy爬取豆瓣top250并插入到MySQL数据库（入门级）

python爬取豆瓣电影top250数据存入数据库

【爬虫】爬取豆瓣图书TOP250

爬虫：豆瓣top250

Python爬虫入门 | 4 爬取豆瓣TOP250图书信息

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)