python爬虫爬取豆瓣电影前250名电影及评分（requests+pyquery) - 代码天地

python爬虫爬取豆瓣电影前250名电影及评分（requests+pyquery)

其他 2018-05-25 00:01:45 阅读次数: 3

写了两个版本:

1、面向过程版本：

import requests
from pyquery import PyQuery as pq
url='https://movie.douban.com/top250'
moves=[]
def sec(item):
    return item[1]
for i in range(0,255,25):
    content=requests.get(url+"?start="+str(i))#?start=25
    for  movie in pq(content.text).find('.item'):
        moves.append([pq(movie).find('.title').html(),pq(movie).find('.rating_num').html()])
moves.sort(key=sec,reverse=True)
for move in moves:
    print(move[0],move[1])

2、面向对象版本：

import requests
from pyquery import PyQuery as pq

class Douban:
    def __init__(self):
        self.moves=[]
    def geturl(self):
        url='https://movie.douban.com/top250?start=%s'
        urls=[]
        for i in range(0,250,25):
            urls.append(url%i)
        return urls
    def downloader(self,url):
        r=requests.get(url)
        return r.text
    def html_parser(self,page):
        for movie in pq(page).find('.item'):
            title=pq(movie).find('.title').html()
            score=pq(movie).find('.rating_num').html()
            self.moves.append({
                    'title':title,
                    'score':score,
                    })
    def output(self):
        self.moves.sort(key=lambda x:x['score'],reverse=True)
        for move in self.moves:
            print(move['title'],move['score'])
    def start(self):
        for url in self.geturl():
            #print(url)
            page=self.downloader(url)
            self.html_parser(page)
        self.output()
dou=Douban()
dou.start()

猜你喜欢

转载自www.cnblogs.com/babihuang/p/9085867.html

python爬虫爬取豆瓣电影前250名电影及评分（requests+pyquery)

爬取豆瓣电影评分前250部电影

Python爬取豆瓣高分电影前250名

python爬虫--爬取豆瓣top250电影名

python爬虫03 —爬取静态页面（爬取豆瓣电影top250若干页的电影名称及评分）

Python爬虫小白教程（二）—— 爬取豆瓣评分TOP250电影

python爬虫（一）爬取豆瓣电影排名前50名电影的信息

（十七）Python爬虫：爬取豆瓣电影TOP250

python 爬虫&爬取豆瓣电影top250

Python爬虫 - scrapy - 爬取豆瓣电影TOP250

python爬虫入门 ✦ 爬取豆瓣电影Top250

python爬虫之爬取豆瓣电影top250

python爬虫爬取豆瓣电影TOP250

python爬虫——爬取豆瓣top250电影信息

python爬虫豆瓣排名前250的电影

猫眼电影爬取(三)：requests+pyquery，并将数据存储到mysql数据库

Python爬取豆瓣动作电影好评前100名

利用python爬取豆瓣电影榜top250的电影名及其对应网址

案例学python——案例三：豆瓣电影信息入库一起学爬虫——通过爬取豆瓣电影top250学习requests库的使用

[Python从零到壹] 七.网络爬虫之Requests爬取豆瓣电影TOP250及CSV存储

(python)爬虫实战爬取豆瓣电影Top250榜单电影

使用requests爬取豆瓣电影top250

爬虫项目：requests爬取豆瓣电影TOP250存入excel中

我的第一个python爬虫：爬取豆瓣top250前100部电影

爬取豆瓣电影排行榜前250

豆瓣电影前250名爬虫并写入excel源码

python采用requests+bs4爬取豆瓣top250电影信息

爬虫练习-爬取豆瓣电影TOP250的数据

爬虫实战：爬取豆瓣TOP250电影信息

【爬虫】爬取豆瓣Top250电影信息

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)