爬虫实践二--豆瓣top250电影 - 代码天地

爬虫实践二--豆瓣top250电影

其他 2019-01-27 19:58:06 阅读次数: 0

import requests

def get_movies():
    headers={
    'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.82 Safari/537.36',
    'Host': 'movie.douban.com'
    }
    for i in range(0,10):
        link = 'https://movie.douban.com/top250?start=' + str(i * 25)
        r = requests.get(link, headers=headers, timeout= 10)
        print (str(i+1),"页响应状态码:", r.status_code)
        print (r.text)
        
get_movies()

　

import requests
from bs4 import BeautifulSoup

def get_movies():
    headers={
        'user-agent':'Mozilla/5.0 (Windows NT 6.1;Win64;x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.82 Safari/537.36',
    'Host': 'movie.douban.com'
    }
    movie_list = []
    for i in range(0,10):
        link='https://movie.douban.com/top250?start='+str(i*25)
        r=requests.get(link,headers=headers,timeout=10)
        print(str(i+1),"页响应状态码:",r.status_code)
        
        soup=BeautifulSoup(r.text,"lxml")
        div_list=soup.find_all('div',class_='hd')
        for each in div_list:
            movie=each.a.span.text.strip()
            movie_list.append(movie)
    return movie_list
movies=get_movies()
print(movies)

照着书打了一遍。不熟悉没印象，明天继续。

　

猜你喜欢

转载自www.cnblogs.com/xx123/p/10327679.html

爬虫实践二--豆瓣top250电影

Python 爬虫实践-豆瓣电影Top250（待续）

R语言爬虫：豆瓣电影Top250（二）

爬虫_豆瓣电影top250

python爬虫——豆瓣电影Top250

豆瓣TOP250 电影爬虫

爬虫豆瓣TOP250电影数据

豆瓣电影top250（网络爬虫）

【python爬虫】—豆瓣电影Top250

python爬虫 —— 豆瓣电影top250电影

爬虫脚本（抓取豆瓣电影Top250）

python爬虫入门:豆瓣电影Top250抓取

Python爬虫获取豆瓣电影TOP250

（十七）Python爬虫：爬取豆瓣电影TOP250

R语言爬虫：豆瓣电影Top250（一）

【C语言爬虫】采集豆瓣电影top250

python爬虫--爬取豆瓣top250电影名

python 爬虫&爬取豆瓣电影top250

Python爬虫 - scrapy - 爬取豆瓣电影TOP250

Python爬虫一：抓取豆瓣电影Top250

爬虫小案例：豆瓣Top250电影

python爬虫入门 ✦ 爬取豆瓣电影Top250

爬虫练习-爬取豆瓣电影TOP250的数据

python爬虫之爬取豆瓣电影top250

爬虫基础---简单使用（附带豆瓣电影top250）

python爬虫爬取豆瓣电影TOP250

爬虫实战：爬取豆瓣TOP250电影信息

python爬虫——爬取豆瓣top250电影信息

Python爬虫抓取豆瓣top250电影

【爬虫】爬取豆瓣Top250电影信息

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)