第三天作业附带 - 代码天地

第三天作业附带

其他 2019-09-26 02:14:35 阅读次数: 0

'''爬取豆瓣电影TOP250
第一页：
https://movie.douban.com/top250?start=0&filter=
第二页：
https://movie.douban.com/top250?start=25&filter=
'''
import requests
import re
#拼接电影爬去地址url
num = 0
for line in range(10):
    url = 'https://movie.douban.com/top250?start=%s&filter=' % (num,)
    num += 25
#print(url)
#往拼接好的ulr地址发送请求获取数据
response = requests.get(url)
# print(response.text)  # 获取文本数据
# 3.解析并提取数据
# 电影名称、电影地址、电影评分、评价人数
# re.findall('匹配文本的规则', '匹配的文本', '匹配模式')  # 解析提取文本数据中想要的数据
#.*?: 过滤不想要的数据，直到想要的数据出现
#  (.*?): 提取想要的数据
# 匹配规则
# <div class="item">.*?<a href="(.*?)">.*?<span class="title">(.*?)</span>.*?<span class="rating_num" property="v:average">(.*?)</span>.*?<span>(.*?)人评价</span>
data = re.findall('<div class="item">.*?<a href="(.*?)">.*?<span class="title">(.*?)</span>.*?<span class="rating_num" property="v:average">(.*?)</span>.*?<span>(.*?)人评价</span>', response.text, re.S)  # re.S忽略换行
# print(data)
for d in data:
    # print(d)

    url, name, point, count = d

    movie_data = '''
    电影名称: %s
    电影地址: %s
    电影评分: %s
    评价人数: %s
    \n
    ''' % (name, url, point, count)

    print(movie_data)

    # 4.保存数据
    # a: append
    with open('豆瓣.txt', 'a', encoding='utf-8') as f:
        f.write(movie_data)

猜你喜欢

转载自www.cnblogs.com/fage5113/p/11588560.html

第三天作业附带

第三天作业

第三天作业答案

Python 第三天作业

第三天python作业

前端第三天作业

第三天

第三天！

第三天。。。

第三天？

团队作业Beta冲刺-第三天

Python第三天课后作业

团队作业-Beta冲刺第三天

实训第三天Java作业Switch while

hibernate第三天

python第三天

android第三天

mongo第三天

MySQL第三天

戒烟（第三天）

Struts第三天

第三天，Hello

Servlet第三天

汇编第三天

记录第三天

openlayers第三天

jdbc第三天

第三天笔记

JS 第三天

第三天实习

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)