爬虫 - bilibili排行榜视频 - 代码天地

爬虫 - bilibili排行榜视频

其他 2020-03-29 21:34:11 阅读次数: 0

一、目标

爬取 https://vc.bilibili.com/p/eden/rank#/?tab=全部小视频排行榜视频

二、准备

安装第三方库 requests、fake_useragent

创建bili文件夹

三、解释

排行榜视频直接把所有排行榜视频存储在服务器，直接把视频排行的服务器视频地址暴露在preview中直接在试图中找到此链接的json串遍历出来即可

1 用户 - > url 2 用户 - > server 也属于数据挖掘的一种方式

四、代码
import requests
# 可自动生成浏览器UserAgent请求头
from fake_useragent import UserAgent

headers = {
　　# 浏览器类型 (有的网址服务器检测浏览器反扒其中的一种) 可随机生成浏览器类型
　　'User-Agent': UserAgent().random
}

# 获取服务器视频url地址
def top_video():
　　url = 'https://api.vc.bilibili.com/board/v1/ranking/top?page_size=10&next_offset=&tag=%E4%BB%8A%E6%97%A5%E7%83%AD%E9%97%A8&platform=pc'
　　response = requests.get(url).json()
　　data = response['data']['items']
　　for i in data:
　　ite = i['item']
　　video_url = ite['video_playurl']
　　dowloads_video(video_url)

count = 1
# 下载本地
def dowloads_video(video_url):
　　global count
　　response = requests.get(video_url, stream=True, headers = headers)
　　# 每次下载视频数据大小
　　chunk_size = 1024
　　with open('bili/{}.mp4'.format(count), 'ab') as f:
　　　　for data in response.iter_content(chunk_size=chunk_size):
　　　　　　f.write(data)
　　　　count += 1

top_video()

猜你喜欢

转载自www.cnblogs.com/webster1/p/12594915.html

爬虫 - bilibili排行榜视频

python爬虫(电影排行榜)

python爬虫大学排行榜

python爬虫实例--网易云音乐排行榜爬虫

python爬虫爬取酷狗音乐排行榜

Python爬虫实战：爬取全站小说排行榜

Python爬虫学习笔记之抓取猫眼的排行榜

爬虫-1.4排行榜小说批量下载

爬虫 | cnblog文章收藏排行榜(“热门文摘”)

python 爬虫爬取网易新闻网易排行榜

Go语言小说排行榜爬虫实现

Python爬虫_福布斯排行榜_数据可视化

Python爬虫收集今日热榜数据：聚合全网热点排行榜

bilibili视频爬虫

bilibili视频-爬虫

bilibili弹幕网视频日排行榜数据分析

【python 爬虫】 scrapy 入门--爬取百度新闻排行榜

【Python】数据提取xpath和lxml模块（豆瓣电影排行榜的爬虫）

python实战之原生爬虫(爬取熊猫主播排行榜)

Python3爬虫入门实战系列（二）爬取猫眼电影排行榜

爬虫实践：电影排行榜和图片批量下载（看的大佬的）

Python爬虫使用lxml模块爬取豆瓣读书排行榜并分析

python3爬虫-网易云排行榜，网易云歌手及作品

python3爬虫-爬取B站排行榜信息

Python爬虫实践 —— 6.豆瓣电影排行榜百top数据爬取

用 Python 写一个 Kaggle 比赛排行榜的爬虫

写一个爬取每日温度排行榜的爬虫

Python爬虫数据存储（TXT文本存储）爬取豆瓣音乐排行榜

爬虫之对B站排行榜前100作品的名称及地址获取

python爬虫爬取小说排行榜目录并导入Excel中，方便筛选

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)