【爬虫】使用BeautifulSoup、requests和you_get爬虫下载B站视频

企业开发 2023-08-08 19:34:14 阅读次数: 0

前言

BeautifulSoup 是一个可以从HTML或XML文件中提取数据并解析的Python库， Requests 是一常用的可以获取和发送http的请求库， you_get 则是方便的下载各大网站的视频的命令行工具。整体流程上是，先用 Requests 请求获得网站源代码，再用 BeautifulSoup 解析网站并筛选出自己要的信息（如视频的url），最后用 you_get 下载。

例子

以下代码实现的是下载网站电影。

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
Created on Sun Mar 15 12:06:21 2020

@author: weiquan fan
"""

from bs4 import BeautifulSoup as bs
import requests,re,os


def download(url, filename):
    path_root = './Videos'
    os.system('you-get -o {} -O {} {}'.format(path_root, filename, url))

url_base = 'https://www.bilibili.com/movie/?spm_id_from=333.851.b_62696c695f7265706f72745f6d6f766965.2'

response = requests.get(url_base)
page = response.text
soup = bs(page, 'html.parser')
vids = soup.findAll('li',attrs={
    
    'class':re.compile('video-item-biref.*?')})# bilibili

video_urls = []
counter=1

if(vids):
    for v in vids:
        #v_link = v.find('a')['href']
        #v_name = v.find('img')['alt']
        print(v)
        v_link = v.find('a')['href']
        v_name = v.find('img')['alt']

        video_urls.append([v_link, v_name])
        print(v_link,v_name)

        try:
            download(v_link, v_name)

        except Exception:
            print('can\'t download '+v_name+' in '+v_link)
            counter -= 1

        counter += 1
        if(counter>15):
            break

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/tobefans/article/details/125433319

【爬虫】使用BeautifulSoup、requests和you_get爬虫下载B站视频

python you_get 下载视频

使用you-get批量下载B站视频

使用you-get工具下载b站视频

爬虫 - requests 和 BeautifulSoup

python下载视频you_get包实战

you_get的使用下载视频一步到位

Python爬虫之BeautifulSoup和requests的使用

爬虫【三】 requests和BeautifulSoup的使用

爬虫库requests和BeautifulSoup的基本使用

爬虫入门——requests和Beautifulsoup

B站视频爬虫

python爬虫8——下载视频：you-get工具

python爬虫使用requests和BeautifulSoup出现中文乱码

使用requests+BeautifulSoup的简单爬虫练习

you-get批量下载下载b站视频、视频转码、导入PR的操作

Python爬虫之B站视频下载器

【python爬虫】使用requests+多线程爬取B站改革春风吹满地视频5w评论

无法使用you-get下载B站视频了，不知道是什么问题，在线等大神！！

python利用you-get轻松下载B站视频

Anaconda中如何用you-get下载b站视频

you-get 超强视频下载工具（支持B站等多个平台）

python爬虫基础（requests、BeautifulSoup）

爬虫：requests & BeautifulSoup 实战案例

爬虫（Requests库get和post应用）

requests爬虫get请求

B站视频信息爬虫python

【Python网络爬虫】使用requests和beautifulsoup4库轻松实现

Python爬虫实战：使用Requests和BeautifulSoup爬取网页内容

如何找到you-get可以使用的B站视频url

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)