百度音乐的爬虫操作流程 - 代码天地

百度音乐的爬虫操作流程

其他 2020-02-20 13:57:16 阅读次数: 0

通常，我们会使用selenium来获取页面的元素，百度音乐(千千音乐)的爬取音乐，并下载下来。

这里，我们依然使用selenium来换取页面歌单信息，经过分析，歌单列表获取后，可以获取歌曲的song_id 和 title，获取之后，通过开发者工具的NetWork里查看到获取音乐url的api：

http://musicapi.taihe.com/v1/restserver/ting?method=baidu.ting.song.playAAC&songid=SONGID&from=web

songid:song_id

返回值：

file_link就是音乐下载url。

附上代码：

import requests
from selenium import webdriver
import time
import json

if __name__ == "__main__":
    list_url = "http://musicapi.taihe.com/v1/restserver/ting?method=baidu.ting.song.playAAC&songid=SONGID&from=web"

    browser = webdriver.Chrome()
    browser.implicitly_wait(5)

    browser.get("http://music.taihe.com/top/dayhot")
    elements = browser.find_elements_by_css_selector("#songListWrapper > div > ul > li.song-item-hook div.song-item  span.song-title  a")

    for e in elements:
        id = str(e.get_attribute("href")).split("/")[-1]
        title = e.get_attribute("title")

        result = requests.get(list_url.replace("SONGID",id))
        _json_result = json.loads(result.text,encoding="utf-8")
        file_link = _json_result["bitrate"]["file_link"]

        content = requests.get(file_link)
        with open("D:/resources/music/" + str(title).replace("/","") + ".mp3","wb") as fp:
            fp.write(content.content)

发布了144 篇原创文章 · 获赞 77 · 访问量 538万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/wtl1992/article/details/102764507

百度音乐的爬虫操作流程

百度音乐爬虫

python爬虫(百度音乐)

pythonp爬虫爬取百度音乐

python3_爬虫_爬百度音乐

每日爬虫：爬百度千千音乐

百度爬虫

js 模拟百度音乐-全选操作

vue 百度音乐

百度文库操作流程，做seo很实用

百度图片爬虫

百度指数爬虫

百度APP爬虫

百度文库爬虫

爬虫 -- 百度图片

python爬虫之爬取百度音乐的实现方法

Python 爬取百度音乐

百度音乐api接口

百度音乐API全接口

百度VIP音乐爬取

百度音乐免费API接口

卖掉亲生“百度音乐”，注资“网易云音乐”，百度到底要干嘛？

百度地图SDK接入指南接入操作流程百度地图sdk开发指南

python爬虫操作（本次爬虫的百度、风景、酷狗和人物）

python爬虫百度翻译

爬虫-百度贴吧

python爬虫-百度/360搜索

百度贴吧爬虫

百度爬虫搞定动态url

百度爬虫Baiduspider更新通知

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)