[python爬虫]多进程爬取喜马拉雅音乐

其他 2018-08-31 07:01:58 阅读次数: 0

导包

import json,os
from piaot import *
from multiprocessing import Pool

def pqxs(shu=1):

    # 循环页数
    for i in range(1,shu+1):

        # 需要查询手动输入链接地址
        url="http://www.ximalaya.com/revision/album/getTracksList?albumId=12642314&pageNum="+str(i)

        # 调用了自定义包（开启代理和隐藏html头，返回2进制）
        req=yc(url)

        # 进行转码
        req=req.decode('utf-8')

        # 进行json解码
        html=json.loads(req)

        # 在返回的值里找到需要的数据
        a=html['data']['tracks']
        q=Pool(4)
        # 进行循环遍历
        for i in a:

            # 找到了每个小说的名称
            v=i['title']


            # 将值里取出后面的id编号（id为每个音频的连接条件）
            x=i['url'].split('/')[-1]

            # 将值里的《》标点符号去掉
            name = v.split('》')
            name = name[0].split('《')
            name=name[1]

            # 存储路径
            b = 'C:/Users/黑神/Desktop/pc_zy/喜马拉雅/' + name

            # 判断当前路径是否存在，没有则创建文件夹
            if not os.path.exists(b):

                print('正在创建文件夹：路径C:/Users/黑神/Desktop/pc_zy/'+name+'/')

                # 执行存储
                os.makedirs(b)

                print('创建成功....')

            # 音频链接地址
            url_xs = 'https://www.ximalaya.com/revision/play/tracks?trackIds='+str(x)

            # 音频存放的路径
            dz=b+'/'+v+'.m4a'

            print(v+'音频下载中.............')

            try:
                # 多进程下载
                zhi = q.apply_async(yc,(url_xs,))

                # 保存到文件
                with open(dz, 'wb') as f:
                    f.write(zhi.get())

                print('(^-^)OK')

            except:

                print('( T _ T )NO')

if name == ‘main‘:
# 页数
pqxs(1)

猜你喜欢

转载自blog.csdn.net/Black_God1/article/details/81880485

[python爬虫]多进程爬取喜马拉雅音乐

[python爬虫]喜马拉雅音乐

Python爬虫--喜马拉雅音频爬取

Python爬虫|爬取喜马拉雅音频

Python 爬取喜马拉雅音频

网易云音乐信息爬取（存储为 csv文件）&喜马拉雅音乐爬取

Python_爬虫_喜马拉雅音频

python 爬取喜马拉雅

喜马拉雅说爬取音乐文件

喜马拉雅音频爬取（仅供参考学习）

类+进程池的方法爬取喜马拉雅

Python爬虫--喜马拉雅三国音频爬取

practice之Python爬取喜马拉雅的音频

Python---喜马拉雅fm的音频爬取

Python采集喜马拉雅音频数据详解

喜马拉雅爬取

喜马拉雅音频下载

【python爬虫】对喜马拉雅上一个专辑的音频进行爬取并保存到本地

【Python3 爬虫学习笔记】爬取喜马拉雅《宝宝巴士-奇妙三字经》

Python3简单爬虫之下载相关类型音乐（喜马拉雅网站）！

node.js 实现爬虫批量下载喜马拉雅音频

喜马拉雅全站音频爬取

如何用Python爬取喜马拉雅全网音频文件

Python实例---爬取喜马拉雅全网音频文件

教你用python爬取喜马拉雅FM音频，干货分享~

Python爬取喜马拉雅有声小说【转载】

Python中使用requests和parsel爬取喜马拉雅电台音频

Python爬取喜马拉雅有声书

Python爬虫 -- 喜马拉雅爬虫01

喜马拉雅音频下载V1.1的功能

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)