【Python】【爬虫】爬取酷狗音乐网络红歌榜 - 代码天地

【Python】【爬虫】爬取酷狗音乐网络红歌榜

其他 2019-12-23 13:01:11 阅读次数: 0

原理：我的上篇博客

import requests
import time
from bs4 import BeautifulSoup


def get_html(url):
    '''
    获得 HTML
    '''
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/53\
        7.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36'
    }
    response = requests.get(url, headers=headers)
    if response.status_code == 200:
        return response.text
    else:
        return


def get_infos(html):
    '''
    提取数据
    '''
    html = BeautifulSoup(html)
    # 排名#
    ranks = html.select('#rankWrap > div.pc_temp_songlist > ul > li > span.pc_temp_num')
    # 歌手 + 歌名
    names = html.select('#rankWrap > div.pc_temp_songlist > ul > li > a')
    # 播放时间
    times = html.select('#rankWrap > div.pc_temp_songlist > ul > li > span.pc_temp_tips_r > span')

    # 打印信息
    for r,n,t in zip(ranks,names,times):
        r = r.get_text().replace('\n','').replace('\t','').replace('\r','')
        n = n.get_text()
        t = t.get_text().replace('\n','').replace('\t','').replace('\r','')
        data = {
            '排名': r,
            '歌名-歌手': n,
            '播放时间': t
        }
        print(data)


def main():
    '''
    主接口
    '''
    urls = ['https://www.kugou.com/yy/rank/home/{}-23784.html?from=rank'
                .format(str(i)) for i in range(1, 6)]
    for url in urls:
        html = get_html(url)
        get_infos(html)
        time.sleep(1)


if __name__ == '__main__':
    main()

结果：

猜你喜欢

转载自www.cnblogs.com/HGNET/p/12083066.html

【Python】【爬虫】爬取酷狗音乐网络红歌榜

python爬虫爬取酷狗音乐排行榜

python爬取酷狗音乐排行榜

Python爬取网易云音乐热歌榜（爬虫）

python爬虫教程：爬取酷狗音乐

爬取酷狗酷狗飙升榜，爬虫案例

Python爬虫——分析酷我音乐网站，并爬取歌曲

python爬取酷狗排行音乐

【python】爬取酷狗音乐Top500排行榜【附源码】

【python实现网络爬虫（14）】python爬取酷狗中多类型音乐步骤详解（附全部源代码）

爬取酷狗音乐

爬虫项目实战十二：爬取酷狗音乐

python qq音乐网易云音乐酷狗音乐

python爬虫——爬取酷狗音乐top500(BeautifulSoup使用方法)

python使用beautifulsoup4爬取酷狗音乐

Python爬取酷狗音乐TOP500榜单

Python 爬取酷狗音乐的思路分析

Python爬取酷我音乐排行榜歌曲~

爬取酷狗飙升榜

爬取酷狗音乐网站，上榜单前500名的歌曲名称！

Python爬虫实战，Request+urllib模块，批量下载爬取飙歌榜所有音乐文件

爬取酷狗音乐华语新歌榜前100

python网络爬虫-爬取酷狗TOP500的数据源码

多进程爬虫python——实例爬取酷狗歌单

Python爬虫入门——2. 2爬取酷狗音乐top1-500歌曲信息

Python爬取网易云音乐热歌排行榜Top200音乐

爬虫练习：爬取网易云音乐热歌榜全部歌曲的热门评论

python爬虫七：爬取音乐V榜

Python爬虫:运用json数据爬取酷我音乐

爬虫项目3[爬取酷狗音乐Top500歌名]

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)