8.5 Python机器学习--微博聚类和音乐分类理论记录 - 代码天地

8.5 Python机器学习--微博聚类和音乐分类理论记录

其他 2018-07-27 21:59:32 阅读次数: 0

Python机器学习：

隆重推出scikit-learn机器学习库

Scikit-Learn是基于python的机器学习模块

Scikit-Learn中的机器学习模型非常丰富，包括SVM，决策树， GBDT，KNN等等，可以根据问题的类型选择合适的模型

Scikit-Learn的安装需要numpy，scipy，matplotlib等模块

微博聚类：

数据集(微博数据)

算法使用(scikit-learn中的kmeans)

期望结果(相似微博聚到同一类)

额外支持模块(jieba中文分词库)

案例流程：

一行行读入原始微博

读的同时进行分词并存入语料库

使用sklearn包中feature_extraction的方法计算出每条微博每个词中的tf-idf值

将计算出的微博向量矩阵带入到算法中去聚类

将聚类结果和原始微博数据进行整合存入一个结果文件

音乐分类：

数据集(音乐数据)

算法使用(scikit learn中的logistic regression(逻辑回归))

期望结果(输入一首歌，可以对输入的歌曲进行分类)

额外支持模块(安装dateutil-->six-->pyparsing-->pytz-->matplotlib)

案例流程：

["classical", "jazz", "country", "pop", "rock", "metal"]

通过傅里叶变换将以上6类里面所有原始wav格式音乐文件转换为特征,并取前1000个特征,存入文件以便后续训练使用

读入以上6类特征向量数据作为训练集

使用sklearn包中LogisticRegression的fit方法计算出分类模型

读入黑豹乐队歌曲”无地自容”并进行傅里叶变换同样取前1000维作为特征向量

调用模型的predict方法对音乐进行分类,结果分为rock即摇滚类

猜你喜欢

转载自blog.csdn.net/u011418530/article/details/80980095

8.5 Python机器学习--微博聚类和音乐分类理论记录

8.5 聚类算法

8.5学习笔记

8.5 擦除和转换

8.5

8.5（java学习笔记）8.5 字节码操作（javassist）

8.5SPI和API

8.5 定义一个标准的类

学习的一周？【8.5进度报告】

前端学习笔记-8.5同源策略

myEclipse 8.5 设置背景颜色和字体

MyEclipse8.5的配置和优化

孙Cloud的Java学习博客-8.5-抽象类

Python学习笔记--8.5 函数--全局变量

8.5java第一课记录帖

【2018.04.20学习笔记】【linux基础知识8.1-8.5】

【Tomcat学习】Eclipse导入Tomcat8.5源码

PowerBuilder学习笔记之8.5高级窗口控件

Java学习笔记一Tomcat 8.5 的WebSocket 支持

使用MyEclipse 8.5整合SSH框架和基础配置

Myeclispe 8.5下断网安装ADT和Android SDK

eclipse 和 Myeclipse8.5 反编译插件 jad 安装

在 CentOS 6 里安装 OpenJDK 1.8 和 Tomcat 8.5

Tomcat8.5 修改sessionId的key和session追踪模式

在MyEclipse2017中配置JDK和Tomcat8.5

myeclipse2017 和 tomcat8.5的整合

armv8.5-a 构架：增强安全和性能

tomcat8.5的安装、卸载、配置和部署

Tomcat8.5配置https和SpringBoot配置https

tomcat8.5和redis实现session共享

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)