机器学习入门-加载sklearn中数据并用matplotlib进行可视化 - 代码天地

机器学习入门-加载sklearn中数据并用matplotlib进行可视化

其他 2018-11-05 05:11:32 阅读次数: 0

from sklearn import datasets
import matplotlib.pyplot as plt


def get_data():
    """
    从sklearn中获取鸢尾花的数据
    :return:  鸢尾花数据的字典，字典中包括的key有：【'data', 'target', 'target_names', 'DESCR', 'feature_names']
    简单介绍一下： data就是（150， 4）的数据集，target表示1位数组，数字0～2表示分类， target_names表示分类名，DESCR表示对数据的描述
    feature_names: 特征值名称
    """
    iris = datasets.load_iris()
    return iris


def draw_graph(iris_data):
    """
    获取两个维度的数据进行数据可视化，由于鸢尾花共有4个特征，在平面中只能绘制2个特征，所以获取特征1和特征2进行绘制
    :param: 鸢尾花的数据集
    :return:
    """
    X = iris_data.data[:, :2]
    target_names = iris_data.target_names
    print(target_names)
    print(iris_data.feature_names )
    y = iris_data.target
    plt.scatter(X[y == 0, 0], X[y == 0, 1], color='red', marker='o', label=target_names[0])
    plt.scatter(X[y == 1, 0], X[y == 1, 1], color='blue', marker='*', label=target_names[1])
    plt.scatter(X[y == 2, 0], X[y == 2, 1], color='green', marker='+', label=target_names[2])
    plt.legend()
    plt.title(u'Distribution of 3 different irises in length and width')
    plt.show()


if __name__ == '__main__':
    iris = get_data()
    draw_graph(iris)

运行结果：

方法学习：

1、在sklearn中所有的数据集都放在datasets模块里面，导入对应的数据直接用loadxx

2、在sklearn中load出来的数据是一个字典，直接可以用原始data.属性值获取对应的值，比如 data.feature_names就可以获取特征的名字

3、用matplotlib的时候，多看官方文档 https://matplotlib.org/users/pyplot_tutorial.html

scatter表示随机的绘制点，marker也有不同的描述方法，可以在文档中看到

猜你喜欢

转载自blog.csdn.net/sxb0841901116/article/details/82978250

机器学习入门-加载sklearn中数据并用matplotlib进行可视化

机器学习入门（三）可视化库Matplotlib

Python3入门机器学习 - 数据可视化基础matplotlib

机器学习——数据可视化库Matplotlib

matplotlib sklearn数据降维可视化

数据可视化——Matplotlib模块入门

数据可视化Matplotlib-中

matplotlib—三种方法加载数据文件进行可视化

Python机器学习入门: sklearn.learning_curve 训练结果可视化实例（完整代码）

TensorFlow入门：实现简单的神经网络并用matplotlib.pyplot可视化

用pyecharts对sklearn中的鸢尾花数据进行可视化展示

用Pandas在Python中可视化机器学习数据

机器学习——可视化绘图matplotlib和seaborn

机器学习可视化matplotlib,seaborn常用编程语句

机器学习之matplotlib（三）可视化的框架

使用Python进行数据可视化（一、matplotlib）

利用matplotlib进行数据可视化

使用Matplotlib进行数据可视化（一）

matplotlib数据可视化

数据可视化--> Matplotlib

<数据可视化>Matplotlib +

数据可视化——matplotlib

数据可视化 | Matplotlib

Matplotlib与数据可视化

入门学习（一）matplotlib绘图可视化

matplotlib和Seaborn数据可视化快速入门

Matplotlib数据可视化（1）：入门介绍

Matplotlib数据可视化从入门到精通

Python 入门 matplotlib数据可视化基础【二】

Python 入门 matplotlib数据可视化基础【一】

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)