数据系列教程之numpy( 三)

上周讲了数据分析入门的前两节,numpy库,今天继续讲该库的第三节,给大家讲下简单一些学习思路,最近讲的numpy和后面要讲的pandas两个库,都是数据处理方面很强大的库,学习思路无非就是先了解其数据结构,如何创建其数据结构,比如上面的教程一,创建好后再就是如何获取你想要的值,比如上面的教程二,我们取完值以后最后要操作处理这些取到的数据,就是今天的教程三,这就是一个主线,围绕这个思路学习,就会事半功倍,抓住重点知识掌握,尽量少在一些不必要的地方浪费过多时间。

当然其实说实话,我一不是名校毕业,也不是计算机专业,可能跟不少朋友一样,转行到python,二从事数据分析时间也不是特别久,讲的东西肯定没有那些专业的老师讲的细致精准有深度,其实找一些系统视频教程看更会学的更快,但是我个人有写文章做总结的习惯,巩固下自己知识的同时,当作一个自己的知识查询笔记,同时也把自己的一些学习经验分享给大家,希望大家能多结合一些学习视频和文章教程,相辅相成学习

1、numpy中数值的修改

简单创建一个numpy数组,np.array()方法,想让第二列和第三列数据改为0,修改数值先取第二列和第三列

在这里插入图片描述

当然复习一点知识点,取值的时候,第一个冒号代表取所有行,后面的话,取连续的多列可以也用冒号方法来表示,类似python列表,取不连续的多列用中括号表示,里面是列的下标

在这里插入图片描述

2、numpy中数值的修改(布尔索引)

现在问题升级,我要在最先创建的原始df上修改,将小于10的数替换为0,

在这里插入图片描述

大家都知道布尔代表true和false,这里叫布尔索引,则是因为我们打印df < 10,返回的是true和false的数组,我们把满足true的都替换为我们要替换的值

在这里插入图片描述

3、numpy中数值的修改(布尔索引升级版)

小于等于10的数替换为0,大于10的数替换为20,从最原始的df开始修改

在这里插入图片描述

当然还有另外一种三元运算方法,np.where(条件,满足条件的替换值,不满足条件的替换值)

在这里插入图片描述

4、numpy中nan修改(空值)

用isnan方法判断是不是nan数据,返回布尔值,是空值的话替换

在这里插入图片描述

有nan,数据类型变为float,已经不是int类型,可以用dtype查看数据类型

在这里插入图片描述

5、numpy中nan的一些特性

特性:nan不等于nan,nan和任何值计算都是nan

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_41666747/article/details/82793293