Pandas处理分类数据

一、category的创建及其性质

1.分类变量的创建

(a)用Series创建

(b)对DataFrame指定类型创建

(c)利用内置Categorical类型创建

(d)利用cut函数创建

2.分类变量的结构

(a)describe方法

(b)categories和ordered属性

3. 类别的修改

(a)利用set_categories修改

(b)利用rename_categories修改

(c)利用add_categories添加

(d)利用remove_categories移除

(e)删除元素值未出现的分类类型

二、分类变量的排序

1.序的建立

(a)一般来说会将一个序列转为有序变量,可以利用as_ordered方法

(b)利用set_categories方法中的order参数

(c)利用reorder_categories方法

2. 排序

三、分类变量的比较操作

1.与标量或等长序列的比较

(a)标量比较

(b)等长序列比较

2.与另一分类变量的比较

(a)等式判别(包含等号和不等号)

(b)不等式判别(包含>=,<=,<,>)

猜你喜欢

转载自blog.csdn.net/qq_40317204/article/details/106987319
今日推荐