2020-10-19:使用pandas.cut函数按区间统计频数

1、用途:pandas.cut函数用来把一组数据按照离散的区间进行频数统计。

2、参数:

pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates='raise') 

x:被切分的类数组,必须是1维(不能是DataFrame);
bins:bins是区间 ;

right:bool型参数,默认True,表示是否包含区间右部。

labels:给分割区间的标签。如果指定labels=False,则返回x中的数据在第几个bin中(从0开始)。
retbins:bool型的参数,表示是否将分割后的bins返回,默认False。
precision:保留区间小数点的位数,默认为3.
include_lowest:bool型的参数,表示区间的左边是开还是闭的,默认false。
duplicates:是否允许重复区间。有两种选择:raise:不允许,drop:允许。

3、例子:

acc_SVC_bin = pd.cut(acc_all['acc_SVC'],bins=[0, 0.5, 0.6, 0.7, 0.8,1],
                     include_lowest=True,right=False, 
                    labels=['[0,50%)', '[50%,60%)', '[60%,70%)', '[70%,80%)', '[80%,100%]'])
print(pd.value_counts(acc_SVC_bin))

结果如下:

猜你喜欢

转载自blog.csdn.net/weixin_38192254/article/details/109163849
今日推荐