1、用途:pandas.cut函数
用来把一组数据按照离散的区间进行频数统计。
2、参数:
pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates='raise')
x
:被切分的类数组,必须是1维(不能是DataFrame);bins
:bins是区间 ;
right
:bool型参数,默认True,表示是否包含区间右部。
labels
:给分割区间的标签。如果指定labels=False,则返回x中的数据在第几个bin中(从0开始)。retbins
:bool型的参数,表示是否将分割后的bins返回,默认False。precision
:保留区间小数点的位数,默认为3.include_lowest
:bool型的参数,表示区间的左边是开还是闭的,默认false。duplicates
:是否允许重复区间。有两种选择:raise
:不允许,drop
:允许。
3、例子:
acc_SVC_bin = pd.cut(acc_all['acc_SVC'],bins=[0, 0.5, 0.6, 0.7, 0.8,1],
include_lowest=True,right=False,
labels=['[0,50%)', '[50%,60%)', '[60%,70%)', '[70%,80%)', '[80%,100%]'])
print(pd.value_counts(acc_SVC_bin))
结果如下: