python 报ValueError: Bin labels must be one fewer than the number of bin edges

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Norsaa/article/details/77774634

在对python数据进行离散化分析时,我想把年龄列进行分组,分成'20-35', '35-50', '50-65', '65-80','80-95','95-110'六组,但是运行时报出了错误ValueError: Bin labels must be one fewer than the number of bin edges,翻译过来的意思是; 分组标签必须比分组的边界少一个

原码是:
labels = ['20-35', '35-50', '50-65', '65-80','80-95','95-110']  #设置的标签
bins=range(20,110,15)  #设置的分组条件,年龄范围是20-110,每一组的间隔为15
use_data['age_group']=pd.cut(use_data.age,bins,right=False,labels=labels) #调用pandas里的cut函数进行计算

错误分析:
因为110恰好是第六组[95,110)的右侧边缘,猜测可能在计算为了保证label里的所有值都能够包含在内,比如此时的值110就无法分类,所以会报故障,把110改成了111就可以了

修改后的程序:
labels = ['20-35', '35-50', '50-65', '65-80','80-95','95-110']
bins=range(20,111,15)
use_data['age_group']=pd.cut(use_data.age,bins,right=False,labels=labels)

猜你喜欢

转载自blog.csdn.net/Norsaa/article/details/77774634