python 扩展库 interval

在做评分卡分箱操作时会涉及区间处理,一开始用pd.qcut()做均匀分箱,会返回相应的分箱区间,区间的类型是pandas自带的区间格式类型,这都没有问题,但在后面进行分箱调整时,需要进行区间的相加,也就是把一些多余的箱子的区间和其附近的箱子的区间汇总成为一个更大的区间,本质上就是并集处理,这时候发现问题了,因为pandas自带的区间类型根本不支持加法、并集、连接等处理,才发现这是一个开发的并不完善的class。因此决定启用pandas的区间类,而使用可以支持简单区间操作的类,就这样找到了interval库。这个库的操作很简单,也支持基本的区间操作,可以满足我的使用。pandas区间类转化到interval区间类的操作也很简单,只需要把pandas区间类用left和right属性提取出两端的数值,然后填充到interval区间类中即可。

猜你喜欢

转载自blog.csdn.net/yuanjackson/article/details/84064436