pandas 高级二(数据分组,筛选;文件保存)

以下示例均导入以下包

import pandas as pd
from numpy import nan as Na
import numpy as np
from pandas import DataFrame,Series
import sys

一、数据分组 cut / qcut

1.1 pd.cut
pd.cut(arr,bins,right=True,labels=None,retbins=False,precision=3,include_lowest=False)
    bins:   序列表示分组边界;
            整数表示个数
    labels: 指定分组名称
    include_lowest: 是否保留分组边界最小的一个值,在bins取整数时无效
    right:          是否保留分组边界中最大的一个值
    presision:      指定分组边界要显示的小数点个数
    retbins:       是否在结果中显示分组边界信息

    right,include_lowest 不会同时为 false:(可以同时为 True)
    优先级:right > include_lowest.

这里写图片描述

11.2 pd.qcut

这里写图片描述
这里写图片描述
这里写图片描述

二、数据过滤与筛选

这里写图片描述

三、pandas 文件读取/存储(IO)

pd.read_csv(filepath_or_buffer="./train_data.txt")
将数据储存到csv:to_csv

这里写图片描述

3.2 文件读取

这里写图片描述

3.3 文件保存

这里写图片描述

猜你喜欢

转载自blog.csdn.net/wsp_1138886114/article/details/80799863