1 engine是使用的分析引擎,读取csv文件一般指定python避免中文和编码造成的报错。
2 df.info()帮助我们一步摸清各列数据的类型,以及缺失情况:
3 使用Pandas时,尽量避免用行的思维来处理数据,要逐渐养成一种列向思维,每一列是同宗同源,处理起来是嗖嗖的快
4 1)增加一列,用df['新列名'] = 新列值的形式
2) 用drop函数制定删除对应的列,axis = 1表示针对列的操作,删除多列用[col1,col2,col3]
3) 选取某一列: df['列名']即可 选取多列:df[['第一列','第二列','第三列'..]]
4 简单的更改:df['旧列名'] = 某个值或者某列值,就完成了对原列数值的修改。
改多列:df2[['aa','cc']]=90
5