python的数据分析之预处理

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/shaoyou223/article/details/79867822

包括对文件的读入,以及文件的一些简单处理。

import pandas as pd
from numpy import *
df = pd.read_excel('C:\\Users\\Administrator\\PycharmProjects\\untitled\\python文件包\\python与数据科学\\excel-comp-data.xlsx')
df.head()
m,n = shape(df)  #m为行数,n为列数
#增加新列total_all
df['total_all'] = pd.Series('',index = df.index)
#对其赋值
df['total_all'] = df['Jan']+df['Feb']+df['Mar']
#对列的名字大写化
df.columns = [c.upper() for c in df.columns]
#找出大于jan列100000的项
df[df['JAN']>100000]

#计算所有的和
df.loc[df.index[-1],'TOTAL_ALL']=sum(df['TOTAL_ALL'][:-2])


猜你喜欢

转载自blog.csdn.net/shaoyou223/article/details/79867822