恩格尔系数计算
恩格尔系数,它表示食品支出占一个人总支出的比重。那么下面文文将根据官方给出的数据,带你一步步分析计算每个人的恩格尔系数。
1)读取数据
我们利用pandas的read_csv方法将数据读入到DataFrame中:
#没有columns数据,header属性设置为None
card_df=pd.read_csv('card_train.txt',header=None)
由于官方没有给定colunms,我们对columns属性进行赋值:
card_df.columns = ['id','consume','where','how','time','amount','remainder']
我们可以先来看一下前10行的数据,使用head()方法
print (card_df.head(10))
输出结果如下:
id consume where how time amount remainder1006 POS消费 地点551 淋浴 2013/09/01 0.50 124.901006 POS消费 地点551 淋浴 2013/09/01 0.50 124.901968 POS消费 地点159 淋浴 2013/09/01 0.10 200.141968 POS消费 地点159 淋浴 2013/09/01 0.10 200.141406 POS消费 地点660 开水 2013/09/01 0.01 374.421406 POS消费 地点660 开水 2013/09/01 0.01 374.421406 POS消费 地点78 其他 2013/09/01 0.60 373.821406 POS消费 地点78 其他 2013/09/01 0.60 373.8213554 POS消费 地点6 淋浴 2013/09/01 0.50 522.3713554 POS消费 地点6 淋浴 2013/09/01 0.50 522.37