1.获取的数据
2.我们发现日期这一行是字符串形式,需要进行转化
data_lz['date_io'] = pd.to_datetime(data_lz['date_io'])
3.我们要查看数据中每周的库存量,所以要把日期换算成周,但是我们发现数据是跨年的,所以我们需要先把年份分来
4.我们对原有数据进行切分
data_lz_2017 = data_lz[(data_lz['date_io'] >= '2017-01-01') & (data_lz['date_io'] <= '2017-12-31')]
data_lz_2017.head(10)
或者
import numpy as np
data_lz_2018 = data_lz[np.logical_and(data_lz['date_io'] >= '2017-09-22',data_lz['date_io'] <= '2017-10-22')].head(20)
data_lz_2018.head(10)
5.切分完之后,将日期转换成周的形式
#查看函数是否将日期转化成了周的形式
#给定一个list
a = []
# data_lz_2017.head(10)
#将日期更改后赋值到list中a
for i in data_lz_2017['date_io']:
a.append(i.strftime('%W'))
for i in data_lz_2017['date_io']:
print(i.strftime('%W'))
#首先需要赋值一次,不然会给出A value is trying to be set on
data_lz_2017_2 = data_lz_2017.copy()
data_lz_2017_2['周次'] = a
5.分组排序
#按全部信息展示
data_lz_2017_2.groupby(['prod_id','color_id','size','store_id','周次']).sum()['quant_io']
#按全部信息展示
data_lz_2018_2.groupby(['prod_id','color_id','size','store_id','周次']).sum()['quant_io']
#当然可以继续采用排序的方式