累计统计分析函数
方法 | 说明 |
---|---|
.cumsum() | 依次给出前1、2、3、…、n个数的和 |
.cumprod() | 依次给出前1、2、3、…、n个数的积 |
.cummax() | 依次给出前1、2、3、…、n个数的最大值 |
.cummin() | 依次给出前1、2、3、…、n个数的最小值 |
df = pd.DataFrame(np.arange(20).reshape(4, 5), index=['c', 'a', 'd', 'b'])
-
前n个孰累加
.cumsum()
print(df.cumsum())
- 前n个数求每列最小值
.cummin()
axis=0 axis=1为累计列
- 前n个数求累计列最大值.cummax()
axis=0 axis=1为累计列print(df.cummax())
- 前n个数求每列最小值
滚动计算函数
方法 | 说明 |
---|---|
.rolling(w).sum() | 依次计算相邻w个元素之和 |
.rolling(w).mean() | 依次计算相邻w个元素的算数平均值 |
.rolling(w).var() | 依次计算相邻w个元素的方差 |
.rolling(w).std() | 依次计算相邻w个元素标准差 |
.rolling(w).min() .max() | 依次计算相邻w个元素的最小值、最大值 |
w:窗口大小
df = pd.DataFrame(np.arange(20).reshape(4, 5), index=['c', 'a', 'd', 'b'])
- 计算相邻w个元素之和
.rolling(w).sum()