- Scale
- RandomHorizontalFlip
- RandomCrop
- 为什么会被提出来
之前的假设都是基于嵌套结构,但是会出现如下的非嵌套结构
随着神经网络的层数的增加,尽管可以拟合出的函数关系的范围会增大(即最后一层神经网络覆盖的面积),但很有可能反而越来越难以拟合出最接近 f * 的函数。
残差模块强制将结构转化为嵌套结构
torch.max
这段来自pytorch的定义
def max(self: Tensor, dim: _int, keepdim: _bool=False, *, out: Optional[Tensor]=None) -> Tuple[Tensor, Tensor]: …
Tensor:给定一个张量
keepdim:维度(0、1:行,列)
对于一个张量在给定维度内的最大值