PyTorch BROADCASTING SEMANTICS
官网资料:https://pytorch.org/docs/stable/notes/broadcasting.html
Broadcasting 是指不同大小的两个 array 应该怎样处理的操作。通常情况下,小一点的数组会被 broadcast 到大一点的,这样才能保持大小一致。
两个 Tensors 只有在下列情况下才能进行 broadcasting 操作:
- 每个 tensor 至少有一维
- 遍历所有的维度,从尾部维度开始 ,每个对应的维度大小要么相同; 要么其中一个是 1; 要么其中一个不存在
举例说明
import torch
- 相同维度,一定可以 broadcasting。故可以互相操作
x=torch.empty(2,4,3)
y=torch.empty(2,4,3)
print(x.shape)
print(y.shape)
torch.Size([2, 4, 3])
torch.Size([2, 4, 3])
x.add(y)
tensor([[[1.0061e-42, 0.0000e+00, 0.0000e+00],
[0.0000e+00, 0.0000e+00, 0.0000e+00],
[0.0000e+00, 0.0000e+00, 0.0000e+00],
[0.0000e+00, 0.0000e+00, 0.0000e+00]],
[[0.0000e+00, 0.0000e+00, 0.0000e+00],
[0.0000e+00, 0.0000e+00, 0.0000e+00],
[0.0000e+00, 0.0000e+00, 0.0000e+00],
[0.0000e+00, 0.0000e+00, 0.0000e+00]]])
- x 没有符合“至少有一个维度”,所以不可以 broadcasting. 故不能直接操作
x=torch.empty((0,))
y=torch.empty(2,2)
print(x.shape)
print(y.shape)
torch.Size([0])
torch.Size([2, 2])
x.add(y)
---------------------------------------------------------------------------
RuntimeError Traceback (most recent call last)
<ipython-input-24-2f346478ebe1> in <module>()
----> 1 x.add(y)
RuntimeError: The size of tensor a (0) must match the size of tensor b (2) at non-singleton dimension 1
- 遍历所有的维度,从尾部维度开始 ,每个对应的维度大小要么相同; 要么其中一个是 1; 要么其中一个不存在
需要变化维度才能操作
# 按照尾部维度对齐
x=torch.empty(5,3,4,1)
y=torch.empty( 3,1,1)
# x 和 y 是 broadcastable
# 1st 尾部维度: 都为 1
# 2nd 尾部维度: y 为 1
# 3rd 尾部维度: x 和 y 相同
# 4th 尾部维度: y 维度不存在
如果两个 tensors 可以 broadcasting,那么计算过程是这样的:
- 如果 x 和 y 的维度不同,那么对于维度较小的 tensor 的维度补 1,使它们维度相同。
- 然后,对于每个维度,计算结果的维度值就是 x 和 y 中较大的那个值。
x 和 y 是 broadcastable,即使唯独不同也可以操作,操作后的结果,取唯独最大的一端
x=torch.empty(5,1,4,1)
y=torch.empty( 3,1,1)
print(x.shape)
print(y.shape)
torch.Size([5, 1, 4, 1])
torch.Size([3, 1, 1])
(x+y).size()
torch.Size([5, 3, 4, 1])
来看一个不对的例子:原因 x和y 不是broadcastable,主要 2和3对应的维度不满足条件
x=torch.empty(5,2,4,1)
y=torch.empty( 3,1,1)
(x+y).size()
---------------------------------------------------------------------------
RuntimeError Traceback (most recent call last)
<ipython-input-37-7836c771d982> in <module>()
1 x=torch.empty(5,2,4,1)
2 y=torch.empty(3,1,1)
----> 3 (x+y).size()
RuntimeError: The size of tensor a (2) must match the size of tensor b (3) at non-singleton dimension 1