pytorch 创建onehot向量

one-hot向量

ne-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效。

One-Hot编码是分类变量作为二进制向量的表示。这首先要求将分类值映射到整数值。然后,每个整数值被表示为二进制向量,除了整数的索引之外,它都是零值,它被标记为1。
例如
[1,2,4] 有三个数 数的范围是0-4 因此需要一个3x5的张量,可以编码为

[[0 1 0 0 0],
[0 0 1 0 0],
[0 0 0 0 1]]

使用pytorch转换one-hot向量

target.scatter_(dim,index,data)
解释 使用 index中的索引用data中的数据对target沿着dim维度方向进行填充~
看起来很复杂,好好思考一下其实不难理解。
例如,考虑一个张量[1,2,4],需要转换成one-hot编码向量

import torch
index = torch.tensor([1,2,4])
a = index.unsqueeze(1)
print(a)

输出

tensor([[1],
        [2],
        [4]])

需要将index进行升维的原因是我们需要沿这第二个维度方向进行索引,如果不这样做的话,直接按照[1,2,4]进行索引,无法完成该操作,因为这样是沿着第1维度进行索引,索引结果是1,2,4。

import torch

index = torch.tensor([1, 2, 4])
a = index.unsqueeze(1)
result1 = torch.zeros(3,5).scatter_(1,a,1)
print(result1)

输出

tensor([[0., 1., 0., 0., 0.],
        [0., 0., 1., 0., 0.],
        [0., 0., 0., 0., 1.]])

猜你喜欢

转载自blog.csdn.net/weixin_41154636/article/details/115458109