5-25日

1.pytorch 的nn.Linear 参数初始化方法

m=nn.Linear(3, 4)
print(m.weight)
print(m.bias)

#输出
Parameter containing:
tensor([[ 1.7056e-01, -4.5271e-01,  1.5907e-01],
        [ 6.9845e-03, -4.8557e-02,  6.6883e-02],
        [-2.3139e-04,  3.3073e-01, -3.9217e-01],
        [-5.5838e-01, -4.3237e-01,  2.6791e-01]], requires_grad=True)
Parameter containing:
tensor([ 0.3674,  0.1273, -0.2346, -0.2661], requires_grad=True)

可以看到不是初始化为0的,那么直接看源码就行了:

可以看到weight是初始化为了kaiming分布,bias初始化为了均匀分布。

2.卷积核的个数如何确定?

我终于也想到了这个宝藏问题啊,https://www.zhihu.com/question/38098038

不同卷积核的个数对模型性能有什么影响呢?是要根据具体任务来调试吗?那调试的话有个大体的路子吗?

3.如果训练集和测试集分布不同怎么办?

https://zhuanlan.zhihu.com/p/72503153

https://www.zhihu.com/question/264241478/answer/280545256

https://www.zhihu.com/question/264241478

猜你喜欢

转载自www.cnblogs.com/BlueBlueSea/p/12961683.html