[改善深度神经网络] Hyperparameter tuning, Batch Normalization, Programming Frameworks习题解

这是[改善深度神经网络]课程第三周的习题,一共10道。

image

解答:

这个在课程的开始就讲到了,应该随机选取超参数的值。

答案是False

image

解答:

超参数的重要程度并不相同,比如学习率通常具有较高的重要程度。

所以答案是False

image

解答:

同时训练多个模型需要更高的算力,否则还是调优一个模型。

答案选项3

image

解答:

beta的选择最好是非线性,可以排除1和2,选项3如果r=0, beta=-9,如果r=0, beta=0,错误取值。

所以选选项2

image

解答:

超参数很难一次就选择对,通常是在不断迭代中找到最优。

答案False

image

解答:

虽然学术上对a[l]还是z[l]正规化还存在争论,但在本课程中推荐z[l]。

答案是选项2

image

解答:

加入一个很小的epsilon是为了避免除以0。

答案选项1

image

解答:

beta和r和权重一样,可以通过递归学习而来,而且不同层的beta和r并不同,也不存在一个固定的优化值。

答案为选项2、3

image

解答:

在测试阶段,没有足够的数据进行批量正规化,应该选取一个预估值,这个预估值通常根据训练阶段的值进行计算。

答案选项4

image

解答:

采用深度学习框架,可以减少编码量,但并不一定需要云主机来运行。

答案为选项1、2。

相关习题解析:

  1. [改善深度神经网络] Practical aspects of deep learning习题解析
  2. [改善深度神经网络] Optimization algorithms习题解析

image

猜你喜欢

转载自blog.csdn.net/mogoweb/article/details/80573860