专业知识单选题练习系列（七）

1、 [单选] 关于策略梯度的方法说法正确的是（）。

A：只适用于离散动作空间

B：适用于连续动作空间

C：策略梯度的方法与 DQN 中的目标函数一致

D：策略梯度的方法通过 Q 值挑选动作

正确答案：B

解析：策略梯度方法适用于连续动作空间，因为它不需要像值函数方法那样计算每个动作的值，而是直接通过梯度上升来更新策略网络，从而产生连续动作的输出。选项 A 错误，因为策略梯度方法适用于连续动作空间。选项 C 错误，因为策略梯度方法与 DQN 中的目标函数不一致。选项 D 错误，因为策略梯度方法不是通过 Q 值来挑选动作的。因此，正确答案为 B。

2、 [单选] 线性回归的基本假设不包括哪个？

A：随机误差项是一个期望值为 0 的随机变量

B：对于解释变量的所有观测值，随机误差项有相同的方差

C：随机误差项彼此相关

D：解释变量是确定性变量不是随机变量，与随机误差项之间相互独立

正确答案：C

解析：线性回归的基本假设包括：1.线性关系；2.随机误差项是一个期望值为 0 的随机变量；3.对于解释变量的所

猜你喜欢

目录

热门文章