强化学习精要第一二章

1、np.dot的用法,用于向量的时候是点积,用于矩阵的时候是矩阵的乘法,一个向量只有一行的时候,它的shape是(列数, )

2、matplot画图,更改图中的字体,

mpl.rcParams['font.sans-serif'] = ['WenQuanYi Micro Hei'] #指定默认字体WenQuanYi Micro Hei中文,DejaVu Sans英文

https://www.jianshu.com/p/240ea3ae0dc9(查看字体、负号的问题)

如果有多条直线,一般用不同的linespace表示,‘--’、‘:’

3、np.log2:以对数为底

np.meshgrid(x,y):坐标矩阵

4、KL散度的性质:非负,两个分布越接近,散度越小,分布越远,散度越大

5、损失函数有两种:平方损失函数和交叉熵损失函数,回归问题损失函数是平方损失函数,分类问题损失函数是交叉熵损失函数

 

猜你喜欢

转载自www.cnblogs.com/lin-kid/p/11511491.html