《机器学习》西瓜书习题 第1章

习题

* 1.1  表 1.1 中若只包含编号为 1 和 4 的两个样例, 试给出相应的版本空间.

  这应该不难理解吧,直接上表格.

编号 色泽 根蒂 敲声 好瓜
1 青绿 蜷缩 浊响
4 乌黑 稍蜷 沉闷

* 1.2 与使用单个合取式来进行假设表示相比, 使用 "析合范式" 将使得假设空间具有更强的表示能力. 例如\[好瓜 \leftrightarrow ((色泽=*)\wedge(根蒂=蜷缩)\wedge(敲声=*))\vee((色泽=乌黑)\wedge(根蒂=*)\wedge(敲声=沉闷))\]会把 "\((色泽=*)\wedge(根蒂=蜷缩)\wedge(敲声=*)\)" 以及 "\((色泽=乌黑)\wedge(根蒂=*)\wedge(敲声=沉闷)\)" 都分类为 "好瓜" . 若使用最多包含 \(k\) 个合取式的析合范式来表达 1.1 西瓜分类问题的假设空间, 试估算共有多少种可能的假设.

  一共有 \(3\) 个特征, 每个特征有 \(2\) 种取值, 算上 \(*\) (任意) 有 \(3\) 种取值.
  每个合取式我们分为三项:色泽, 根蒂, 敲声.这里要注意某个项其实是可以同时选择两种取值的, 比如色泽这一项可以是 \(((色泽=青绿)\wedge(色泽=乌黑))\) 而不是只能有一个取值.
  那么每项只可能选择一个或两个取值, 取值是一个时有 \(3\) 种可能, 取值为两种时只有 \(1\) 种可能(即除了 \(*\) 外的另两种一起取到), 所以每项其实有四种可能, 那么就有 \(4\times4\times4=64\) 种合取式, 因此 \(k_{max}=64\).
  所以可能的假设总数为 \(\sum^{64}_{i=1}C_{64}^i\) , 即任意取 \(1\sim64\)个合取式然后组合成的析合范式的数量.


*1.3 若数据包含噪声,

猜你喜欢

转载自www.cnblogs.com/cloud--/p/12078171.html
今日推荐