习题
* 1.1 表 1.1 中若只包含编号为 1 和 4 的两个样例, 试给出相应的版本空间.
这应该不难理解吧,直接上表格.
编号 | 色泽 | 根蒂 | 敲声 | 好瓜 |
---|---|---|---|---|
1 | 青绿 | 蜷缩 | 浊响 | 是 |
4 | 乌黑 | 稍蜷 | 沉闷 | 否 |
* 1.2 与使用单个合取式来进行假设表示相比, 使用 "析合范式" 将使得假设空间具有更强的表示能力. 例如\[好瓜 \leftrightarrow ((色泽=*)\wedge(根蒂=蜷缩)\wedge(敲声=*))\vee((色泽=乌黑)\wedge(根蒂=*)\wedge(敲声=沉闷))\]会把 "\((色泽=*)\wedge(根蒂=蜷缩)\wedge(敲声=*)\)" 以及 "\((色泽=乌黑)\wedge(根蒂=*)\wedge(敲声=沉闷)\)" 都分类为 "好瓜" . 若使用最多包含 \(k\) 个合取式的析合范式来表达 1.1 西瓜分类问题的假设空间, 试估算共有多少种可能的假设.
一共有 \(3\) 个特征, 每个特征有 \(2\) 种取值, 算上 \(*\) (任意) 有 \(3\) 种取值.
每个合取式我们分为三项:色泽, 根蒂, 敲声.这里要注意某个项其实是可以同时选择两种取值的, 比如色泽这一项可以是 \(((色泽=青绿)\wedge(色泽=乌黑))\) 而不是只能有一个取值.
那么每项只可能选择一个或两个取值, 取值是一个时有 \(3\) 种可能, 取值为两种时只有 \(1\) 种可能(即除了 \(*\) 外的另两种一起取到), 所以每项其实有四种可能, 那么就有 \(4\times4\times4=64\) 种合取式, 因此 \(k_{max}=64\).
所以可能的假设总数为 \(\sum^{64}_{i=1}C_{64}^i\) , 即任意取 \(1\sim64\)个合取式然后组合成的析合范式的数量.
*1.3 若数据包含噪声,