吴恩达-coursera-机器学习测试题第十三章-聚类

解析:K均值算法只能将数据分类开,并不能具体分成哪些类,所以诸如垃圾软件、晴天雨天都是无法分出的,将文章主题划分成几类,还能将网站用户划分几类,故选择AD

集的算法,就被称为聚类算法 

 

 解析:应该是x(i)与u(i)距离最短的点所以选择D才对,因为u3离x(i)最近

u1,u2,u3与x(i)距离最短的事u1,c(i)存储于第i个实例最近的聚类中心的索引,故为1

 K-means是一种迭代算法,以下两个步骤在其内部循环中重复执行。 聚类单元步骤就是c(i)被更新。聚类中心步骤就是uk被更新,所以选择AC。uk的更新不是等于靠x(i)最近的,uk只能说代表与x(i)最近的聚类中心点,而运行K-均值算法的之前,我们需要首先初始化所有的聚类中心点

解析:问如何选取最佳的聚类参数,当然是代价函数最小的那个,选择B。

解析:A并不是类数越多越好,失去了意义,错误。B 是准确的,需要人为来设定 C如果我们担心K均值落到局部最小,可是多试几次随机初始化,正确。有事很难将数据划分成明确的几类,很难决策类数,正确。 D没有提到过这类方法,错误。

猜你喜欢

转载自blog.csdn.net/weixin_40807247/article/details/81504254