数据挖掘软件 clementine软件的基本操作

在显示区里面,节点的 连接和断开鼠标的中键很有用。
F3删除该节点的所有连线。
建立缓存区的话,就会从缓冲区里面读数据,而不是从最开始的数据源。

排序、合并或汇总这样比较耗时的操作,缓存是最有用的

处理遗漏值,9页。
我毛华望QQ849886241,个人博客 http://blog.csdn.net/my_share
源就是初始化数据啦。也是第一个节点,没有数据怎么玩呢??对吧。
数据库,我也不知道是什么类型文件啦。spss文件呢?就是一些软件保持的文件啦。sav文件。
excel没有什么好说的。用户输入,固定文件。
可变文件可以输入文字等,图片不行,二进制码应该可以。比较个性化输入。


选择,就是从数据中选择哪些要用,哪些不用。
样本,就是采样,应该是连续的数据变成离散的过程吧。有些算法必须离散运算。
平衡,在里面设置条件,把哪些特别的点删除,那些孤立点可能会影响运算。
汇总,把数据求和,求方差等。
排序,升序,降序等。
合并,明白,重点是怎么合并。

这些都是对一些刚进来,或者是处理的数据进行一些段落性质的剪裁。
这里显的都是一些细节的操作,具体都有什么,得慢慢了解啦。
22页开始。

其实也算是一种输出显示啦,显示某一个字段的情况。还有一些指标类的。
这里的输出数据是可以用图像显示的,才选择这里的。


这里的输出也是输出用的,上面的是图形显示,这里的是一些报告类的输出显示。


建模这里没有什么好说的了,就是机器学习算法啦。怎么选用,需要慢慢学啦。也是最难的一块。


导出,我感觉也就没有好说的了。输出各种类型的文件,保存起来。
软件的内容没有很多,重点是对每一个部分的理解,怎么灵活运用。
整个软件的大体内容也就是这些,后面就是对一些技巧类的知识来分享啦。


猜你喜欢

转载自blog.csdn.net/my_share/article/details/50709547