机器学习的具体算法（1）--数据可视化

其他 2018-08-02 05:22:49 阅读次数: 0

数据可视化

　　数据可视化是大数据领域非常倚重的一项技术，但由于业内浮躁的大环境影响，这项技术的地位渐渐有些尴尬。尤其是在诸如态势感知、威胁情报等应用中，简陋的可视化效果太丑，过于华丽的可视化效果只能忽悠忽悠外行，而给内行的感觉就是刻意为之、华而不实。
　　曾几何时，可视化技术不过是一种数据分析的手段罢了。惭愧的说就是我们的算法还不够智能，必须依靠人类的智慧介入分析。所以，需要通过可视化技术把高维空间中的数据以二维或三维的形式展示给我们这样的低维生物看，展示的效果如何也就直接决定着我们分析的难度。

从SNE到t-SNE再到LargeVis的总结

　　抛开浮躁的大环境，在数据可视化领域还是有人踏踏实实做研究的，比如深度学习大牛Hinton(SNE)、Maaten(t-SNE)还有唐建大神(LargeVis，新鲜出炉，WWW’16最佳论文提名)。
　　SNE奠定了一个非常牢靠的基础，却遗留了一个棘手的拥挤问题；
　　t-SNE用t分布巧妙的解决了拥挤问题，并采用了多种树算法改进算法效率；
　　LargeVis在t-SNE改进算法的基础上，参考了近年来较为新颖的优化技巧，如随机投影树、负采样、边采样(实质也是负采样)等，直接将训练的时间复杂度降至线性级。
　　在表示学习和深度学习如此火热的年代，任何一种经典的模型或方法都有可能在其他领域发挥不可思议的妙用。word2vec中的Skip-gram模型和负采样优化技术在LargeVis中的应用就是很好的证明。

　　值得一提的是，Maaten提出t-SNE的时间是2008年，进一步改进t-SNE的时间是2014年，唐建提出LINE和LargeVis的时间分别是2015年和2016年。从这个角度看，t-SNE还是一个非常经典的算法，毕竟傲视群雄了这么多年……不过从另一个角度看，科研之路漫漫，一项值得称道的技术或改进不是一蹴而就的，是要经过长时间积累和沉淀的。

参考资料：
http://bindog.github.io/blog/2016/06/04/from-sne-to-tsne-to-largevis/

猜你喜欢

转载自blog.csdn.net/wydbyxr/article/details/81262157

机器学习的具体算法（1）--数据可视化

机器学习-数据可视化

机器学习实战之k-近邻算法（3）---如何可视化数据

数据处理与可视化（机器学习算法原理与实践）

机器学习——python可视化实现KNN算法

杨桃的Python机器学习5——数据可视化1：散点图

用Pandas在Python中可视化机器学习数据

机器学习——数据可视化库Matplotlib

机器学习实验一数据感知及可视化

数据可视化引擎从0到1搭建学习

机器学习的调式和可视化

机器学习——可视化库Seaborn

机器学习的具体算法（2）--泛化

学习算法的可视化网站

TortoiseGit - 可视化的Git - 学习1

项目　数据可视化１

数据可视化 seaborn绘图(1)

数据可视化1（呼吸灯）

数据分析 + 可视化(1)

机器学习--Iris数据集的Fisher线性分类以及数据可视化技术的学习

机器学习之聚类算法——聚类效果评估可视化

机器学习之聚类算法——聚类效果评估可视化

决策树算法之鸢尾花特征分类可视化详解【机器学习】

算法可视化

机器学习实用指南：如何从数据可视化中发现数据规律？

机器学习数据预处理--表格合并与数据可视化

caffe学习笔记——数据可视化

Python学习（七）数据可视化

Matlab学习【5】数据可视化

Python学习之数据可视化

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)