多模态数据治理-DeepSeek加速AI落地

一、什么是多模态数据治理

多模态数据治理指对多种数据结构的数据进行有效管理、存储、处理、分析和应用的过程。多模态数据主要包括文本、图片、视频、音频等类型的数据。多模态数据治理的目的是让不同类型的数据能够互相融合,形成新的内容供使用。我们可以把这个过程理解为是一个新内容创作和生成的过程。

二、为什么多模态数据治理成为一种趋势

是传统数据治理失灵了吗?还是时代发展的必然?

随着移动互联、物联网等设备的使用,数据类型和来源越来越丰富,全球近80%的数据为非结构化数据,而传统的数据治理模式无法有效处理这些多源异构的数据;随着人工智能技术的发展,传统数据治理模式也不断更新,融合了更多AI技术,处理异构多来源数据,在垂直领域也表现出了一定的优势,比如文本处理、图片处理;大模型技术的演进为多模态数据治理提供了更强大的工具支撑,不仅是工具本身,甚至在算法层面、理论研究,为数据治理注入新的活力。

数据治理本身作为一门不断发展迭代的技术,自2018年DAMA-DMBOK 2发布至今,其理论体系也不断完善,不仅融合了数智化的工具以及技术,同时也在向着数据要素价值释放的方向在探索。多模态数据治理更像是对传统数据治理理论的补充和完善。

三、多模态数据治理三步法

(1)先准备:数据准备

数据准备阶段完成数据收集、存储以及预处理。详细看<

猜你喜欢

转载自blog.csdn.net/atbigapp/article/details/146502661
今日推荐