大数据平台系统该如何选择

  大数据作为一种时髦的概念,其出现频率很高,关注度也很高。它不仅是一种数据存储技术,而且是一系列与海量数据相关的提取、集成、管理、分析和解释技术。它是通过采集、存储和分析从大容量数据挖掘价值的一种新的技术架构。

  大数据的处理过程可以分为大数据采集、存储、结构化处理、隐私保护、挖掘、结果展示(发布)等。各种领域的大数据应用一般都会涉及到这些基本过程,但不同应用可能会有所侧重。

  选择合适的大数据技术平台应当考虑以下因素:

  (1)平台的集成度

  好的平台应该具有较高的集成度,为用户提供良好的操作界面,具有完善的帮助和使用手册、系统易于配置、移植性好。同时随着目前软件开源的趋势,开源平台有助于其版本的快速升级,尽快发现其中的bug,此外,开源的架构也比较容易进行扩展,植入更多的新算法,这对于最终用户而言也是比较重要的。

  (2)平台的功能与性能

  由于不同平台侧重的功能不同,平台的性能也就有很多需要考察的方面。比如对于存储平台来说,数据的存储效率、读写效率、并发访问能力、对结构化与非结构化数据存储的支持,所提供的数据访问接口等方面就是比较重要的。对于大数据挖掘平台来说,所支持的挖掘算法、算法的封装程度、数据挖掘结果的展示能力、挖掘算法的时间和空间复杂度等,是比较重要的指标。

  什么是大数据?大数据平台系统该如何选择

  (3)是否符合技术发展趋势

  大数据技术是当前发展和研究的热点,其最终将走向逐步成熟,可以预见在这个过程中,并非所有的技术平台都能生存下来。只有符合技术发展趋势的技术平台才会被用户、被技术开发人员所接受。因此,一些不支持分布式、集群计算的平台大概只能针对较小的数据量,侧重于对挖掘算法的验证。而与云计算、物联网、人工智能联系密切的技术平台将成为主流,是技术发展趋势。

  企业选择大数据分析平台的方案,有着不同的原因,要合理的选型,既要充分的考虑搭建数据平台的目的,也要对各种方案有着充分的认识。

发布了143 篇原创文章 · 获赞 4 · 访问量 6万+

猜你喜欢

转载自blog.csdn.net/qq_30187071/article/details/105117271