hive的总结

hive的一些总结

   什么是hive:

    可以将结构化的数据文件映射为一张数据库表,并提供类 SQL 查询功能。

    本质:将SQL转换为 MapReduce 程序。

    主要用途:用来做离线数据分析,比直接用MapReduce 开发效率更高。

  为什么使用Hive:

    直接使用 Hadoop MapReduce 处理数据所面临的问题:

      人员学习成本太高

      MapReduce 实现复杂查询逻辑开发难度太大

  使用Hive:   

    操作接口采用类 SQL 语法,提供快速开发的能力

    避免了去写 MapReduce ,减少开发人员的学习成本

    功能扩展很方便

  Hive 架构图

猜你喜欢

转载自www.cnblogs.com/fjdsj/p/10105612.html