第二本书出版啦!



        这是目前唯一一本介绍HAWQ技术的中文书。涵盖HAWQ技术解析、其上的数仓架构及实现、简单数据挖掘三部分,内容较为全面,每部分均有详细配置说明及示例代码。用不打折扣的SQL教据库玩转大数据,无论是学习、开发,还是部署、运行,HAWQ是你的效率之选!

        我体验的HAWQ五大特点:

  • 依赖少:只需要HDFS一种Hadoop基础服务作为底层存储(相比Kylin)。
  • 性能高:比Hive快一个数量级以上,而且不需要预先建立cube(相比其它)。
  • 兼容全:全面兼容SQL标准,涵盖所有常用窗口、分析、聚合函数(相比Impala)。
  • 可编程:能在Hadoop上编写SQL UDF(相比其它)。
  • 易挖掘:原生支持MADlib,仅用SQL查询就能进行简单的数据挖掘与机器学习(相比其它)。
        四点建议,前三点是我了解用户提的比较多的,最后一个是当前热点技术。
  • 实现行级更新(update/delete)、索引、with recursive、pivot等基本功能;
  • 增强外部表的支持(如外部分区表等),提高外部表性能;
  • 提高除HDP外其它Hadoop发行版本的支持与普适度;
  • 增强机器学习库(MADlib)。
        这些优缺点在书中均以实例进行论述。感谢CSDN的blog平台!感谢偶数科技的常雷博士所作推荐序!

猜你喜欢

转载自blog.csdn.net/wzy0623/article/details/79711827