【Druid】(九)E-MapReduce Druid 集群集成 Superset(数据探查与可视化平台 )

一、前言

E-MapReduce Druid集群集成了Superset工具。Superset对E-MapReduce Druid做了深度集成,同时也支持多种关系型数据库。由于E-MapReduce Druid也支持SQL,所以可以通过Superset以两种方式访问E-MapReduce Druid,即Apache Druid原生查询语言或者SQL。

二、什么是 Apache Superset?

Superset 是 Airbnb (知名在线房屋短租公司)开源的数据探查与可视化平台(曾用名 Panoramix、Caravel ),该工具在可视化、易用性和交互性上非常有特色,用户可以轻松对数据进行可视化分析。Superset 也是一款企业级商业智能 Web 应用程序。

Superset 已捐赠给 Apache 软件基金会,目前处于孵化阶段。

在这里插入图片描述

在这里插入图片描述
核心功能:

  • 快速创建数据可视化互动仪表盘

  • 丰富的可视化图表模板,灵活可扩展

  • 细粒度高可扩展性的安全访问模型,支持主要的认证供应商(数据库、OpenID、LDAP、OAuth 等)

  • 简洁的语义层,可以控制数据资源在 UI 的展现方式

  • 与 Druid 深度集成,可以快速解析大规模数据集

三、前提条件

Superset默认安装在emr-header-1节点,目前还不支持HA。在使用该工具前,确保您的主机能够正常访问emr-header-1,具体步骤请参见使用SSH连接主节点

四、使用Superset

  1. 登录Superset。

在浏览器地址栏中输入http://emr-header-1:18088,按回车,打开Superset登录界面,默认用户名和密码均为admin,请您登录后及时修改密码。

在这里插入图片描述

  1. 添加E-MapReduce Druid集群。

登录后默认为英文界面,可单击右上角的国旗图标选择合适的语言。接下来在上方菜单栏中依次选择数据源 > Druid 集群来添加一个E-MapReduce Druid集群。

在这里插入图片描述

配置好协调机(Coordinator)和代理机(Broker)的地址,注意E-MapReduce中默认端口均为相应的开源端口前加数字1,例如开源Broker 端口为8082,E-MapReduce中为18082。

在这里插入图片描述

  1. 刷新或者添加新数据源。

添加好E-MapReduce Druid集群之后,您可以单击数据源 > 扫描新的数据源,这时E-MapReduce Druid集群上的数据源(datasource)就可以自动被加载进来。

您也可以在界面上单击数据源 > Druid 数据源自定义新的数据源(其操作等同于写一个data source ingestion的json文件),步骤如下。

在这里插入图片描述
自定义数据源时需要填写必要的信息,然后保存。

在这里插入图片描述
保存之后单击左侧set,编辑该数据源,填写相应的维度列与指标列等信息。

在这里插入图片描述
4. 查询E-MapReduce Druid。

数据源添加成功后,单击数据源名称,进入查询页面进行查询。

在这里插入图片描述

  1. (可选)将E-MapReduce Druid作为E-MapReduce Druid数据库使用。

Superset提供了SQLAlchemy以多种方言支持各种各样的数据库,其支持的数据库类型如下表所示。、

在这里插入图片描述

Superset亦支持该方式访问E-MapReduce Druid,E-MapReduce Druid对应的 SQLAlchemy URI为druid://emr-header-1:18082/druid/v2/sql,如下图所示,将E-MapReduce Druid作为一个数据库添加。

在这里插入图片描述

接下来就可以在SQL工具箱里用SQL进行查询了。

猜你喜欢

转载自blog.csdn.net/BeiisBei/article/details/107835094