Superset知识总结

Superset

安装Python环境

Superset是由Python语言编写的Web应用,要求Python3.6的环境

1、安装Miniconda

conda是一个开源的包、环境管理器,可以用于在同一个机器上安装不同Python版本的软件包及其依赖,并能够在不同的Python环境之间切换,Anaconda包括Conda、Python以及一大堆安装好的工具包,比如:numpy、pandas等,Miniconda包括Conda、Python

此处,我们不需要如此多的工具包,故选择MiniConda

1.1 下载Miniconda(Python3版本)

下载地址:https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh

1.2 安装Miniconda

#执行以下命令进行安装,并按照提示操作,直到安装完成

[root@node1 ~]$ bash Miniconda3-latest-Linux-x86_64.sh

#在安装过程中,出现以下提示时,可以指定安装路径,安装过程中要注意这个设置路径位置

在这里插入图片描述

出现以下字样,即为安装完成
在这里插入图片描述

1.3 配置环境变量

修改/etc/profile文件,内容如下

export CONDA_HOME=/usr/local/miniconda3
export PATH=$PATH:$CONDA_HOME/bin

修改保存之后:source /etc/profile

1.4 取消激活base环境

Miniconda安装完成后,每次打开终端都会激活其默认的base环境,我们可通过以下命令,禁止激活默认base环境

如果不关闭,就会自动激活base环境

conda config --set auto_activate_base false

2、创建Python3.6环境

2.1 配置conda国内镜像

conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free

conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main

conda config --set show_channel_urls yes

查看下.condarc文件,是否是如下配置
在这里插入图片描述

2.2 创建Python3.6环境

conda create -n superset python=3.6

在这里插入图片描述

说明:conda环境管理常用命令,上述的name是环境名称

创建环境:conda create -n env_name

查看所有环境:conda info --envs

删除一个环境:conda remove -n env_name --all

2.3 激活superset环境

 [root@node1 ~]# source activate
(base) [root@node1 ~]# conda activate superset

在这里插入图片描述

Superset部署

1、安装依赖

安装Superset之前,需安装以下所需依赖

(superset) [hadoop@node1 ~]$  yum install -y python-setuptools

(superset) [hadoop@node1 ~]$  yum install -y gcc gcc-c++ libffi-devel python-devel python-pip python-wheel openssl-devel 

2、安装Superset

2.1 安装(更新)setuptools和pip

pip install --upgrade setuptools pip -i https://pypi.douban.com/simple/

说明:pip是python的包管理工具,可以和centos中的yum类比
在这里插入图片描述

2.2 安装Superset

pip install apache-superset -i https://pypi.douban.com/simple/

说明:-i的作用是指定镜像,这里选择国内镜像
在这里插入图片描述

最后会打印如下日志,就表示安装成功
在这里插入图片描述

在这里插入图片描述

2.3 初始化Superset数据库

superset db upgrade

采用的数据库是sqllite数据库,是一个轻量级的数据量

注意这里可能会出现错误
在这里插入图片描述

如果出现上面问题要先下载一个dataclass

pip install dataclasses

在这里插入图片描述

还是不行,要下载dataclasses

pip install dataclasses -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com

在这里插入图片描述

再次安装 pip install dataclasses
在这里插入图片描述

最后再次执行 superset db upgrade
在这里插入图片描述

2.4 创建管理员用户

给superset创建管理员用户

export FLASK_APP=superset
flask fab create-admin

在里面可以设置用户名与密码,其他的可以不用设置,直接enter就行

(superset) [root@node1 ~]# flask fab create-admin
Username [admin]: root
User first name [admin]: root
User last name [user]: root
Email [[email protected]]: root
Password:
Repeat for confirmation:
logging was configured successfully
INFO:superset.utils.logging_configurator:logging was configured successfully
/usr/local/miniconda3/envs/superset/lib/python3.6/site-packages/flask_caching/__init__.py:202: UserWarning: Flask-Caching: CACHE_TYPE is set to null, caching is effectively disabled.
  "Flask-Caching: CACHE_TYPE is set to null, "
No PIL installation found
INFO:superset.utils.screenshots:No PIL installation found
Recognized Database Authentications.
Admin User root created.

上面我每一个都设置的root,也就是以后我们登录Web界面的时候,用户名密码都是root
在这里插入图片描述

说明:flask是一个python web框架,Superset使用的就是flask

2.5 初始化

superset init

在这里插入图片描述

3、启动Superset

3.1 安装gunicorn

pip install gunicorn -i https://pypi.douban.com/simple/

说明:gunicorn是一个Python Web Server,可以和java中的Tomcat类比

3.2 启动Superset

确保当前conda环境为superset,如下图所示
在这里插入图片描述

如果没有,需要执行:conda activate superset

启动命令

(superset) [root@node1 ~]# gunicorn -w 1 -t 120 -b node1:8787 "superset.app:create_app()"

说明

–workers:指定进程个数

–timeout:worker进程超时时间,超时会自动重启

–bind:绑定本机地址,即为Superset访问地址

–daemon:后台运行
在这里插入图片描述

3.3 登录Supersetbig

访问http://qianfeng03:8787,并使用2.4创建的管理员账号进行登录
在这里插入图片描述

3.4 停止退出进程

停止superset

停掉gunicorn进程:ps -ef | awk '/gunicorn/ && !/awk/{print $2}' | xargs kill -9

退出superset环境:conda deactivate

Superset的使用

在这里插入图片描述

1、对接MySQL数据源

1.1 安装依赖

conda install mysqlclient

说明:对接不同的数据源,需安装不同的依赖,以下地址为官网说明

官网:http://superset.apache.org/installation.html
在这里插入图片描述

1.2 重启superset

停掉gunicorn进程:

ps -ef | awk '/gunicorn/ && !/awk/{print $2}' | xargs kill -9

启动:

gunicorn -w 1 -t 120 -b node1:8787 "superset.app:create_app()"

在这里插入图片描述

2、数据源配置

2.1 Database配置

在这里插入图片描述

填写Database及SQL Alchemy URI

注:SQL Alchemy URI编写规范:mysql://账号:密码@IP/数据库名称

mysql://root:root@node1/test

在这里插入图片描述

点击Test Connection,出现“Seems Ok!”提示即表示连接成功
在这里插入图片描述

保存配置

2.2 Table配置

在这里插入图片描述

添加你的表
在这里插入图片描述

3、制作仪表盘

3.1 创建空白仪表盘

在这里插入图片描述

简单配置
在这里插入图片描述

3.2 创建图表

在这里插入图片描述

添加我们刚刚的表即可
在这里插入图片描述

你可以选择表类型
在这里插入图片描述

测试
在这里插入图片描述

4、操作数据库

在这里插入图片描述

5、配置Hive数据源(略)

安装命令

pip install pyhive -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com

pip install pyhive

暂测试不通~

你可以选择表类型

测试

4、操作数据库

5、配置Hive数据源(略)

安装命令

pip install pyhive -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com

pip install pyhive

猜你喜欢

转载自blog.csdn.net/weixin_45682261/article/details/125118870