1. Apache Zeppelin の概要
Apache Zeppelin は、データ エンジニアや科学者が Scala、Python、SQL、R などのさまざまな言語やツールを通じて対話できるブラウザベースのインターフェイスを提供する、オープンソースの Web ノートブック型対話型データ分析ツールです。便利な方法でデータを共有します。インタプリタ プラグイン アーキテクチャを通じてさまざまなデータ処理システム (Apache Spark、Flink、Hive など) と統合され、ユーザーがさまざまなデータ処理エンジンを簡単に使用したり切り替えたりできるようになります。
その主な機能は次のとおりです。
1. ノートブック インターフェイス: インタラクティブな Web インターフェイスを提供し、ユーザーはコードを簡単に作成して実行し、結果を表示し、データを視覚化し、ノートブックを簡単に管理および共有できます。
2. 多言語サポート: Zeppelin は Scala、Python、R、SQL などの複数の言語をサポートしているため、ユーザーはタスクに最適なプログラミング言語を選択できます。
3. インタプリタ プラグイン システム: Zeppelin は、インタプリタ プラグインを通じて、Apache Spark、Flink、Hive などのさまざまなデータ処理エンジンをサポートします。ユーザーは、ニーズに応じてさまざまなインタープリターをインストールできます。
4. データ視覚化: 一連の組み込みデータ視覚化ツールを使用すると、データを他のプラットフォームにエクスポートせずに、ヒストグラム、円グラフ、折れ線グラフ、表などのさまざまなグラフを生成できます。
5. リアルタイムのコラボレーションと共有: 複数人によるリアルタイムのコラボレーションとノートブックの共有をサポートし、チーム メンバー間のコミュニケーションと分析結果の共有を促進します。6. セキュリティ: ユーザーと役割に基づいたアクセス制御システムを提供し、ノートブックとインタープリターへのアクセスを制限してデータのセキュリティを確保します。
一般に、Apache Zeppelin は強力な対話型データ分析ツールであり、データ探索、モデル開発、視覚化と共有などのシナリオに適しており、データ エンジニアや科学者に柔軟で効率的な分析プラットフォームを提供します。
ps:公式サイトでも紹介が見られます:ツェッペリン
2. クイックインストール (Docker ベース)
docker run -d --name zeppelin0.9 -p 8888:8080 apache/zeppelin:0.10.1
3、使用する
インストールが完了したら、次のページに入ります: localhost:8888
インタープリターの構成
1.mysqlに接続するためのjdbc設定
2. 新しいノートブックを作成し、jdbc インタープリターを選択し、SQL を実行してデータベース内のデータをクエリします。
Zeppelin はいくつかの概念を説明します。
インタプリタ: エグゼキュータ、コード実行エグゼキュータ (jdbc、spark、python、シェル、マークダウンなど)。
ノート: ページとして理解できます
段落: 何を実行するか
1 つのノートブックの下に複数の段落を含めることができます (以下のスクリーンショットに示すように、1 つのノートブックには 2 つの段落があります)。