論文エッセイ | スパースイジングマシンを使用した深いボルツマンネットワークの訓練

オープンソースの中国コミュニティチームは、共有の名のもとに、オープンソースの中国コミュニティの背後にあるストーリーを伝える初のライブブロードキャストを行いました。」

共有者: Zeng Qingguo ｜学校名: 南方科技大学

簡単な紹介

ムーアの法則の減速により、組み合わせ最適化問題を解決するために特別に設計されたカスタマイズされたイジングマシンなど、非伝統的なコンピューティングパラダイムの開発が促進されました。このセッションでは、確率論と古典の混合コンピューティング環境で、スパース、非同期、高度に並列化されたイジングマシンを使用してディープボルツマンネットワークをトレーニングする、ディープ生成ニューラルネットワークをトレーニングするための P ビットベースのイジングマシンの新しいアプリケーションを紹介します。

関連論文

标题：スパース・イジング・マシンによるディープ・ボルツマン・ネットワークのトレーニング
作宇：**Shaila Niazi、Navid Anjum Aadit、Masoud Mohseni、Shuvro Chowdhury、Yao Qin、Kerem Y. Camsari

記事の目的

目標:特殊なハードウェアシステム (P ビットなど) を使用して、ディープボルツマンネットワークのスパースバージョンを効率的にトレーニングする方法を実証します。これにより、計算上のハード確率サンプリングタスクで一般的に使用されるソフトウェア実装よりも大幅に高速化されます。

長期的な目標:物理学にインスピレーションを得た確率的ハードウェアの開発を促進し、グラフィックスおよびテンソルプロセッシングユニット (GPU/TPU) に基づく従来のディープラーニングの急速に増大するコストを削減します。

ハードウェア実装の難しさ:
1. 接続された p ビットはシリアルに更新する必要があり、高密度システムでは更新が禁止されます。
2. 更新する前に、p ビットが隣接ノードからすべての最新情報を受信していることを確認します。そうしないと、ネットワークが停止します。真のボルツマン分布からのサンプリング。

メインコンテンツ

スパースイジングマシンを用いたディープボルツマンネットワークの学習内容は主に4つのパートに分かれています:
1. ネットワーク構造
2. 目的関数
3. パラメータの最適化
4. 推論（分類と画像生成）

1. ネットワーク構造
D-Wave によって開発された Pegasus および Zepyhr トポロジは、ハードウェア対応のスパースディープネットワークをトレーニングするために使用されます。この操作は、人間の脳や高度なマイクロプロセッサなど、拡張されているが接続に制約のあるネットワークからインスピレーションを得ています。機械学習モデルでは完全な接続性が遍在的に使用されているにもかかわらず、高度なマイクロプロセッサと数十億のトランジスタネットワークを備えた人間の脳は、両方ともかなりの程度の疎性を示しています。実際、RBM のほとんどのハードウェア実装は、各ノードに必要な高い計算責任によりスケーリングの問題に直面していますが、ハードウェアニューラルネットワークの疎な接続には利点が見られることがよくあります。さらに、疎なネットワーク構造は、前述のハードウェア実装の問題をうまく解決します。

(画像ソース: arXiv:2303.10728)

2. 目的関数
尤度関数を最大化することは、データ分布とモデル分布の間の KL 発散を最小化することと同じです。

その中にはデータ分布とモデル分布があります。

モデルパラメータに対する KL 発散の勾配 ( ) は次のとおりです。

3. パラメータの最適化

(画像ソース: arXiv:2303.10728)

アルゴリズム 1 に従ってネットワークパラメーターをトレーニングします。

初期化パラメータ ( 、 )の初期化。
トレーニングデータを使用して入力層 p ビットに値を割り当て、MC サンプリングを実行してデータ分布のサンプリングサンプルを取得します。
MC サンプリングを直接実行して、モデル分布のサンプリングサンプルを取得します。
勾配 (持続的コントラスト発散と呼ばれる) は 2 段階でサンプリングされたサンプルを使用して推定され、パラメーターは勾配降下法を使用して更新されます。

その中で、MC サンプリングは p ビットの反復進化を使用します。

スパースボルツマンネットワークを学習させるプロセスでは、次の 2 つの点に注意する必要があります。

1) ランダム化された p ビットインデックス
特定の疎ネットワーク上でボルツマンネットワークモデルをトレーニングする場合、可視ノード、非表示ノード、およびラベルノード間のグラフの距離は非常に重要な概念です。通常、層が完全に接続されている場合、特定の 2 つのノード間のグラフの距離は一定ですが、スパースグラフの場合はそうではないため、表示される p ビット、非表示の p ビット、およびラベルの p ビットの位置が非常に重要になります。可視、非表示、およびラベルの p ビットがクラスター化され、近すぎる場合、分類の精度が大きく影響されます。これは、ラベルビットと可視ビットの間のグラフィック距離が大きすぎると、それらの間の相関が弱くなるためであると考えられます。 p ビットインデックスをランダム化すると、この問題を軽減できます。
(画像ソース: arXiv:2303.10728)

**2）大规模并行**  
在稀疏深度玻尔兹曼网络上，我们使用启发式图着色算法DSatur对图着色，对于未连接p-bits进行并行更新。

(画像ソース: arXiv:2303.10728)

4. 推論

分類:テストデータを使用して可視 p ビットを修正し、MC サンプリングを実行して、取得したラベル p ビットの期待値を取得し、最大の期待値を持つラベルを予測ラベルとして取得します。

(画像ソース: arXiv:2303.10728)

画像生成:生成するラベルに対応するエンコーディングにラベル p ビットを固定し、MC サンプリングを実行し、サンプリングプロセス中にネットワークをアニーリングします (0.125 ステップで 0 から 5 まで徐々に増加します)。サンプルはに対応します。目に見える p ビットは、生成されたイメージです。

(画像ソース: arXiv:2303.10728)

要約する

この記事では、超並列アーキテクチャを備えたスパースイジングマシンを使用しており、従来の CPU よりも桁違いに速いサンプリング速度を実現しています。この論文では、ハードウェア対応ネットワークトポロジの混合時間を体系的に研究し、モデルの分類精度がアルゴリズムの計算操作性によって制限されるのではなく、この研究で使用できた適度なサイズの FPGA によって制限されることを示しています。さらなる改善には、超高速の確率的サンプラーを最大限に活用する、より深く、より広範囲で、場合によっては「混合が難しい」ネットワークアーキテクチャの使用が含まれる可能性があります。さらに、従来の DBM のレイヤーごとのトレーニングテクノロジとこの記事の方法を組み合わせることで、さらなる改善がもたらされる可能性があります。ランダム磁気トンネル接合などのナノスケールデバイスを使用したスパースイジングマシンの実装は、深いボルツマンネットワークの実用化の現状を変える可能性があります。

論文エッセイ | スパース イジング マシンを使用した深いボルツマン ネットワークの訓練

おすすめ

論文エッセイ | スパースイジングマシンを使用した深いボルツマンネットワークの訓練