機械学習モデルのライフサイクル

小さな手を動かして大金を稼いで、親指を立ててください!

代替

モデルはどのように変わりますか? 出典[1]

誕生

これらのデジタル ツールは、モデルを構築、トレーニング、適合、または推定するときに生まれます。この段階は、分析の目的、データ、コンピューター、アルゴリズム、およびデータ サイエンティストがこれまでによく知っているその他すべてのものを準備することから始まります。他のどのようなツールを収集する場合でも、最終的なモデルが意味を成し、特定のニーズを満たすように、分析または科学の目標を決して見失わないでください。あなたのモデルはいつ生まれましたか?ツールのライフサイクルは、トレーニングを完了し、雇用/展開のために保存したときに始まります。

代替

この新生児にはどんな未来があるのでしょうか?これは分析の目的によって変わってくるので、構築する際にはこの部分を忘れてはいけません。このモデルは、他の多くのオプションの中でも特に、予測タスク、指標の解釈、または仮定のシナリオのシミュレーションに役立ちます。このツールは特定の目的で使用されます。それは、単純で迅速なものである場合もあれば、複雑で時間のかかる長期にわたるものである場合もあります。この使用法により、モデルの残りの寿命が決まります。モデルがパラメーターの 1 回限りの解釈に使用される場合、残された寿命は長くありません。しかし、モデルが予測に使用され、オンライン データ収集システムに役立つことを目的としている場合、この新生児の命は目の前にあります。次は何ですか

維持

モデルの使用を続けると、モデルのトレーニングをサポートするデータ条件が変化し始めます。変化のタイミングでモデルも変化を始めます。トレーニング時に予測精度の高いチャーン予測モデルを構築すれば、近い将来または遠い将来、予測対象となる顧客の状況や行動が変化し始めます。この変動は、学習済みモデルの予測パフォーマンスに課題をもたらします。これらの変更が発生すると、モデルはメンテナンスと呼ばれる新しいフェーズに入ります。

メンテナンス段階では、新しいデータが必要になる場合があります。これを使用して、モデルの仕様を更新できます。それは、機械が正常に動作しないときに別の機械 (車など) を取り出して部品を調整するのと何ら変わりません。モデルのメンテナンスを実行するための戦略やソリューションについては詳しく説明しませんが、一般に、モデルを満足のいくパフォーマンスに戻すには、モデルのチューニング プロセスを行う必要があります。

代替

機械学習モデルの維持は、モデルの再トレーニングとまったく同じではありません。一部のモデルは非常に単純であるため、新しいデータでの再トレーニングも同様に簡単です。これは、層やニューロンが少ない線形アーキテクチャまたはネットワークの場合に当てはまります。しかし、モデルが非常に複雑で、大規模かつ奥深いアーキテクチャを備えている場合、メンテナンス フェーズは、モデルの再トレーニングにかかる​​コストよりもはるかに単純である必要があります。このツールは非常に強力ですが、長期的には維持費がかかるため、これは今日の機械学習において最も重要なトピックの 1 つです。

モデルを調整または更新すると、モデルを再び使用できるようになるため、モデルが提供するプロセスは更新されたバージョンを引き続き使用できます。当社の機械は引き続き使用できます。それにしてもマシンが変わったな。それは使用され、消費され、元の状態とは少し異なるものに変化しています。鉛筆と同じように、モデルも使い続けることができるように保護するために先端を研ぐ必要がある時期が来ます。

移行する

機械学習の道では、出口、つまり乗り換えが必要になる場合があります。私はかつて素晴らしいアイスランドを訪れたことがありますが、そのとき、誰かが車のタイヤを交換し、凍結した道路を運転しているのを初めて見ました。そして街に戻ったら純正タイヤに戻しました。この概念は、アイスランドでの車のタイヤの変換を思い出しながら転移学習に取り組み始めたときに非常に明確になりました。新しい環境/ドメインが登場すると、モデルは転送と呼ばれる新しいフェーズに入ります。

代替

別の車を購入しなくても、タイヤを交換することで同じ車をさまざまな地形に適応させることができるのと同じように、新しいモデルを構築しなくても、モデルの一部を追加または微調整して、新しい領域で新しい目的を果たすことができます。転移学習は、新しい環境でモデルをトレーニングするタスクを簡素化するためにモデル調整を最適化することを目的とした機械学習文献の研究のもう 1 つのサブ分野です。よくある例は画像認識モデルです。特定のクラスの画像を使用してそれらをトレーニングし、他の人がこれらのモデルを転送して新しいクラスの画像を認識します。現在、多くの企業が RegNet、VGG、Inception、AlexNet などのモデルを使用してニーズに合わせて調整しています。

モデルを転送すると、ある意味、元のモデルとは別に独自のライフサイクルを持つ新しいモデルが誕生します。純正モデルと同様にメンテナンスが必要となります。これにより、最初のエンティティを持つことから、潜在的にモデルのセット全体を作成できるようになりました。これらのデジタルツールの背後には確かにライフサイクルがあることに疑いの余地はありません。

代替

私たちのモデルは死んでしまうのでしょうか?

簡単に言うと、「はい」です。たとえば、分析パフォーマンスが体系的に達成できない場合、または元のモデルが過去のものになるほど大規模かつ多様化した場合、それらは実際に存在しなくなる可能性があります。冒頭で述べたように、石、鉛筆、車はすべて、ある時点で存在しなくなります。この点では、モデルもこれらのものと変わりません。

モデルは消滅するかもしれませんが、いつこの時点に到達したのかという疑問に対する答えは、今日に至るまで、機械学習研究コミュニティで私たちが答えを求めている最大の疑問です。機械学習とモデルのメンテナンスのパフォーマンスの監視に関する開発の多くは、モデルがいつ機能しなくなるかという問題に関連しています。

この答えが自明ではない理由の 1 つは、パフォーマンスの満足度を定量化するためのラベルが常に必要であるためです。しかし、機械学習と統計学習の最大のパラドックスは、ラベルが利用できないことです。ラベルを予測するためにこれらのツールを構築します。もう 1 つの理由は、パフォーマンスの変化に対する許容限界の定義が非常に主観的になる可能性があることです。科学者はある程度の制限を設けることができますが、企業は異なる許容範囲を持っている可能性があります。

データ サイエンティストがこの質問に答える際に考慮できるいくつかのポイントを次に示します (現在オープン中)。

  • トレーニングデータは古いですか? (「時代遅れすぎる」とは何ですか)
  • 現在のバージョンはモデルの元のバージョンとどの程度似ていますか? (「似ている」とは何ですか?)
  • 入力特徴の変動性とターゲット変数との関係は完全にドリフトしていますか? (共変量と概念ドリフト、機械学習メンテナンス研究における 2 つの最大のトピック)。
  • モデルをデプロイするための物理プロセスはまだ使用されていますか? 物理インフラストラクチャがモデルの展開をサポートできなくなった場合、これは間違いなくモデルのライフサイクルの終わりを示します。

モデルとして生きなくなったことは必ずしもネガティブなことではなく、むしろ彼らにとっては進化の道のようなものです。物理システムとデジタル システムを最新の状態に保ち、満足のいくパフォーマンスを維持するには、そのライフ サイクルを理解する必要があります。

参照

[1]

ソース:https://towardsdatascience.com/the-lifetime-of-a-machine-learning-model-392e1fadf84a

この記事はmdniceマルチプラットフォームによって公開されています

おすすめ

転載: blog.csdn.net/swindler_ice/article/details/130958635