前モデルデータに:
- 訓練するために使用されるトレーニングセット(トレーニングデータ)--------------------、構築したモデル
- 検証セット(検証データ)試験モデルのトレーニング段階で使用------------------品質モデル
- その後、テストセット(テストデータ)---------------------モデルのトレーニングと他の良い後、モデルの品質を評価するテストセット
機械学習のトレーニング方法
- 教師付き学習:ラベル付きトレーニングデータセット
- 教師なし学習:クラスタリングなど非標識データセット
- 半教師付き学習:学習は学習と教師なし学習モードの組み合わせを監修。ラベルやタグで少量のデータを解決するには、問題の訓練と分類の多くではありません
一般的なアプリケーション
- リターン (過去のデータに基づいて将来のトレンドデータ)
- 分類 (画像認識、スパム分類、テキスト分類)分類基本的にタグ付けされた教師付き学習
- クラスタ (クラスタ無しラベル分類されていない)、類似の特性をクラスに分類します
回帰:予測データが連続している値(レート)
カテゴリー:データのカテゴリー予測データ、およびカテゴリが知られている(つまり、クラスAクラスBではありません)
クラスタリング:予測データカテゴリデータを、未知のカテゴリ、タグ無し