機械学習の基礎の「概要」

1. 機械学習と人工知能、ディープラーニング
1. 機械学習は人工知能を実現する手法
2. ディープラーニングは機械学習から発展した手法

2. 統計学習と機械学習
実際の機械学習は 1980 年代に登場し、統計に携わる人々

機械学習には人工ニューラルネットワークと呼ばれる手法があり、これがディープラーニングとして発展しました。

3. 機械学習とディープラーニングで何ができるのか
機械学習の応用シナリオは数多くあり、さまざまな業界に浸透していると言えます。医療、航空、教育、物流、電子商取引などの分野でのさまざまなシーン

機械学習分野:
1. 従来の予測
2. 画像認識
3. 自然言語処理

マイニングおよび予測分野で使用:
アプリケーションシナリオ: 店舗売上予測、定量的投資、広告推奨、法人顧客分類、SQL ステートメントセキュリティ検出分類...

画像分野での使用:
アプリケーションシナリオ: 道路標識検出、顔認識など。

自然言語処理の分野で使用:
アプリケーション シナリオ: テキスト分類、感情分析、自動チャット、テキスト検出など。

4. 機械学習とは
1. 定義
機械学習とは、データを自動的に分析してモデルを取得し、そのモデルを使用して未知のデータを予測することです。

2. 解説
私たち人間は、日々の膨大な経験からルールを要約し、新たな問題に直面したとき、過去に要約したルールを用いて現状を分析し、最適な戦略を講じることができます。

犬猫識別:
データ(大量の犬猫写真)からモデル(犬猫識別ルール)を自動解析して取得し、機械が犬猫を識別できるようにします。

住宅価格の予測:
データ(住宅に関するさまざまな情報)から自動的に分析してモデル(住宅価格の法則性を判断)を取得し、住宅価格を予測する機能を備えています。

考慮すべき質問:
履歴データからパターンを取得します。これらの履歴データの形式は何ですか?

3. データセット
構成:特徴量+目標値

注:
データの各行をサンプルと呼ぶことができますが、
一部のデータ セットにはターゲット値がない場合があります。

5. 機械学習アルゴリズムの分類
1. 猫と犬の見分け方
特徴量:猫/犬の写真
目標値:猫/犬 - カテゴリ
  は分類問題です

2. 住宅価格を予測する
特徴量:住宅の各種属性情報
目標値:住宅価格連続データ
  は回帰問題である。

3. 職業の特定
特徴量:キャラクターの各種属性情報
目標値:なし
  教師なし学習

4. 分類
目標値:カテゴリ - 分類問題
目標値:連続データ - 回帰問題
目標値:なし - 教師なし学習
分類はロジスティック回帰、予測は線形回帰

5. 小さな運動:
明日の気温を予測しますか? 回帰
明日は曇り、晴れ、雨のいずれになるかを予測しますか? 分類
顔年齢の予測?特定の年齢: 回帰問題; 判断サイズ: 分類問題
顔認識? 分類

6. 教師あり学習(予測)
定義:入力データは入力特徴量と目標値で構成されます。関数の出力は連続値 (回帰と呼ばれます) にすることも、出力は有限数の離散値 (分類と呼ばれます) にすることもできます。分類: k 最近傍アルゴリズム、ベイズ分類、
デシジョン ツリー、ランダム フォレスト、ロジスティック回帰
:線形回帰、リッジ回帰

7. 教師なし学習(教師なし学習)
の定義:入力データは入力特徴量から構成される
クラスタリング:k-means

6. 機械学習の開発プロセス

ステップ:
1. データの取得 (クローラ)
2. データ処理 (データ分析)
3. 特徴エンジニアリング
4. 機械学習アルゴリズムを使用してトレーニングし、トレーニング後のモデルを取得
5. モデルの評価 (検証セット)
モデルの方が優れている場合は、
モデルが適切でない場合は、データ処理に戻り、最初からやり直して新しいモデルを生成します。

7. 学習フレームワークと教材

1. いくつかの課題を明確にする必要がある
(1) アルゴリズムがコア、データと計算が基礎
(2) 正しいポジショニングを見つける

2. 複雑なモデルのアルゴリズム設計のほとんどはアルゴリズム エンジニアによって行われ、
(1) 大量のデータの分析
(2) 特定のビジネスの分析
(3) 共通のアルゴリズムの適用
(4) 特徴量エンジニアリング、パラメータ調整、最適化

3. 何をすればいいのか
(1) 問題の分析方法、機械学習アルゴリズムを使用する目的、アルゴリズムで達成したいタスクを学びます
(2) アルゴリズムの基本的な考え方をマスターし、対応するアルゴリズムを使用して問題を解決することを学びます
( 3) ライブラリやフレームワークを使用して問題を解決する方法を学ぶ
現時点では、機械学習アルゴリズムなどのいくつかのスキルを習得し、特定のビジネス分野の問題を解決することが重要です。

機械学習 - 「すいかの本」 周志華
統計学習法 - 李航
ディープラーニング - 「花の本」

4. ライブラリとフレームワーク
まずはパッケージマネージャーになってみましょう~

pytorch、tensorflow、theano、caffe2、chainer、Huawei の Mindspore
theano は tensorflow の前身とみなすことができ、
chainer は pytorch の前身とみなすことができます

おすすめ

転載: blog.csdn.net/csj50/article/details/131480356