機械学習アルゴリズムのコードの実装 - 線形回帰

はじめに:ケースを取得し、分析します:

  この分類は行われる最適化の一部で、その目標値は、はい何回帰の一部、分類を、何をすべきかの部分、それを行うか、リターンを行うことです。

  そして、影響因子との分類、およびどのような要因がリターンに影響を与える要因を、ピックアップし、どのような最適化に関連する要因。

  線形回帰のために、

まず、モジュールやパッケージのすべてをインポートする必要があります

導入されたすべての必要なパケット
から sklearn.model_selection インポート train_test_split クロスバリデーションのために、クラスにデータを
から sklearn.linear_model インポート線形回帰線形回帰
から sklearn.preprocessing インポート StandardScalerの#の正規化したデータ
のインポートnumpyのAS NP
 インポートmatplotlibのをMPL AS
 インポートは、ASのPLT matplotlib.pyplot
 インポートPANDAS ASは、PD
 から PANDAS インポートデータフレーム
 のインポート

データのロード

ロードデータ 
パス1 = '  ' 
DF = pd.read_csv(パス1上の9月= ' ; '、low_memory =偽)ない混合型より多くのメモリlow_memory = Fによって呼び出され、効率を向上させます)

データとフォーマットを見てください

df.head(10)#1 のデータの最初の10行を見ビューフォーマット情報 
df.info()

xとyを取得

トレーニングデータセットとテストセットに分割

#データセット試験にトレーニングセットを設定マトリックス(タイプ典型的DATAFRAME)式:X- Y:機能(タイプ典型的シリーズ)対応するラベルタグ
#1 test_size:X / Yの時間が分割され、テストセットデータを占め、(0,1)の間のフロートのタイプであること値random_state:データを分割する分割ベースのランダム化され、所定の乱数シードのパラメータを、値(int型)の役割されますデータセットを分割して生成された各番号が同一であることを確認 
X_train、X_test、Y_train、android.permission.FACTOR。train_test_split =(X、Y、test_size = 0.2、random_state = 0)
ルックトレーニングセットとテストセットのサンプル
プリント(X_train .shape)
 印刷(X_test.shape)
 印刷(Y_train.shape)

場合に応じて標準化/正常化、標準化は、連続的、離散行う正規化を行います

フィットは、平均外求めている変換、平均と分散を求めている-分散を求めて二つを組み合わせることができる 
SS = StandardScaler() は、正規化は、正規化され、正規化されたモデル・オブジェクトを作成し、データを正規化

フィッティング、標準化、フィット感とtransfoemは、書き込みに2つのステップに分割することができます

#正規化トレーニングセット、標準化の試験セット 
X_train = ss.fit_transform(X_train) 学習モデルとトレーニングセット変換 
X_test = ss.transform(X_test) Aとモデル構築データ正規化(テストセット)内のデータに直接平均値とテストセットの分散とトレーニングセットが同じであるようにすることです

モデルのトレーニング、予測

#フィッティング、鉄道模型 
LR =線形回帰(fit_intercept = TRUE) モデルの線形がインターセプト含めるかどうかを、構築されたオブジェクト 
lr.fit(X_train、Y_train) #フィッティングトレーニングモデル
#の#モデルの検証 
y_predict = LRを。 (X_test)を予測#の#予測を

フィット感の良さを参照してください、すなわち、R二乗

印刷" :トレーニングセットR2 " 、lr.score(X_train、Y_train))
 を印刷" テストセットR2:" 。、lr.scoreを(X_test、android.permission.FACTOR))
。MSE = np.average((y_predict-android.permission.FACTOR) 2 **) RMSE = np.sqrt(MSE) 印刷( "RMSE:"、RMSE)

出力パラメータは、トレーニングを取得します

パラメータ出力モデルのトレーニングを得
印刷:モデルの係数(θ)、終了= 「」を印刷(lr.coef_)
 印刷インターセプト・モデル:、終了= 「」印刷(LR。 intercept_)

おすすめ

転載: www.cnblogs.com/qianchaomoon/p/12103810.html