はじめに:ケースを取得し、分析します:
この分類は行われる最適化の一部で、その目標値は、はい何回帰の一部、分類を、何をすべきかの部分、それを行うか、リターンを行うことです。
そして、影響因子との分類、およびどのような要因がリターンに影響を与える要因を、ピックアップし、どのような最適化に関連する要因。
線形回帰のために、
まず、モジュールやパッケージのすべてをインポートする必要があります
#導入されたすべての必要なパケット から sklearn.model_selection インポート train_test_split #クロスバリデーションのために、クラスにデータを から sklearn.linear_model インポート線形回帰#線形回帰 から sklearn.preprocessing インポート StandardScalerの#の正規化したデータ のインポートnumpyのAS NP インポートmatplotlibのをMPL AS インポートは、ASのPLT matplotlib.pyplot インポートPANDAS ASは、PD から PANDAS インポートデータフレーム のインポート時
データのロード
#ロードデータ パス1 = ' ' DF = pd.read_csv(パス1上の9月= ' ; '、low_memory =偽)#ない混合型より多くのメモリlow_memory = Fによって呼び出され、効率を向上させます)
データとフォーマットを見てください
df.head(10)#1 のデータの最初の10行を見 #ビューフォーマット情報 df.info()
xとyを取得
トレーニングデータセットとテストセットに分割
##データセット試験にトレーニングセットを設定 #マトリックス(タイプ典型的DATAFRAME)式:X- #Y:機能(タイプ典型的シリーズ)対応するラベルタグ #1 test_size:X / Yの時間が分割され、テストセットデータを占め、(0,1)の間のフロートのタイプであること値 #random_state:データを分割する分割ベースのランダム化され、所定の乱数シードのパラメータを、値(int型)の役割されますデータセットを分割して生成された各番号が同一であることを確認 X_train、X_test、Y_train、android.permission.FACTOR。train_test_split =(X、Y、test_size = 0.2、random_state = 0) #のルックトレーニングセットとテストセットのサンプル プリント(X_train .shape) 印刷(X_test.shape) 印刷(Y_train.shape)
場合に応じて標準化/正常化、標準化は、連続的、離散行う正規化を行います
#フィットは、平均外求めている変換、平均と分散を求めている-分散を求めて二つを組み合わせることができる SS = StandardScaler() #は、正規化は、正規化され、正規化されたモデル・オブジェクトを作成し、データを正規化
フィッティング、標準化、フィット感とtransfoemは、書き込みに2つのステップに分割することができます
#正規化トレーニングセット、標準化の試験セット X_train = ss.fit_transform(X_train) #の学習モデルとトレーニングセット変換 X_test = ss.transform(X_test) #Aとモデル構築データ正規化(テストセット)内のデータに直接平均値とテストセットの分散とトレーニングセットが同じであるようにすることです
モデルのトレーニング、予測
##フィッティング、鉄道模型 LR =線形回帰(fit_intercept = TRUE) #モデルの線形がインターセプト含めるかどうかを、構築されたオブジェクト lr.fit(X_train、Y_train) ##フィッティングトレーニングモデル #の#モデルの検証 y_predict = LRを。 (X_test)を予測#の#予測を
フィット感の良さを参照してください、すなわち、R二乗
印刷(" :トレーニングセットR2 " 、lr.score(X_train、Y_train)) を印刷(" テストセットR2:" 。、lr.scoreを(X_test、android.permission.FACTOR)) #。MSE = np.average((y_predict-android.permission.FACTOR) 2 **) #RMSE = np.sqrt(MSE) #の印刷( "RMSE:"、RMSE)
出力パラメータは、トレーニングを取得します
#パラメータ出力モデルのトレーニングを得 印刷(「:モデルの係数(θ)」、終了= 「」) を印刷(lr.coef_) 印刷(「インターセプト・モデル:」、終了= 「」) 印刷(LR。 intercept_)