방법 일반적으로 사용 모델 평가

1. 선형 상관 계수 (피어슨 상관 계수 () 두 변수 중 큰 상관 계수 사이의 상관의 강도를 설명하는 데, 더 강한)

R & LT XY = [시그마 (X I -X- - ) (Y I -Y - ) ÷ √Σ (X I에게 -X- - ) 2 (Y I -Y가 - ) (2)

일반 정보에 대한 경기 판단 :

        없음 0.2 ← ← ← → 0.4의 강도가 약한 → 0.6 → 0.8 ← ← → 1 강한


 

2 판정 계수 (둘 이상의 독립 변수 사이의 비선형 관계를 기술하기 위해 사용 된 모델은 효과를 평가하기 위해 사용될 수 있음)

                (R & LT 2 피트의 선형 회귀 변수 후에 평가 양호할수록, 이러한 R 및 LT 그대로 2 = 0.8, X는 80 % 이상 (Y)의 비율의 영향을 나타낸다)

= [시그마 제곱의 총 합과 SST I = 1. (Y I -Y - ) (2)

= [시그마 제곱 회귀 및 SSR I = 1. (Y - Y - ) (2)

= [시그마 사각형 및 SSE의 잔여 합계 I =. 1 (Y I -Y ) 측정 회귀 직선과 점 사이의 거리가 작을수록

대한 SST의 관계는 SSR를 SSE + =

판정 R & LT 계수 2 = SSR의가 / = SST - 더 SSE. 1 /를 SST


 

3. 혼란 매트릭스 (모델 평가 이진 분류를위한)

                          레벨 지표

 

                          보조 지표

정확도 ACC (A) = TP + TN / 비율의 예측에서 TP + FP + FN + TN 모든 예측기

정확도 PPV (P) = TP / (TP + FP)는 ​​모두 1을 초래할 것으로 예상 비율을 예상

감도 TPR (R) = TP / (TP + FN) 진정한 모든 결과, 비율의 예측

             FPR (F) = 모두 0 FP / (FP + TN) 결과, (1)의 비율에 대한 예측

특이성 TNR (S) = TN / (FP + TN)가 실제 결과 모두 0의 비율에 대한 예측 인         

                         세 가지 지표

조화 평균 F1score (F1) = (2 × P × R) ÷ (P + R)이 1보다 0 --- 사이


 

4.ROC 및 AUC 곡선 영역 (전체 효과 평가 모델을)

 

 어디 빨간색 = ROC 곡선

              블루 라인 쇼는 x = y를 (차별 모델은 표현하지 역가)

              AUC = 빨간색 선 영역 아래 영역

              X = 1- 특이성

              Y = 감도 (회수)

동일한 특이성 X, Y = 감도로 해석하면

참고 : ROC 곡선이 좋은 시작 후 유지해야 앞으로 평행 빠른 상승

       중화 민국의 곡선이 블루 라인 근처에 공중 선회하는 경우 올바른 속도를 추측 이진 분류, 50 %이기 때문에,이 모델은, 차별의 효과가 없음을 나타냅니다.

      모델의 차별을 나타냅니다 0.5에 대한 AUC는 0.7 모델보다 지역의 큰 사용할 수 일반적으로


 

(최적의 분할 확률 모델, 최대 하나의 모양을 결정하는) 5.KS 곡선

 

 참조 혼동 행렬

                    장소 :

                         빨간색 = TPR = FPR 블루 라인 곡선 녹색 선 = 캔사스

                       TPR 및 FPR 값 사이의 차이이다 캔사스

                       캔사스 값 = | TPR-FPR | * 100

일반 정보에 대한 경기 판단 :

               없음 0 ← → 20 ← → 40 ← 할 수있는 더 나은 → 60 (75) ← 표시가 있었다 ← → 문제 피팅 모델 → 100 없다


 

6. 프로필 계수 (클러스터링 모델의 유효성을 결정하는 두 번째 방법은 첫 번째 SSE이다)

  

 

 여러 개념 :

               집계의 1 정도 : SSE 내부의 작은 클러스터

               2. 분리 : 각 클러스터의 중심과, 또한 제곱 거리 및 두개의 무게 중심 또는 중심과 각각의 전체의 질량 중심까지의 거리의 제곱 두 같다.

화학식      의 Si = (B I- I ) / 최대 (A I, B I )

     상기 I 클러스터 내의 모든 점 점으로부터 평균 거리를 =

                B I 최소한 모든 클러스터들의 다른 점 점으로부터 평균 거리 =

                S I는  더 (1) 사이에 개재 -1

I는 0에 가까울수록입니다


 

(또한, 최적의 임계치를 찾는 데 사용되는) 제 수율 곡선

 

 가정 :

         이익 100 차별

          잘못된 판단 (200)의 손실

          어떤 가장 높은 소득이있는

 


 

추천

출처www.cnblogs.com/Koi504330/p/11915177.html