기계 학습 기능 데이터 정규화 목적과 방법

  그것은 데이터 특성에 약간 퍼지 정규화 된 오늘 알고리즘에 의해 검토 과정은 특정 목적을 요약하고 방법이 표준화.

  개념 : 정규화 기능 값은 기능과 크기의 다른 순서에 의한 영향을 제거. 정규화는 치료가 당신이 (알고리즘을 통해) 필요한 특정 범위로 제한 한 후 처리하는 데 필요한 데이터를 가지고하는 것입니다. 정규화 우선 융합 프로그램이 실행되는 가속 Yasumasa이어서 나중에 데이터 처리를 용이하게하는 것이다.

  방법 :

    1. 선형 변환 함수

      Y = (X-MINVALUE) / (MAXVALUE - MINVALUE)

      설명 : X, Y 각각의 변환 이전 값, MAXVALUE, MINVALUE 각각 최대 및 최소의 샘플.

    2. 다음과 같이 대수 변환 함수는 식이다 :

      Y = LOG10 (X) 설명 :베이스 (10) 대수 변환 기능.

    3. 다음과 같이 역 코탄젠트 변환 함수는 식이다 :

      아크 탄젠트 Y = (X) * 2 / PI

  통계에서, 유도 통일 된 샘플의 통계 분포의 정규화 특정 역할. 통계적 분포 좌표 사이 + 1 - 0과 1 사이의 정규화는 -1이 반환의 통계적 확률 분포이다.

  데이터 표준화가 필요한 데이터는, 다음의 범위로 정규화하여 다른 기능을 말하는 데이터의 처리를 용이하게 할 수있다.

추천

출처www.cnblogs.com/nacl96/p/11244178.html