원본 링크 : http://tecdat.cn/?p=6295
모든 결과 / 종속 변수는 합리적이었다 선형 회귀 분석을 사용하여 모델링 할 수있는 것은 아닙니다. 아마도 두 번째 가장 일반적인 회귀 모델은 바이너리 결과 데이터에 적용, 로지스틱 회귀 분석이다. 어떻게 R 제곱 로지스틱 회귀 모델을 계산?
맥파든 R 제곱
R에서, GLM (일반화 선형 모델) 명령은 표준 명령이 로지스틱 회귀에 맞게 사용됩니다. 내가 아는 한, 객체는 당신에게 직접 GLM 어떤 의사 R 제곱 값에 적합하지 않지만, 쉽게 맥파든의 측정을 계산할 수 있습니다. 이를 위해, 우리는 먼저 우리가 관심있는 모델을 장착하고 단지 널 모델 절편이 포함되어 있습니다. 그럼 우리가 계산 된 모델 번호 R-제곱 적합 맥파든 우도 값을 사용할 수 있습니다 :
맥 패든 R 제곱 값 예측을 획득하기 위해 필요한 힘을 이해하기 위해, 우리는 상기 X 예측을 시뮬레이션 한 이진 데이터를 사용하는 우리 P 행의 첫 번째 시도 (Y = 1 | X = 0) = 0.3 P (Y = 1 | X = 1) 0.7 =
따라서, Y에 대한 X의 확률은 매우 강한 영향 만 0.13 맥 패든을 R2 =하더라도. 및 P |를 증가시키기 위해, 우리는 P (X = 0, Y = 1)해야합니다 (Y = 1 | X = 1) 더 다를 수 :
P는 X (Y = 1)이 0.1 ~ 0.9로 변경 되어도, 맥 패든 단 R은 0.55 제곱. 마지막으로, 우리는 0.01와 0.99의 값을하려고합니다 - 나는 매우 강력한 효과를 부를 것이다!
이제 우리는 1에 가까운 값을 가지고있다.
단일 데이터와 함께 두 개의 패킷 데이터
데이터 <- data.frame (S = C의 (700,300)의 F = C (300,700)에서의 X = C (0,1)) SFX 1 700 300 0 2 300 1 700
R의 회귀 모델에 대한 데이터를 적합하게하기 위하여, 우리는 GLM 기능에 대한 응답을 전송할 수있다 :
우리는 지금 데이터로 베르누이 이항 데이터를 그룹화, 같은 로지스틱 회귀 모델에 대한 것입니다.
예상대로, 우리는 패킷 데이터 상자, 매개 변수 추정 및 추론에서 같은 얻을.
우리는 R 제곱 패킷 데이터 모델은 0.96 참조 단일 데이터 모델은 0.12의 R 제곱.
이 기사를 읽고 주셔서 감사합니다, 당신은 질문이 아래에 댓글을 남겨주세요!
![[] 빅 데이터 빅 데이터 부족 부족 맞춤형 원 스톱 데이터 마이닝 및 통계 분석 상담 서비스를 제공하는 [] 빅 데이터 빅 데이터 부족 부족 맞춤형 원 스톱 데이터 마이닝 및 통계 분석 상담 서비스를 제공하는](http://www.sinaimg.cn/uc/myshow/blog/misc/gif/E___6726EN00SIGG.gif)
데이터 건조에 대한 자세한 내용은 마이크로 채널 대중 숫자에 오신 것을 환영합니다주의!