스퀘어 R의 R의 R 언어 추구하는 자 로지스틱 회귀 분석

원본 링크 : http://tecdat.cn/?p=6295

 

 모든 결과 / 종속 변수는 합리적이었다 선형 회귀 분석을 사용하여 모델링 할 수있는 것은 아닙니다. 아마도 두 번째 가장 일반적인 회귀 모델은 바이너리 결과 데이터에 적용, 로지스틱 회귀 분석이다. 어떻게 R 제곱 로지스틱 회귀 모델을 계산? 

 

맥파든 R 제곱

R에서, GLM (일반화 선형 모델) 명령은 표준 명령이 로지스틱 회귀에 맞게 사용됩니다. 내가 아는 한, 객체는 당신에게 직접 GLM 어떤 의사 R 제곱 값에 적합하지 않지만, 쉽게 맥파든의 측정을 계산할 수 있습니다. 이를 위해, 우리는 먼저 우리가 관심있는 모델을 장착하고 단지 널 모델 절편이 포함되어 있습니다. 그럼 우리가 계산 된 모델 번호 R-제곱 적합 맥파든 우도 값을 사용할 수 있습니다 :

mod < -  glm(y~x,family =“binomial”)
nullmod < -  glm(y~1,family =“binomial”)
1-logLik(MOD)/ logLik(nullmod)

 맥 패든 R 제곱 값 예측을 획득하기 위해 필요한 힘을 이해하기 위해, 우리는 상기 X 예측을 시뮬레이션 한 이진 데이터를 사용하는 우리 P 행의 첫 번째 시도 (Y = 1 | X = 0) = 0.3 P (Y = 1 | X = 1) 0.7 =

set.seed(63126)
n < -  10000
x < -  1 *( (n)<0.5)
pr < - (x == 1)* 0.7 +(x == 0)* 0.3
y < -  1 *(  f(n)<pr)
mod < -  glm(y~x,family =“binomial”)
nullmod < -  glm(y~1,family =“binomial”)
1-logLik(MOD)/  (nullmod)
'log Lik。' 0.1320256(df = 2)

 따라서, Y에 대한 X의 확률은 매우 강한 영향 만 0.13 맥 패든을 R2 =하더라도. 및 P |를 증가시키기 위해, 우리는 P (X = 0, Y = 1)해야합니다 (Y = 1 | X = 1) 더 다를 수 :

set.seed(63126)
n < -  10000
x < -  1 *(runif(n)<0.5)
pr < - (x == 1)* 0.9 +(x == 0)* 0.1
y < -  1 *( (n)<pr)
mod < -  glm(y~x,family =“binomial”)
nullmod < -  glm(y~1,family =“binomial”)
1- (MOD)/  (nullmod)
[1] 0.5539419

P는 X (Y = 1)이 0.1 ~ 0.9로 변경 되어도, 맥 패든 단 R은 0.55 제곱. 마지막으로, 우리는 0.01와 0.99의 값을하려고합니다 - 나는 매우 강력한 효과를 부를 것이다!

set.seed(63126)
n < -  10000
x < -  1 *(runif(n)<0.5)
pr < - (x == 1)* 0.99 +(x == 0)* 0.01
y < -  1 *( (n) pr)
mod < -  glm(y~x,family =“binomial”)
nullmod < -  glm(y~1,family =“binomial”)
1- (MOD)/  ( )
[1] 0.9293177

이제 우리는 1에 가까운 값을 가지고있다. 

단일 데이터와 함께 두 개의 패킷 데이터

 

데이터 <- data.frame (S = C의 (700,300)의 F = C (300,700)에서의 X = C (0,1)) 
     SFX 
1 700 300 0 
2 300 1 700

 R의 회귀 모델에 대한 데이터를 적합하게하기 위하여, 우리는 GLM 기능에 대한 응답을 전송할 수있다 :

Call:
glm(formula = cbind(s, f) ~ x, family = "binomial", data = data)

Deviance Residuals: 
[1]  0  0

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  0.84730    0.06901   12.28   <2e-16 ***
x           -1.69460    0.09759  -17.36   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 3.2913e+02  on 1  degrees of freedom
Residual deviance: 1.3323e-13  on 0  degrees of freedom
AIC: 18.371

Number of Fisher Scoring iterations: 2

우리는 지금 데이터로 베르누이 이항 데이터를 그룹화, 같은 로지스틱 회귀 모델에 대한 것입니다. 

individualData <-  (cbind(data,y=0),cbind(data,y=1))
individualData$freq <- individualData$s
individualData$freq[ $y==0] <-  $f[individualData$y==0]
mod2 <- glm(y~x, family="binomial",data= ,weight=freq)
summary(mod2)

Call:
glm(formula = y ~ x, family = "binomial", data = individualData, 
    weights = freq)

Deviance Residuals: 
     1       2       3       4  
-26.88  -22.35   22.35   26.88  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  0.84730    0.06901   12.28   <2e-16 ***
x           -1.69460    0.09759  -17.36   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 2772.6  on 3  degrees of freedom
Residual deviance: 2443.5  on 2  degrees of freedom
AIC: 2447.5

Number of Fisher Scoring iterations: 4

예상대로, 우리는 패킷 데이터 상자, 매개 변수 추정 및 추론에서 같은 얻을. 

nullmod1 <- glm(cbind(s,f)~1, family="binomial",data)
nullmod2 <- glm(y~1, family="binomial",data=individualData, =freq)
1-logLik(mod1)/logLik(nullmod1)
'log Lik.' 0.9581627 (df=2)
1-logLik(mod2)/logLik(nullmod2)
'log Lik.' 0.1187091 (df=2)

우리는 R 제곱 패킷 데이터 모델은 0.96 참조 단일 데이터 모델은 0.12의 R 제곱. 

이 기사를 읽고 주셔서 감사합니다, 당신은 질문이 아래에 댓글을 남겨주세요!

 

 

빅 데이터의 부족 - 중국어 전문 타사 데이터 서비스 제공 업체는 맞춤형 원 스톱 데이터 마이닝 및 통계 분석 컨설팅 서비스를 제공합니다
통계 분석 및 데이터 마이닝 컨설팅 서비스 : y0.cn/teradat (컨설팅 서비스는, 문의하시기 바랍니다 공식 웹 사이트 고객 서비스 )
나에게 메시지를 보내려면 여기를 클릭 QQ : 3025393450
 
[서비스] 장면  
연구 프로젝트; 
 
회사 아웃소싱, 온라인과 오프라인 일 훈련, 데이터 수집, 학술 연구, 보고서 작성, 시장 조사.
[부족] 큰 데이터는 맞춤형 원 스톱 데이터 마이닝 및 통계 분석 상담 서비스를 제공하는
[] 빅 데이터 빅 데이터 부족 부족 맞춤형 원 스톱 데이터 마이닝 및 통계 분석 상담 서비스를 제공하는
, 빅 데이터, 데이터 분석에 대한 최신 정보를 공유 매일 조금씩 공부하고, 그래서 우리는 사람들과 함께 데이터의 태도를해야합니까 [] 빅 데이터 빅 데이터 부족 부족 맞춤형 원 스톱 데이터 마이닝 및 통계 분석 상담 서비스를 제공하는
마이크로 채널 고객 서비스 번호 : lico_9e
QQ 교환기 : 186 388 004  빅 데이터 부족

우리의 선택 과목에 오신 것을 환영합니다 알 광산 될 것 R 언어 데이터 분석 과정을!

 

[] 빅 데이터 빅 데이터 부족 부족 맞춤형 원 스톱 데이터 마이닝 및 통계 분석 상담 서비스를 제공하는


데이터 건조에 대한 자세한 내용은 마이크로 채널 대중 숫자에 오신 것을 환영합니다주의!
[] 빅 데이터 빅 데이터 부족 부족 맞춤형 원 스톱 데이터 마이닝 및 통계 분석 상담 서비스를 제공하는

추천

출처www.cnblogs.com/tecdat/p/11460094.html