######################################################
## 13. Logistic Regression
## 종속변수가 0,1 / 죽다,살다 / 있다,없다 와 같은 Binary 인 경우 사용
## odds 의 log- 변환을 종속변수로 모형화 한다.
######################################################

## CASE1 : Respire.csv
## (1) 테스테 데이터 추출
setwd(“D:/DEVSource/CSV_DATA/”)
data1 = read.csv(“respire1.csv”)
data2 = read.csv(“respire2.csv”)
print(data1)
print(data2)

## (2) logistic test
## 귀무가설 : treat 종류에 따른 결과가 같다
## P-value : 6.7e-06 결과는 매우 유의한 차이가 있다
out = glm(outcome ~ treat, family=binomial, data=data)
summary(out)

## (3) 얼마나 더 좋은가?
## 새로운 약은 6배더 효과가 있다
exp(coef(out))

## (4) 신뢰 구간은?
## 2.8배 ~ 13.41배 효과가 있을 확률은 95% 이다
exp(confint(out))

## CASE2 : toxic.csv
data3 = read.csv(“toxic.csv”)
print(data3)

with(data3,tapply(count*response, dose, sum))
with(data3,tapply(count, dose, sum))
with(data3, tapply(count*response, dose, sum)/ tapply(count, dose, sum))
## P-value 가 0.331 로 dose 의 변화는 죽을 확률 변화와 연관이 있다
## 그 편차는(?) 1.1051 로 dose 1증가시 죽을 확률은 3.01 배 증가
out = glm(response ~ dose , weights=count, family=binomial, data=data3)
summary(out)
## 신뢰구간
## dose 가 1 증가할 때 죽을 확률은
## 1.16 ~ 9.33 배 증가할 확률이 95% 이다
exp(confint(out, parm=”dose”))