Month: May 2016

R – Two-way ANOVA

###################################################### ## 12. Two-way ANOVA ## 두개의 그룹변수를 갖는 데이터의 분석에 사용 ###################################################### ## (1) 테스트 데이터 추출 setwd(“D:/DEVSource/CSV_DATA/”) data = read.csv(“warpbreaks.csv”) print(data) ## (2) wool 과 tension 두개의 그룹으로 구성된 데이터이다. ## wool 과 tension 의 level 지정 상태를 확인한다 levels(data$tension) levels(data$wool) ## (3) tension 의 level 을 L, M , H 순서로 변경한다. […]

Read more

R – Kruskal-Wallis Test

###################################################### ## 11. Kruskal-Wallis Test ## 독립변수가 2개 이상인 경우에 각각의 그룹의 평균이 같은가를 결정함 ## 일원 테스트에서 F-TEST 는 그룹간 변동량과 그룹내 변동량의 비 ## – (각그룹평균 – 전체평균)^2 + (각그룹평균 – 전체평균)^2 과 ## – (각각 변수 – 각 그룹 평균)^2 ## 프로그램으로는 anova(lm(값 ~ 그룹)) 하면 끝나버린다. ## 여기서 귀무가설을 모든 그룹의 […]

Read more

R – Multiple Rgression

###################################################### ## 8. Multiple Regression ## 독립변수가 2개 이상인 경우에 사용하며 아래와 같은 방법이 있음 ## – 이론을 미리 정해 놓고 분석하는 Conframtory 분석 ## – 이론을 정하지 않고 가장 적절한 모형을 고르는 Exploratory 분석 ## – 다중회귀 모형의 특수한 경우인 다항회귀분석 ## CASE 분석은 아래와 같은 원칙을 따른다 ## – 종속변수와 독립변수간의 상관관계가 높아야 […]

Read more

R – Simple Linear Regression

###################################################### ## 7. Simple LinearRegression ## 연속 데이터에 대한 분석 방법 ## 종속 변수와 독립변수의 관계가 1:1 이다. ## 예를 들면 독립변수는 차량의 속도 종속변수는 차량의 제동 거리가 될 수 있겠다. ###################################################### ## (1) speed ,dist 두개의 컬럼으로 구성된 데이터 셋을 만들었다 speed = c(10,20,30,40,50,60,70) dist = c(13,18,25,38,47,61,105) data = data.frame(speed ,dist) print(data) ## (2) […]

Read more

R – Correlation Analysis

###################################################### ## 6. Correlation Analysis ## 상관분석이라 함은 두 변수가 같은 방향으로 움직이는지 다른 방향으로 움직이는지를 보여줌 ## 보통 상관계수는 데이터 측량 단위에 영향을 받기 때문에 이를 -1 ~ 1 사이로 보정하는 ## Pearson 상관계수를 많이 사용한다. ## cf) Pearson 상관계수 외에도 비모수 방법인 Kendall , Spearman 도 상관계수도 존재함 ###################################################### ## (1)기본 내장 데이터를 […]

Read more

R – Wilcoxon Rank-Sum Test

###################################################### ## 5. Wilxoxon Rank-Sum Test ## 서로 독립적인 두 집단의 평균의 차이가 0인지를 결정함 ## (1) wilcox test 는 잔차가 정규분포를 따르지 않을 경우 사용 ###################################################### ##(가) setwd 파일등을 로딩할 기준 위치 work directory 를 정의한다. setwd(“D:/DEVSource/CSV_DATA”) ##(나) 데이터를 읽어온다. ToothGrowth ## X len supp dose ##25 25 26.4 VC 2.0 ##26 26 32.5 […]

Read more

R – Two Sample T-Test

###################################################### ## 4. Two-Sample T-Test ## 서로 독립적인 두 집단의 평균의 차이가 0인지를 결정함 ## (1) 두 집단의 분산이 같은지 검정한다 (var.test()) ## (2) 분산이 다르면 welch 의 t-test 를 사용한다. ## (3) 분산이 같으면 pooled variance를 이용한 t-test 를 적용한다. (var.queal=TRUE) ###################################################### ##(가) setwd 파일등을 로딩할 기준 위치 work directory 를 정의한다. setwd(“D:/DEVSource/CSV_DATA”) ##(나) […]

Read more

R – Wilcoxon Signed-Rank Test

###################################################### ## 3. Wilcoxon Signed-Rank Test ## 데이터가 정규 분포를 따르지 않는 경우 사용하는 테스트 방법 ###################################################### ##적합한 테스트 데이터를 찾지 못하여 가상 데이터 생성 library(MASS) testData = mvrnorm(n=10, mu=c(94,93), Sigma=matrix(c(10,6,6,10), ncol=2)) print(testData ) ## [,1] [,2] ## [1,] 90.33835 89.07357 ## [2,] 88.15305 87.19982 ## [3,] 91.00698 88.97034 ## [4,] 98.46540 97.09314 ## [5,] […]

Read more

R – Paired T-Test

###################################################### ## 2. Paired T-Test ## on sample T-Test 에서는 하나의 군집 데이터에 대해 특정 평균일치를 테스트 했다면 ## Paired T-Test 에서는 두개의 데이터의 차이를 T-TEST 를 통해 검정 ## ex) 동일한 사람의 다이어트 제품 복용 전후 데이터 ## (후 – 전) 의 평균이 T-Test 를 통해 0에 수렴하는가 테스트 ###################################################### ##적합한 테스트 데이터를 찾지 […]

Read more

R – One Sample T-Test

###################################################### ## 1. one sample t-test ## ## ###################################################### ##setwd 파일등을 로딩할 기준 위치 work directory 를 정의한다. setwd(“D:/DEVSource/CSV_DATA”) ##CSV 파일을 읽습니다. AirPassengers= read.csv(“AirPassengers.csv”) plot(time~AirPassengers, data=AirPassengers ) ##shapiro.test 는 정규성을 검증하는 기능 ##귀무가설 : 데이터는 정규 분포 ##대립가설 : 데이터는 정규 분포가 아님 ##검정통계량 : 0.954 (0에서 얼마나 멀은가?) ##p-value : 6.8322e-05 (0.000068322) ##결론 : […]

Read more