###################################################### ## 6. Correlation Analysis ## 상관분석이라 함은 두 변수가 같은 방향으로 움직이는지 다른 방향으로 움직이는지를 보여줌 ## 보통 상관계수는 데이터 측량 단위에 영향을 받기 때문에 이를 -1 ~ 1 사이로 보정하는 ## Pearson 상관계수를 많이 사용한다. ## cf) Pearson 상관계수 외에도 비모수 방법인 Kendall , Spearman 도 상관계수도 존재함 ###################################################### ## (1)기본 내장 데이터를 […]
###################################################### ## 5. Wilxoxon Rank-Sum Test ## 서로 독립적인 두 집단의 평균의 차이가 0인지를 결정함 ## (1) wilcox test 는 잔차가 정규분포를 따르지 않을 경우 사용 ###################################################### ##(가) setwd 파일등을 로딩할 기준 위치 work directory 를 정의한다. setwd(“D:/DEVSource/CSV_DATA”) ##(나) 데이터를 읽어온다. ToothGrowth ## X len supp dose ##25 25 26.4 VC 2.0 ##26 26 32.5 […]
###################################################### ## 4. Two-Sample T-Test ## 서로 독립적인 두 집단의 평균의 차이가 0인지를 결정함 ## (1) 두 집단의 분산이 같은지 검정한다 (var.test()) ## (2) 분산이 다르면 welch 의 t-test 를 사용한다. ## (3) 분산이 같으면 pooled variance를 이용한 t-test 를 적용한다. (var.queal=TRUE) ###################################################### ##(가) setwd 파일등을 로딩할 기준 위치 work directory 를 정의한다. setwd(“D:/DEVSource/CSV_DATA”) ##(나) […]
###################################################### ## 3. Wilcoxon Signed-Rank Test ## 데이터가 정규 분포를 따르지 않는 경우 사용하는 테스트 방법 ###################################################### ##적합한 테스트 데이터를 찾지 못하여 가상 데이터 생성 library(MASS) testData = mvrnorm(n=10, mu=c(94,93), Sigma=matrix(c(10,6,6,10), ncol=2)) print(testData ) ## [,1] [,2] ## [1,] 90.33835 89.07357 ## [2,] 88.15305 87.19982 ## [3,] 91.00698 88.97034 ## [4,] 98.46540 97.09314 ## [5,] […]
###################################################### ## 2. Paired T-Test ## on sample T-Test 에서는 하나의 군집 데이터에 대해 특정 평균일치를 테스트 했다면 ## Paired T-Test 에서는 두개의 데이터의 차이를 T-TEST 를 통해 검정 ## ex) 동일한 사람의 다이어트 제품 복용 전후 데이터 ## (후 – 전) 의 평균이 T-Test 를 통해 0에 수렴하는가 테스트 ###################################################### ##적합한 테스트 데이터를 찾지 […]
###################################################### ## 1. one sample t-test ## ## ###################################################### ##setwd 파일등을 로딩할 기준 위치 work directory 를 정의한다. setwd(“D:/DEVSource/CSV_DATA”) ##CSV 파일을 읽습니다. AirPassengers= read.csv(“AirPassengers.csv”) plot(time~AirPassengers, data=AirPassengers ) ##shapiro.test 는 정규성을 검증하는 기능 ##귀무가설 : 데이터는 정규 분포 ##대립가설 : 데이터는 정규 분포가 아님 ##검정통계량 : 0.954 (0에서 얼마나 멀은가?) ##p-value : 6.8322e-05 (0.000068322) ##결론 : […]
## library(NRAIA) ## attach 데이터를 로딩 , 로딩한 데이터는 $ 없이 바로 접근 가능 attach(trees) mean(Volume) detach(trees) ## with (데이터, 변수) 형태로 사용 해당 명령어에 한하여 $없이 변수 접근 가능 with(trees, mean(Volume)) ##setwd 파일등을 로딩할 기준 위치 work directory 를 정의한다. setwd(“D:/DEVSource/CSV_DATA”) ##CSV 파일을 읽습니다. AirPassengers = read.csv(“AirPassengers.csv”) plot(time~AirPassengers, data=AirPassengers ) ##표본수 length length(AirPassengers$AirPassengers) ##평균 […]