R – Correlation Analysis

######################################################
## 6. Correlation Analysis
## 상관분석이라 함은 두 변수가 같은 방향으로 움직이는지 다른 방향으로 움직이는지를 보여줌
## 보통 상관계수는 데이터 측량 단위에 영향을 받기 때문에 이를 -1 ~ 1 사이로 보정하는
## Pearson 상관계수를 많이 사용한다.
## cf) Pearson 상관계수 외에도 비모수 방법인 Kendall , Spearman 도 상관계수도 존재함
######################################################

## (1)기본 내장 데이터를 테스트 데이터로 사용한다.
## 아래는 테이블의 데어터 내용이다.
## rating complaints privileges learning raises critical advance
##1 43 51 30 39 61 92 45
##2 63 64 51 54 63 73 47
##3 71 70 68 69 76 86 48
##4 61 63 45 47 54 84 35
##5 81 78 56 66 71 83 47
##6 43 55 49 44 54 49 34
##7 58 67 42 56 66 68 35
##8 71 75 50 55 70 66 41
##9 72 82 72 67 71 83 31
##10 67 61 45 47 62 80 41
##11 64 53 53 58 58 67 34
##12 67 60 47 39 59 74 41
print(attitude)
## (2)모든 컬럼간의 공분산을 구한다.
## rating complaints privileges learning raises critical
##rating 148.17126 133.77931 63.46437 89.10460 74.68851 18.84253
##complaints 133.77931 177.28276 90.95172 93.25517 92.64138 24.73103
##privileges 63.46437 90.95172 149.70575 70.84598 56.67126 17.82529
##learning 89.10460 93.25517 70.84598 137.75747 78.13908 13.46782
##raises 74.68851 92.64138 56.67126 78.13908 108.10230 38.77356
##critical 18.84253 24.73103 17.82529 13.46782 38.77356 97.90920
##advance 19.42299 30.76552 43.21609 64.19770 61.42299 28.84598

cov(attitude)

## (3)모든 컬럼간의 상관계수를 구한다 ( -1 ~ 1)
## 기본은 pearson 상관계수이다.
## rating complaints privileges learning raises critical
##rating 1.0000000 0.8254176 0.4261169 0.6236782 0.5901390 0.1564392
##complaints 0.8254176 1.0000000 0.5582882 0.5967358 0.6691975 0.1877143
##privileges 0.4261169 0.5582882 1.0000000 0.4933310 0.4454779 0.1472331
##learning 0.6236782 0.5967358 0.4933310 1.0000000 0.6403144 0.1159652
##raises 0.5901390 0.6691975 0.4454779 0.6403144 1.0000000 0.3768830
##critical 0.1564392 0.1877143 0.1472331 0.1159652 0.3768830 1.0000000
##advance 0.1550863 0.2245796 0.3432934 0.5316198 0.5741862 0.2833432

cor(attitude)

## (4)P-Value
## rating 과 complaints 사이의 P-Value 를 구해보겠다.
## pearson, kendall, spearman 모두 매우 낮은 P-Value 를 갖음
## 귀무가설 : 둘의 상관계수는 0 이다.
## 대립가설 : 둘은 상관 관계가 있다.
## 결론 : 귀무가설을 기각하고 둘의 상관관계가 있다는 대립가설을 채택함
with(attitude, cor.test(rating , complaints , method=”pearson”, use=”pairwise.complete.obs”))

with(attitude, cor.test(rating , complaints , method=”kendall”, use=”pairwise.complete.obs”))

with(attitude, cor.test(rating , complaints , method=”spearman”, use=”pairwise.complete.obs”))

Leave a Reply

Your email address will not be published. Required fields are marked *