Data-Analaysis

R- 시계열 모형

1. 정상성 – 평균이 일정하다. 즉 모든 시점에 대해 일정한 평균을 가진다. – 분산도 시점에 의존하지 않는다 – 공분산은 단지 시차에만 의존하고 실제 어느 시점 t,s 에는 의존하지 않는다. 대부분의 경우 실제의 데이터는 이러한 정상성을 Read more…

R Programming

R – Decision Tree

install.packages(“rattle”) install.packages(“RColorBrewer”) install.packages(“rpart.plot”) ####################################### #1. 데이터 구성 ####################################### library(rattle) library(RColorBrewer) library(rpart.plot) #일정한 Random 값을 갖도록한다. (언제 실행해도 1426 이라면 같은 Random 값) set.seed(1426) #R 에 내장된 샘플 CSV weather 를 읽어 온다 data(weather) #weather 데이터를 Read more…

R Programming

R – Nonlinear Regression

###################################################### ## 19. Nonlinear Regression ## 비선형 회귀 분석에 사용한다. ## 말그대로 데이터가 선형관계가 아닌 비선형 관계일 경우 사용한다. ###################################################### ## (1) One-Compartment Model ## 하나의 exp 만 가지고 증가하는 모델 ## 데이터 로딩 setwd(“D:/DEVSource/CSV_DATA/”) Read more…

R Programming

R – Logistic Regression

###################################################### ## 13. Logistic Regression ## 종속변수가 0,1 / 죽다,살다 / 있다,없다 와 같은 Binary 인 경우 사용 ## odds 의 log- 변환을 종속변수로 모형화 한다. ###################################################### ## CASE1 : Respire.csv ## (1) 테스테 데이터 Read more…

R Programming

R – ANCOVA (analysis of covariance)공분산 분석

###################################################### ## 13. ANCOVA (analysis of covariance)공분산 분석 ## 사회과학과 같이 다른 변인의 통제가 쉽지 않은 상황에서 ## 연속형 변수를 추가하여 오차를 줄이고 검정력을 높이는 방법 ###################################################### ## (1) 테스트 데이터 추출 setwd(“D:/DEVSource/CSV_DATA/”) data = Read more…

R Programming

R – Two-way ANOVA

###################################################### ## 12. Two-way ANOVA ## 두개의 그룹변수를 갖는 데이터의 분석에 사용 ###################################################### ## (1) 테스트 데이터 추출 setwd(“D:/DEVSource/CSV_DATA/”) data = read.csv(“warpbreaks.csv”) print(data) ## (2) wool 과 tension 두개의 그룹으로 구성된 데이터이다. ## wool 과 Read more…

R Programming

R – Kruskal-Wallis Test

###################################################### ## 11. Kruskal-Wallis Test ## 독립변수가 2개 이상인 경우에 각각의 그룹의 평균이 같은가를 결정함 ## 일원 테스트에서 F-TEST 는 그룹간 변동량과 그룹내 변동량의 비 ## – (각그룹평균 – 전체평균)^2 + (각그룹평균 – 전체평균)^2 과 Read more…

R Programming

R – Multiple Rgression

###################################################### ## 8. Multiple Regression ## 독립변수가 2개 이상인 경우에 사용하며 아래와 같은 방법이 있음 ## – 이론을 미리 정해 놓고 분석하는 Conframtory 분석 ## – 이론을 정하지 않고 가장 적절한 모형을 고르는 Exploratory 분석 Read more…

R Programming

R – Simple Linear Regression

###################################################### ## 7. Simple LinearRegression ## 연속 데이터에 대한 분석 방법 ## 종속 변수와 독립변수의 관계가 1:1 이다. ## 예를 들면 독립변수는 차량의 속도 종속변수는 차량의 제동 거리가 될 수 있겠다. ###################################################### ## (1) speed Read more…

R Programming

R – Correlation Analysis

###################################################### ## 6. Correlation Analysis ## 상관분석이라 함은 두 변수가 같은 방향으로 움직이는지 다른 방향으로 움직이는지를 보여줌 ## 보통 상관계수는 데이터 측량 단위에 영향을 받기 때문에 이를 -1 ~ 1 사이로 보정하는 ## Pearson 상관계수를 Read more…