##
library(NRAIA)
## attach 데이터를 로딩 , 로딩한 데이터는 $ 없이 바로 접근 가능
attach(trees)
mean(Volume)
detach(trees)
## with (데이터, 변수) 형태로 사용 해당 명령어에 한하여 $없이 변수 접근 가능
with(trees, mean(Volume))
##setwd 파일등을 로딩할 기준 위치 work directory 를 정의한다.
setwd(“D:/DEVSource/CSV_DATA”)
##CSV 파일을 읽습니다.
AirPassengers = read.csv(“AirPassengers.csv”)
plot(time~AirPassengers, data=AirPassengers )
##표본수 length
length(AirPassengers$AirPassengers)
##평균 mean
mean(AirPassengers$AirPassengers)
##분산 var (퍼진정도)
var(AirPassengers$AirPassengers)
##표준편차 (퍼진정도)
sd(AirPassengers$AirPassengers)
sqrt(var(AirPassengers$AirPassengers))
##표준오차 (퍼진정도, 크거나 아주작은 값에 대한 보정)
sd(AirPassengers$AirPassengers)/sqrt(length(AirPassengers$AirPassengers))
##변동계수 (퍼진정도, 평균이 클수로 분산도 커지는 부분을 보정)
sd(AirPassengers$AirPassengers)/mean(AirPassengers$AirPassengers)
##사분위수 (데이터 Set을 4분위 하여 데이터를 추출)
fivenum(AirPassengers$AirPassengers)
quantile(AirPassengers$AirPassengers)
##75% – 25%
IQR(AirPassengers$AirPassengers)
##boxplot
##4분위를 그래프로 표현 아래선 부터 25% ~ 50% ~ 75%
colors()
boxplot(AirPassengers$AirPassengers, col=”violetred4″)
##hist
hist(AirPassengers$AirPassengers, probability=TRUE)
hist(AirPassengers$AirPassengers, probability=FALSE)
##stem
## 1 | 11223344
## 1앞에 1이 오는 경우 두개 , 2앞에 1이 오는 경우 두개 …
stem(AirPassengers$AirPassengers)
## qqnorm
## 직선에 근접할수록 정규분포에 가깝다
qqnorm(AirPassengers$AirPassengers)
qqline(AirPassengers$AirPassengers)
##사용자 정의 Function se (표준오차)
se = function(x)
{
sd(x)/sqrt(length(x))
}
se(AirPassengers$AirPassengers)
##sample
sample(AirPassengers$AirPassengers, size=10)