R Programming

XgBoost Test

#install.packages("drat", repos="https://cran.rstudio.com") #drat:::addRepo("dmlc") #install.packages("xgboost", repos="http://dmlc.ml/drat/", type = "source") #install.packages("xgboost") #install.packages(c("dplyr", "hflights")) #install.packages("dummies") #install.packages("MASS") require(xgboost) library(dplyr) library(hflights) library(dummies) library(MASS) setwd("C:/Users/POSCOUSER/Desktop/") train = read.csv("train.csv") test = read.csv("test.csv") col_names = colnames(test) # 트레인 데이터 준비 train_x = subset(train, Read more…

By Tae Young Lee, ago
ADP/ADSP

[ADP] 5-2 제4절 시각화 방법

가. 빅데이터와 시각화 이슈 – 국내의 빅데이터 시각화 방향은 아직 정립되지 않음, 인포그래픽은 텍스트에 보조적인 역할 만하고 있을 뿐, 미국 뉴욕타임즈 등 처럼 실질적인 빅데이터 기반의 시각화 서비스는 이루어 지지 않고 있음 나. 빅데이터와 시각화 Read more…

By tmddno1@naver.com, ago
ADP/ADSP

[ADP] 5-2 제1절 시각화의 정의

가. 데이터 시각화의 중요성 – 많은 정보가 생성되는 빅데이터 환경이 도래하며, 엄청나게 많은 데이터의 홍수 속에서 의미있는 정보와 가치들을 얻어내는 것이 중요해 짐 특히나 텍스트와 이미지가 비정형의 형태를 띄고 있어 중요한 패턴을 찾기가 쉽지 않음 Read more…

By tmddno1@naver.com, ago
ADP/ADSP

[ADP] 5장-3절 분석(2단계)

가. 분석 대상의 구체화 (1) 2차 탐색 – 탐색을 통해 찾아낸 관계들 사이의 우선순의를 조정 – 잘라보기, 달리보기, 내려다보기, 올려다보기, 측정값, 차원값 조정 등을 다시 점검 (2) 분석 목표에 따른 분석 기법 – 패턴 자체를 Read more…

By tmddno1@naver.com, ago