2. 데이터의 가치와 미래
(1) 빅데이터의 이해
가) 정의 : 규모, 형태, 속도
나) 출현 배경 : 데이터의 축적, 데이터 관련 기술 발전(저장, 클라우드, 모바일) , 데이터 활용 과학 확산
다) 빅데이터의 기능
– 철, 원유, 렌즈 (예:Ngram), 플랫폼(예 : FaceBook)
라) 빅데이터가 만드는 변화
– 사전처리 -> 사후처리
– 표본조사 -> 전수조사
– 질 -> 양
– 인과관계 -> 상관관계
(2) 빅데이터의 가치와 영향
가) 빅데이터의 가치
– 가치 산정이 어려운 이유 : 다목적 용도로 데이터가 개발되고 활용 됨 , 새로운 가치를 창출 (기존의 없던 분야) , 분석 기술 발전 (기존 분석 하지 못하던 형태의 데이터 분석 가능 ,텍스트 마이닝)
– 가치를 만들어 내는 방식
.투명성 제고로 연구개발 및 관리 효율성 제고
.시뮬레이션을 통한 수요 포착 및 주요 변수 탐색으로 경쟁력 강화
.고객 세분화 및 맞춤 서비스 제공
.알고리즘을 활용한 의사 결정 보고 혹은 대체
.비지니스 모델과 제품 서비스 혁신
(3) 비지니스 모델
가) 활용 사례
– 기업 : 구글 PageRank 검색 시스템, 월마트 상품진열
– 정부 : 실시간 교통정보, 기후, 지질활동, 소방, SNS, 통화 기록등 분석
– 개인 : 정치인, 가수의 Target 분석 활동 전략 수립
나) 활용 기본 테크닉
– 연관규칙 학습 : 예) 커피를 구매하는 사람이 탄산음료를 더 많이 사는가? (연관 분석)
– 유형분석 : 예) 온라인 수강생들의 특성에 따른 고객 분류 (Clustering 분석)
– 유전 알고리즘 : 예) 최적화, 응급실에서 어떻게 의사를 배치하는 것이 효율적인가? (Linear Prgorman 등 최적화)
– 기계학습 : 예) 기존의 시청기록을 바탕으로 시청자가 현재 보유 영화중 어떤 영화를 보고 싶어할지 예측 (Machine Learing)
– 회귀분석 : 예) 물건의 가격이 올라가면 판매량에 어떤 영향을 주는가? (선형회귀, 다중선형회귀, 다항선형회귀, 비선형회귀 분석 등)
– 감정분석 : 예) 새로운 환불 정책에 대한 고객의 평가는? (Text Mining 을 통한 긍정도 분석)
– 소셜 네트워크 분석 : 예) Influencer 는 누구인가?
(4) 위치 요인 및 통제 방안
가) 위기요인
– 사생활 침해, 책임원칙훼손, 데이터 오용
나) 통제방안
– 동의에서 책임으로, 결과 기반 책임 원칙 고수, 알고리즘 접근 허용
(5) 미래의 빅데이터
가) 데이터 : 모든 것의 데이터화
나) 기술 : 진화하는 알고리즘, 인공지능
다) 인력 : 데이터 사이언티스트
라) 데이터 사이언티스트 필요 역량
– SOFT SKILL : 통찰력 있는 분석 (창의적 사고, 호기심, 논리적 비판), 설득력 있는 전달, 다분야간 협력
– HARD SKILL : 빅데이터에 대한 이론적 지식, 빅데이터 분석 기술의 숙련