Chapter1 – 2. 데이터의 가치와 미래

2. 데이터의 가치와 미래

(1) 빅데이터의 이해

가) 정의 : 규모, 형태, 속도

나) 출현 배경 : 데이터의 축적, 데이터 관련 기술 발전(저장, 클라우드, 모바일) , 데이터 활용 과학 확산

다) 빅데이터의 기능

– 철, 원유, 렌즈 (예:Ngram), 플랫폼(예 : FaceBook)

라) 빅데이터가 만드는 변화

– 사전처리 -> 사후처리

– 표본조사 -> 전수조사

– 질 -> 양

– 인과관계 -> 상관관계

(2) 빅데이터의 가치와 영향

가) 빅데이터의 가치

– 가치 산정이 어려운 이유 : 다목적 용도로 데이터가 개발되고 활용 됨 , 새로운 가치를 창출 (기존의 없던 분야) , 분석 기술 발전 (기존 분석 하지 못하던 형태의 데이터 분석 가능 ,텍스트 마이닝)

– 가치를 만들어 내는 방식

.투명성 제고로 연구개발 및 관리 효율성 제고

.시뮬레이션을 통한 수요 포착 및 주요 변수 탐색으로 경쟁력 강화

.고객 세분화 및 맞춤 서비스 제공

.알고리즘을 활용한 의사 결정 보고 혹은 대체

.비지니스 모델과 제품 서비스 혁신

(3) 비지니스 모델

가) 활용 사례

– 기업 : 구글 PageRank 검색 시스템, 월마트 상품진열

– 정부 : 실시간 교통정보, 기후, 지질활동, 소방, SNS, 통화 기록등 분석

– 개인 : 정치인, 가수의 Target 분석 활동 전략 수립

나) 활용 기본 테크닉

– 연관규칙 학습 : 예) 커피를 구매하는 사람이 탄산음료를 더 많이 사는가? (연관 분석)

– 유형분석 : 예) 온라인 수강생들의 특성에 따른 고객 분류 (Clustering 분석)

– 유전 알고리즘 : 예) 최적화, 응급실에서 어떻게 의사를 배치하는 것이 효율적인가? (Linear Prgorman 등 최적화)

– 기계학습 : 예) 기존의 시청기록을 바탕으로 시청자가 현재 보유 영화중 어떤 영화를 보고 싶어할지 예측 (Machine Learing)

– 회귀분석 : 예) 물건의 가격이 올라가면 판매량에 어떤 영향을 주는가? (선형회귀, 다중선형회귀, 다항선형회귀, 비선형회귀 분석 등)

– 감정분석 : 예) 새로운 환불 정책에 대한 고객의 평가는? (Text Mining 을 통한 긍정도 분석)

– 소셜 네트워크 분석 : 예) Influencer 는 누구인가?

(4) 위치 요인 및 통제 방안

가) 위기요인

– 사생활 침해, 책임원칙훼손, 데이터 오용

나) 통제방안

– 동의에서 책임으로, 결과 기반 책임 원칙 고수, 알고리즘 접근 허용

(5) 미래의 빅데이터

가) 데이터 : 모든 것의 데이터화

나) 기술 : 진화하는 알고리즘, 인공지능

다) 인력 : 데이터 사이언티스트

라) 데이터 사이언티스트 필요 역량

– SOFT SKILL : 통찰력 있는 분석 (창의적 사고, 호기심, 논리적 비판), 설득력 있는 전달, 다분야간 협력

– HARD SKILL : 빅데이터에 대한 이론적 지식, 빅데이터 분석 기술의 숙련

Leave a Reply

Your email address will not be published. Required fields are marked *