5. 비정형 데이터 마이닝 (1) 텍스트 마이닝 가) 텍스트 마이닝 기능 요약 – 문서 요약 , 문서 분류 , 문서 군집 ,특성 추출 나) 정보 검색의 적절성 – 정확도 : 판단 긍정 / (판단 긍정 + 판단 부정) – 재현율 : 판단 긍정 / (판단 긍정 + 전체 긍정) – Corpus : 더 이상 추가 […]
4. 정형 데이터 마이닝 (1) 데이터 마이닝 개요 가) 정의 – 통계분석과의 가장큰 차이는 어떤 가설이나 가정에 따른 분석이나 검증이 아닌, 다양한 수리 알고리즘을 이용해 데이터베이스의 데이터로 부터 의미있는 정보를 찾아내는 방법을 통칭한다. (방법에 따라 인공지능, 의사경정나무, K-평균군집화, 연관분석, 회귀분석, 로짓분석, 최근접이웃 등으로 불림) 나) 데이터 마이닝 추진 단계 – 목적 설정 > 데이터 준비 […]
3. 데이터 마트 (1) 데이터 변경 및 요약 가) R reshape 을 이용한 마트 개발 – 요약 변수 . 기간별 구매 금액/횟수 , 위클리 쇼퍼, 상품별 구매 금액/횟수 ,상품별 구매 순서, 유통 채널별 구매 금액, 단어 빈도, 초기 행동변수, 트랜드 변수, 연속 변수의 구간화 등 – 파생변수 . 분석자가 특정 조건을 만족하거나 특정 함수에 의해 […]
2. 통계분석 (1) 통계분석의 이해 가) 통계 – 조사 범위 : 총조사 , 표본조사 – 표본추출 방법 . 단순랜덤 추출법 : 단순 랜덤 . 계통추출법 : 구간을 나눈 후 구간안에서 균등하게 랜덤하게 추출 . 집락추출법 : 모집단이 몇개의 집락으로 구분이 가능한 경우 사용 . 층화추출법 : 이질적인 원소들로 구성된 모집단에서 유사한 것끼리 층을 나눈후 각 […]
1. 데이터 분석 개요 (1) 데이터 분석 프로세스 가) 요건정의 – 분석요건 도출 . 분석요건은 문제 해결시 효과를 ROI 로 증명할 수 있어야 함 . 이슈리스트 작성 -> 핵심이슈 정의 -> 이슈 그룹핑 -> 해결방안 정의 – 수행방안 설계 . 일단위 WBS 작성 단계 , Forward/BackWard 방식으로 일정 계획 수립 – 요건 확정 . 분석 […]
2.분석 마스터 플랜 (1) 마스터 플랜 수립 가) 마스터 플랜 수립 개요 – 우선순위 (전략적 중요도, 비지니스 성과, 실행 용이성) , 적용 범위/방식 (업무 내재화 적용 수준, 분석 데이터 적용 수준, 기술 적용 수준) 등을 포함한 분석과제 로드맵 수립 나) 우선순위 평가 – 전략적 중요도 . 전략적 필요성 : 본원적 업무에 직접적인 연관 밀접도, 이슈 […]
1. 분석 과제 정의 (1) 개요 가) 주요 분석 지연 요소 : 데이터 지연, 분석지연, 의사결정 지연 나) 도입 성공 요소 : Question First 방식 접근, 선택과 집중 (핵심분석 도출) , 자동화된 분석업무 프로세스 내재화 (하위 95%에 대한 5%와 같은 효율 부여) (2) 분석 기회 발굴 가) 접근 방법 : Top-Down ,Bottom-Up, 경로접근(Path-Finding-Approach), 벤치마킹 접근 […]
3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 (1) 빅데이터 분석과 전략 인사이트 가) 열풍과 회의론 나) 분석 기반 경영이 도입되지 못하는 이유 – 기존 관행을 따를 뿐 중요한 시도를 하지 않음 – 분석에 따른 결정보다는 직관적인 결정을 더 중요한 재능으로 여긴다 – 분석적 실험에 대한 역량을 갖춘 사람이 없다 – 아이디어 자체 보다는 아이어를 […]
2. 데이터의 가치와 미래 (1) 빅데이터의 이해 가) 정의 : 규모, 형태, 속도 나) 출현 배경 : 데이터의 축적, 데이터 관련 기술 발전(저장, 클라우드, 모바일) , 데이터 활용 과학 확산 다) 빅데이터의 기능 – 철, 원유, 렌즈 (예:Ngram), 플랫폼(예 : FaceBook) 라) 빅데이터가 만드는 변화 – 사전처리 -> 사후처리 – 표본조사 -> 전수조사 – 질 […]
1. 데이터의 이해 (1) 데이터와 정보 가) 데이터 유형 : 정성적 데이터 , 정량적 데이터 나) 암묵지와 형식지 – 암묵지 (공통화, 내면화) -> 형식지(표출화, 연결화) 다) DIKW 피라미드 – Data > Info > Knowledge > Wisdom (2) 데이터 베이스 가) 정의 : 문자, 기호, 음성, 화상, 영상 등 관련된 다수의 코텐츠를 정보 처리 및 정보 […]