Author: tmddno1@naver.com

[CVPR 2017] Learning by Association – A versatile semi-supervised training method for neural networks

  [CVPR 2017] Learning by Association – A versatile semi-supervised training method for neural networks (Blog, Paper) 1. 서론  우리가 모델링을 하면서 가장 힘든게 무엇일까? 아마도 데이터를 전처리하는 일이라고 볼 수 있을 것이다. 데이터 전처리에는 변수 선택이나, 정규화 처리, 파생변수 생성 등 모델러의 일이라고 볼 수 있는 부분들도 있지만, 어쩔 수 없이 발생하는 레이블링 작업은 […]

Read more

Precision and Recall for Multi Class

Precision and Recall for Multi Class 모델의 정확도를 평가하는 방법은 크게 위와 같이 4가지로 볼 수 있는데, accuracy 는 전체 모수중에 맞춘 전체의 확률로 많이 사용되지만 데이터가 unbalance 할 경우 (예를들어 0,1 라벨중 0의 비중이 90% 이상) 인 경우라면 0으로 전부 예측해도 전체 정확도는 90% 가 되버리는 문제가 있다.  이러한 문재를 해결하기 위해 나온 개념이 […]

Read more

Very Deep Convolutional Networks for Text Classification

Very Deep Convolutional Networks for Text Classification (Paper) 1. 개요 지금까지 몇 가지 주요 Text 분류 알고리즘들을 살펴 보았다. 현재까지 추이를 보면 처음 보았던 내용이 Text 분류에 Word Embedding 기법과 Convolution 기법을 적용한 것이였으며, 두 번째로 보았던 것이 형태소 분석후 Word Embedding 을 하는 것이 아닌 Char Level 의 Embedding 을 사용하고 Colvolution 의 Depth 를 […]

Read more

Character-level Convolutional Networks for Text Classification∗

Character-level Convolutional Networks for Text Classification (GitHub, Paper) 1. 개요 Word2Vec 방법론은 자연어를 해석하는데 있어서 매우큰 변화를 가지고 왔다. 하지만 기본적으로 형태소 분석후에 단어를 Vector 로 Embedding 하기 때문에 형태소 분석기의 성능에 따라 전체의 결과에 큰 영향을 주는 단점이 있다. 이러한 문제를 해결하기 위한 접근 방법으로 최근 Char Embedding 기법에 대해서 생각을 해보고자 한다.  결론부터 이야기 […]

Read more

Grad-CAM: Gradient-weighted Class Activation Mapping

Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization (Paper) 1. 문제점  딥러닝은 매우 뛰어난 분류기이지만, 실제 기업에서 사용하기 위해서는 큰 문제점이 있는데, 가장 대표적인 문제가 왜? 그런 결과가 나왔는지 설명하기가 어렵다는 것이다. 이러한 딥러닝의 Black Box 적인 특성 때문에 뛰어난 분류 성능에도 불구하고 현업에서는 사용하기가 어려웠던 것이 사실이다. 때문에 요즘에는 XAI (Explainable Aritificial Intelligence) 에 대한 연구가 […]

Read more

[General AI] GoodAI Road Map 자료

예전에 봤던건데 갑자기 생각나서… 이미지 클릭하면 첨부 연결

Read more

[HR] Recruit Automation with Deep Learning

Recruit Automation with Deep Learning (IBM, Paper, Slide, adroitbot) 1. 서론  Recruit 자동화는 지금까지 자료를 찾은 결과를 종합하였을 때 HR Recruiting 의 자동화는 로보 어드바이져와 마찬가지로 시스템 구성의 성격이 더 강하다. Skill-Set 일치 비교(유사어 처리, 카테고리화), Semantic analysis, 성향 분석, Summary 등을 수행후 종합적인 Scoring 과 Summary View 를 Guidance 로 제공 등 세부 Task […]

Read more

[Ensemble] Super Learner: a Cross-validation based Stacking

Super Learner: a Cross-validation based Stacking (Paper) 1. 개요 Ensemble 은 전통적인 ML 방식과 DL 모두에서 애용되는 방법으로 보통은 ‘평균’, ‘다수결’, ‘Stacked’ 정도는 많이들 알고 사용하고 있는데 Super Learner 라는 개념을 소개하고자 함 2. Unweighted Average 신경망에서 일반적으로 많이 사용하는 방법으로 기본적으로 Deep Neural Network 가 Capacity 가 크기 때문에 간단한 평균 방법의 Ensemble 로도 많은 성능 향상이 […]

Read more

[FDS] Fraud Detection System with AutoEncoder

Create Card Fraud Detection using  AutoEncoder (Keras, Tensorflow) 1. 문제점  본 Topic 은 너무 뻔한거라서 그런가? 딱히 논문이라던지 이런게 잘 보이지 않는다.. 몇개 있는데 인용수가 0 이다. 대신에 실증적인 좋은 Blog 가 하나 보인다. 기본적으로 이러한 종류의 문제는 데이터의 불균형이 가장 큰 문제이다. 그래서 이러한 문제를 해결하기 위한 방법을 Anomaly Detection 이라고 하는데 FDS 도 마찬가지로 접근하면 […]

Read more

[Recommendation] ConvMF

Convolutional Matrix Factorization for Document Context-Aware Recommendation (Paper) (PPT) 1. 문제점  Collaborative Filtering 에서는 전통적으로 Matrix Factorization 과 같은 모델 기반의 방법론들을 사용하였다 그런데 너무 이러한 Matrix 가 Sparse 해지면서 MF 기반으로는 정확도를 보장할 수 없는 상황이 발생하게 되었다 이러한 문제들을 해결하기 위해서 최근의 연구들은 상품의 비정형적인 데이터를 활용하기 위한 방법들을 고민하였다 이러한 설명 정보를 […]

Read more