Super Learner: a Cross-validation based Stacking (Paper) 1. 개요 Ensemble 은 전통적인 ML 방식과 DL 모두에서 애용되는 방법으로 보통은 ‘평균’, ‘다수결’, ‘Stacked’ 정도는 많이들 알고 사용하고 있는데 Super Learner 라는 개념을 소개하고자 함 2. Unweighted Average 신경망에서 일반적으로 많이 사용하는 방법으로 기본적으로 Deep Neural Network 가 Capacity 가 크기 때문에 간단한 평균 방법의 Ensemble 로도 많은 성능 향상이 […]
Create Card Fraud Detection using AutoEncoder (Keras, Tensorflow) 1. 문제점 본 Topic 은 너무 뻔한거라서 그런가? 딱히 논문이라던지 이런게 잘 보이지 않는다.. 몇개 있는데 인용수가 0 이다. 대신에 실증적인 좋은 Blog 가 하나 보인다. 기본적으로 이러한 종류의 문제는 데이터의 불균형이 가장 큰 문제이다. 그래서 이러한 문제를 해결하기 위한 방법을 Anomaly Detection 이라고 하는데 FDS 도 마찬가지로 접근하면 […]
Convolutional Matrix Factorization for Document Context-Aware Recommendation (Paper) (PPT) 1. 문제점 Collaborative Filtering 에서는 전통적으로 Matrix Factorization 과 같은 모델 기반의 방법론들을 사용하였다 그런데 너무 이러한 Matrix 가 Sparse 해지면서 MF 기반으로는 정확도를 보장할 수 없는 상황이 발생하게 되었다 이러한 문제들을 해결하기 위해서 최근의 연구들은 상품의 비정형적인 데이터를 활용하기 위한 방법들을 고민하였다 이러한 설명 정보를 […]