tmddno1@naver.com

Deep Learning based Recommendation Algorithms

By tmddno1@naver.com | October 3, 2019 | No Comments | Paper Study

[참조 논문 및 사이트]☞Deep Learning based Recommender System: A Survey and New Perspectives ☞Reinforcement Learning to Rank in E-Commerce Search Engine:Formalization, Analysis, and Application ☞Personalizing Session-based Recommendations with Hierarchical Recurrent Neural Networks ☞Wide & Deep Learning for Recommender Systems ☞Convolutional Matrix Factorization for Document Context-Aware Recommendation ☞Deep Neural Networks for YouTube Recommendations ☞ITEM2VEC: NEURAL ITEM […]

Transfer Learning Researches after BERT

By tmddno1@naver.com | August 29, 2019 | No Comments | Paper Study

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding (NAACL 2019)Jacob Devlin, Ming-Wei Chang, Kenton Lee, Kristina Toutanova Cloze-driven Pretraining of Self-attention Networks (arXiv 2019)Alexei Baevski, Sergey Edunov, Yinhan Liu, Luke Zettlemoyer, Michael Auli Unified Language Model Pre-training for Natural Language Understanding and Generation (arXiv 2019)Li Dong, Nan Yang, Wenhui Wang, Furu Wei, Xiaodong Liu, Yu Wang, Jianfeng […]

Fine-tune BERT for Extractive Summarization

By tmddno1@naver.com | July 19, 2019 | No Comments | Paper Study

택스트 요약에는 Abstractive 와 Extractive 두 가지 방법이 있습니다. Abstractive 방법은 본문에 없는 내용으로 재 구성하여 요약하는 방법이고, Extractive 방법은 본문에 있는 내용 중 중요한 내용을 기준으로 추출하여 내용을 요약하는 방식입니다. 이 논문에서는 Extractive 방법을 대상으로 하고 있으며, 그 중요도를 판단하는 단위도 단어가 아닌 문장단위로 판단하는 연구로 보입니다. 전체적으로 연구 방향은 BERT 에 요약을 위한 […]

A Introduction to Text summarization

By tmddno1@naver.com | April 26, 2019 | No Comments | Paper Study

포스트에서는 텍스트 요약에 대한 전반적인 내용을 다루어 보고자 한다. 텍스트의 요약이라는 것은 당연히 장문의 Document 를 함축적인 문장이나 핵심 키워드로 축약하는 기술을 의미하며, 이러한 요약 기술은 형태적인 측면에서 크게 Abstractive Summary 와 Extractive Summary 두 가지로 나누어진다고 볼 수 있다. 두 가지의 차이는 예시적으로 설명하면 아래와 같다. 주어진 Document가 있을 때 그 문장에서 가장 핵심적인 […]

Semi-Supervised Sequece Modelling with Cross-View Training

By tmddno1@naver.com | April 22, 2019 | No Comments | Paper Study

이 논문은 제목에서 확인 할 수 있는 것과 같이, Semi-Supervised Learning 관한 연구이며, 특히 자연어 처리 쪽에 어떻게 효과적으로 이 기법을 적용할 것인지에 초점을 맞추고 있다. 이 논문에서는 Unsupervised 형태로 Pretrained Model 을 만든 후 , 기존 모델에 활용하는 Word2Vec이나 ElMo 같은 알고리즘을 Semi supervised 의 한 형태로 정의하고 있으며, 이러한 방법의 문제로 Labeled 된 […]

IMPORTANT NATURAL LANGUAGE PROCESSING (NLP) RESEARCH PAPERS OF 2018

By tmddno1@naver.com | April 22, 2019 | No Comments | Paper Study

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding Sequence Classification with Human Attention Phrase-Based & Neural Unsupervised Machine Translation What you can cram into a single vector: Probing sentence embeddings for linguistic properties SWAG: A Large-Scale Adversarial Dataset for Grounded Commonsense Inference Deep contextualized word representations Meta-Learning for Low-Resource Neural Machine Translation Linguistically-Informed Self-Attention […]

Bagging, Boosting and Stacking

By tmddno1@naver.com | April 7, 2019 | No Comments | Paper Study

본 포스트에서는 Bagging, Boosting 그리고 Stacking 기법이 무엇인지, 그리고 각 기법을 사용하는 대표적인 알고리즘들 Random Forest, AdaBoost, Gradient Boost 그리고 요즘 Kaggle Ranker 들이 묻지도 따지지도 않고 사용하는 XgBoost 등에 대해서 설명하고자 한다. 1. Bias & Variance Bagging 및 Boosting 을 설명하기 위해서는 사전에 머신러닝에서 이야기 하는 Error 가 Bias 와 Variance로 구성되어 있으며, 각 […]

Customer Shopping Pattern Prediction:A Recurrent Neural Network Approach

By tmddno1@naver.com | March 16, 2019 | No Comments | Paper Study

이 논문의 핵심은 고객 마케팅 분석시 흔히 사용하는 RFM(Receny, Frequency, Monetary) 기반의 분석 방법과 Deep Learning 에서 시계열에 효과적이라고 알려진 RNN 을 접목하는 아이디어로 시작한다. 기존에도 마케팅 모델에 Deep Deep Learning을 적용하고자 하는 연구는 있었지만, Fully Connected Network 형태로 활용하여, 시간을 독립적인 인풋 데이터로 활용하였다는 한계가 있다. 그래서 RNN 을 적용해 보겠다는 이야기. Iput 은 […]

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

By tmddno1@naver.com | December 9, 2018 | No Comments | Paper Study

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding (Paper) Jacob Devlin Ming-Wei Chang Kenton Lee Kristina Toutanova Google AI Language 1. 서론 기존의 자연어 처리 모델은 Specific Task 모델을 Inital State 에서 부터 훈련하기 위한 형태로 접근하였다. 이러한 접근 방법의 문제는 여러가지가 있겠지만, 목적별로 많은 훈련 데이터를 확보해야만 한다는 것이 가장 큰 문제일 것이다. […]

[크롤링] 금융 정보 수집 방법

By tmddno1@naver.com | November 7, 2018 | No Comments | DeepTendency

Python 을 활용한 금융 데이터 수집 예제 Google Colaboratory Source: bit.ly/2qvlSqJ 경제, 금융투자 주요 사이트와 데이터 한국거래소 http://krx.co.kr 전자공시 http://dart.fss.or.kr 한국은행 http://www.bok.or.kr http://www.bokeducation.or.kr/ 한국은행 경제교육 KDI 한국개발연구원 http://www.kdi.re.kr http://lib.kdi.re.kr/nonRelation/statDomestic 경제, 정치, 사회, 외교 보고서 논문 코트라 글로벌 뉴스 http://news.kotra.or.kr/kotranews/index.do – 해외시장뉴스 수출, 무역 보고서 ICT 통계포털 http://itstat.go.kr IT, ICT 분야 통계 한국신용평가 기업정보 http://www.kisline.com/ 한신평에서 제공하는 기업정보 […]

Author: tmddno1@naver.com