Loading...

Deep Learning Research Group

Recognition of Slab Identification Numbers using a Fully Convolutional Network

OCR 관련하여 공부를 해보고자 찾아보다가 포스코 현업에서 슬라브 번호인식 알고리즘이 포스텍에서 개발되어 적용되고 있다는 것이 문득 떠올라 위 논문을 찾아보게 되었습니다. 기존의 OCR 영역에 대한 선행 지식이 없지만, FCN 네트워크 구조를 활용하여 문자인식 분야에 적용하고 있다고 하여 FCN이 어떻게 활용되는지를 살펴보았습니다. SIN : Slab Identification Numbers 공장 환경에서는 배경이 복잡하고, SIN의 낮은 퀄리티와 공장 특성상 […]

Read more

Deep Learning based Recommendation Algorithms

[참조 논문 및 사이트]☞Deep Learning based Recommender System: A Survey and New Perspectives ☞Reinforcement Learning to Rank in E-Commerce Search Engine:Formalization, Analysis, and Application ☞Personalizing Session-based Recommendations with Hierarchical Recurrent Neural Networks ☞Wide & Deep Learning for Recommender Systems ☞Convolutional Matrix Factorization for Document Context-Aware Recommendation ☞Deep Neural Networks for YouTube Recommendations ☞ITEM2VEC: NEURAL ITEM […]

Read more

Generative Classifier for Detecting Out-of-Distribution and for handling noisy lables

A Simple Unified Framework for Detecting Out-of-Distribution Samples and Adversarial Attacks Preliminary 우선 Supplementary A에 대한 간단한 리뷰가 필요해 보임. Classifier는 크게 discriminative 와 generative classifier 두 가지로 나뉨. discriminative는 x가 주어졌을 때 어떤 class(y)인지 직접적으로 예측함, 즉 P(y|x). 대표적인게 softmax classifier이고 posterior distribution이 다음과 같이 정의됨. genertive classifier는 posterior distribution P(y|x) = P(x|y)P(y)/P(x)를 구하기 […]

Read more

Few-Shot Adversarial Learning of Realistic Neural Talking Head Models

Preprocess K+1 frames K : train Embedder [B(batch) * K, 2, C, W, H] x : frame [B * K, C, W, H] y : landmark [B * K, C, W, H] 1(t frame) : train Generator e_hat = E(x, y) x_hat = G(y_t, e_hat) r_x_hat = D(x_hat, y_t, i) r_x = D(x_t, y_t, i) LossEG […]

Read more

Upsampling: unpooling, deconvolution, transposed convolution

지난 스터디 모임에서 EXTD에 대한 논문 리뷰를 진행하다가 Convolution을 통한 upsampling 하는 방법에 대해 이야기가 나왔습니다. Unpooling, Deconvolution 등의 방법들이 있다고 설명을 드렸었지만, 자세한 방법에 대해서는 그냥 그런게 있다 정도로만 알고 있었기 때문에 짚고 넘어가고자 간단하게 정리해 보았습니다. 타 블로그, Facebook TF korea 등에서 찾은 글 / 자료를 기반으로 간단하게 작성하였습니다.(레퍼런스에 기입하지 못한 자료들에 대해서는 […]

Read more

EXTD: Extremely Tiny Face Detector via Iterative Filter Reuse

reference paper : link code(torch) : link

Read more

Proximal Policy Optimization Algorithms

참고자료 : https://www.youtube.com/watch?v=L-QYXtJmXrc http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html

Read more

eXplainable AI (XAI)

Read more

Markerless tracking of user-defined features with deep learning

Abstract 본 논문에서는 최소한의 training data를 가지고 우수한 결과를 달성하는 Deep Neural Networks(DNN)를 이용한 전이 학습(transfer learning) 기반의 markerless 추적을 위한 매우 효율적인 방법을 제안한다. 놀랍게도, 적은 수의 프레임이 라벨링된 경우에도(200개), 인간의 정확도에 필적하는 뛰어난 tracking performance을 달성한다. 1. INTRODUCTION 본 논문에서는 다양한 신체 부위의 기하학적 구성에 관심이 있다. motor control 분야에서 물리적 마커와 비디오 […]

Read more

Transfer Learning Researches after BERT

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding (NAACL 2019)Jacob Devlin, Ming-Wei Chang, Kenton Lee, Kristina Toutanova Cloze-driven Pretraining of Self-attention Networks (arXiv 2019)Alexei Baevski, Sergey Edunov, Yinhan Liu, Luke Zettlemoyer, Michael Auli Unified Language Model Pre-training for Natural Language Understanding and Generation (arXiv 2019)Li Dong, Nan Yang, Wenhui Wang, Furu Wei, Xiaodong Liu, Yu Wang, Jianfeng […]

Read more