OCR 관련하여 공부를 해보고자 찾아보다가 포스코 현업에서 슬라브 번호인식 알고리즘이 포스텍에서 개발되어 적용되고 있다는 것이 문득 떠올라 위 논문을 찾아보게 되었습니다. 기존의 OCR 영역에 대한 선행 지식이 없지만, FCN 네트워크 구조를 활용하여 문자인식 분야에 적용하고 있다고 하여 FCN이 어떻게 활용되는지를 살펴보았습니다. SIN : Slab Identification Numbers 공장 환경에서는 배경이 복잡하고, SIN의 낮은 퀄리티와 공장 특성상 […]
Deep Learning Research Group
[참조 논문 및 사이트]☞Deep Learning based Recommender System: A Survey and New Perspectives ☞Reinforcement Learning to Rank in E-Commerce Search Engine:Formalization, Analysis, and Application ☞Personalizing Session-based Recommendations with Hierarchical Recurrent Neural Networks ☞Wide & Deep Learning for Recommender Systems ☞Convolutional Matrix Factorization for Document Context-Aware Recommendation ☞Deep Neural Networks for YouTube Recommendations ☞ITEM2VEC: NEURAL ITEM […]
A Simple Unified Framework for Detecting Out-of-Distribution Samples and Adversarial Attacks Preliminary 우선 Supplementary A에 대한 간단한 리뷰가 필요해 보임. Classifier는 크게 discriminative 와 generative classifier 두 가지로 나뉨. discriminative는 x가 주어졌을 때 어떤 class(y)인지 직접적으로 예측함, 즉 P(y|x). 대표적인게 softmax classifier이고 posterior distribution이 다음과 같이 정의됨. genertive classifier는 posterior distribution P(y|x) = P(x|y)P(y)/P(x)를 구하기 […]
Preprocess K+1 frames K : train Embedder [B(batch) * K, 2, C, W, H] x : frame [B * K, C, W, H] y : landmark [B * K, C, W, H] 1(t frame) : train Generator e_hat = E(x, y) x_hat = G(y_t, e_hat) r_x_hat = D(x_hat, y_t, i) r_x = D(x_t, y_t, i) LossEG […]
지난 스터디 모임에서 EXTD에 대한 논문 리뷰를 진행하다가 Convolution을 통한 upsampling 하는 방법에 대해 이야기가 나왔습니다. Unpooling, Deconvolution 등의 방법들이 있다고 설명을 드렸었지만, 자세한 방법에 대해서는 그냥 그런게 있다 정도로만 알고 있었기 때문에 짚고 넘어가고자 간단하게 정리해 보았습니다. 타 블로그, Facebook TF korea 등에서 찾은 글 / 자료를 기반으로 간단하게 작성하였습니다.(레퍼런스에 기입하지 못한 자료들에 대해서는 […]
reference paper : link code(torch) : link
참고자료 : https://www.youtube.com/watch?v=L-QYXtJmXrc http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html
Abstract 본 논문에서는 최소한의 training data를 가지고 우수한 결과를 달성하는 Deep Neural Networks(DNN)를 이용한 전이 학습(transfer learning) 기반의 markerless 추적을 위한 매우 효율적인 방법을 제안한다. 놀랍게도, 적은 수의 프레임이 라벨링된 경우에도(200개), 인간의 정확도에 필적하는 뛰어난 tracking performance을 달성한다. 1. INTRODUCTION 본 논문에서는 다양한 신체 부위의 기하학적 구성에 관심이 있다. motor control 분야에서 물리적 마커와 비디오 […]
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding (NAACL 2019)Jacob Devlin, Ming-Wei Chang, Kenton Lee, Kristina Toutanova Cloze-driven Pretraining of Self-attention Networks (arXiv 2019)Alexei Baevski, Sergey Edunov, Yinhan Liu, Luke Zettlemoyer, Michael Auli Unified Language Model Pre-training for Natural Language Understanding and Generation (arXiv 2019)Li Dong, Nan Yang, Wenhui Wang, Furu Wei, Xiaodong Liu, Yu Wang, Jianfeng […]