Author: seonguk

cpnet: Learning video representations from correspondence proposals

arxiv, code 이 논문에서는 Video의 Representation을 어떻게 잘 학습할 것인가에 대한 연구를 수행하였습니다. Long-range한 시퀀스에서의 모션 정보를 어떻게 모델에 반영할 것인가에 대해 고민한 것으로 보입니다. k-nn 을 적용하여 다른 시점(frame)의 대응하는 후보(Correspondence Proposals)를 선정하고 네트워크는 이러한 대응 관계를 잘 표현하기 위해서 feature를 어떻게 표현해야 하는가에 대해 학습하게 됩니다. 논문을 보면서, 큰 틀에서는 NL Net (Non-local […]

Read more

Human Pose Detection / Estimation

사람의 Pose를 추정하는 문제 영역에 대해서 많은 연구가 이루어 지고 있습니다. 사람의 Pose는 이미지 내에서 특정 관절(예로 좌/우 어깨, 좌우 무릎, 허리, 손목 목, 팔꿈치 등) 등의 위치를 추정하는 것으로 2D 좌표에서 3D 좌표를 찾아내거나, 기존의 Top-Down 방식에서 Bottom-up 방식으로의 기술이 발전되고 있습니다. Top-down: 영상에서 사람을 Detection한 후, Bounding box 내부에서 포즈를 추정하는 방식으로, 별도의 […]

Read more

Few-shot object detection via feature reweighting

Paper, Notion 이 논문에서는 기존 Object Detection 알고리즘(YOLOv2 기반)의 기존 Base classes 외의 신규 Novel classes에 대해서 Few shot learning을 통해 적은 데이터로 신규 Object에 대해 Detection 하는 방법을 제안한다. 3. Approach 3.1. Feature Reweighting for Detection 아키텍쳐는 위 그림과 같다. 주어진 입력 I 에 대해서 feature extractor D를 통해 Meta features F 를 추출한다.F […]

Read more

Character Region Awareness for Text Detection

paper, Github Naver Clova 팀에서 올해 4월에 공개한 OCR 논문입니다. 이 논문의 저자는 OCR 영역에서 Localization 쪽에 초점을 두어 연구를 수행하였고, 글자가 curve / arbitrary shape / extremely long 한 경우에도 글자 영역을 잘 찾아 낼 수 있는 방법을 제안합니다. 1. Introduction 기존에 수행되었던 많은 OCR 방법들은 word-level의 Bounding Box의 위치를 찾기위해서 네트워크를 활용한다. 하지만 […]

Read more

Recognition of Slab Identification Numbers using a Fully Convolutional Network

OCR 관련하여 공부를 해보고자 찾아보다가 포스코 현업에서 슬라브 번호인식 알고리즘이 포스텍에서 개발되어 적용되고 있다는 것이 문득 떠올라 위 논문을 찾아보게 되었습니다. 기존의 OCR 영역에 대한 선행 지식이 없지만, FCN 네트워크 구조를 활용하여 문자인식 분야에 적용하고 있다고 하여 FCN이 어떻게 활용되는지를 살펴보았습니다. SIN : Slab Identification Numbers 공장 환경에서는 배경이 복잡하고, SIN의 낮은 퀄리티와 공장 특성상 […]

Read more

Upsampling: unpooling, deconvolution, transposed convolution

지난 스터디 모임에서 EXTD에 대한 논문 리뷰를 진행하다가 Convolution을 통한 upsampling 하는 방법에 대해 이야기가 나왔습니다. Unpooling, Deconvolution 등의 방법들이 있다고 설명을 드렸었지만, 자세한 방법에 대해서는 그냥 그런게 있다 정도로만 알고 있었기 때문에 짚고 넘어가고자 간단하게 정리해 보았습니다. 타 블로그, Facebook TF korea 등에서 찾은 글 / 자료를 기반으로 간단하게 작성하였습니다.(레퍼런스에 기입하지 못한 자료들에 대해서는 […]

Read more

EXTD: Extremely Tiny Face Detector via Iterative Filter Reuse

reference paper : link code(torch) : link

Read more

Learning Deep Representations of Appearance and Motion for Anomalous Event Detection

Dan Xu, Elisa Ricci, Yan Yan, Jingkuan Song, Nicu Sebe, BMVC in 2015. (paper) 고찰 거의 최초로 딥러닝을 활용한 Video의 Anormaly Activities Detection 문제에 시도한 논문으로 합리적이고 괜찮은 듯함. Auto Encoder 학습에 pre-train / fine-tuning, SVM 학습, 가중치 학습 등 전체 과정이 End-to-End 학습이 되지 않는 듯 함 –> 적절한 대안을 찾으면 Contribution 가능할 듯. […]

Read more

AnoGAN

blog link, paper 이 논문은 DCGAN을 활용하여 정상 데이터만으로 Anomaly를 검출하는 논문입니다.

Read more

Focal Loss for Dense Object Detection

[Paper] Focal Loss for Dense Object Detection(2017) Contents 이 논문은 일반적으로 Object Detection 영역에서 Classification 부분에 해당하는 Loss Function을 설정할 때 사용되는 Cross-entropy에 대한 간단한 변형인 Focal Loss를 제안함으로써 Object Detection Algorithm의 성능을 향상시키는 방법을 소개합니다.

Read more