Author: Jihyun Chae

Evolution Strategies as a Scalable Alternative to Reinforcement Learning

OpenAI에서 2017년 발표한 본 논문에서는 Qlearning과 Policy Gradients와 같은 MDP 기반 RL 기법의 대안으로 블랙박스 최적화 알고리즘의 클래스인 Evolution Strategies (ES)의 사용을 탐구한다. Evolution Strategies– Evolution Strategies (ES)는 자연 진화에 영감을 받은 heuristic 검색 절차인 블랙 박스 최적화 알고리즘 [Rechenberg and Eigen, 1973, Schwefel, 1977]의 클래스– 모든 반복( “세대”)에서 매개 변수 벡터의 모집단( “유전형”)이 교란( […]

Read more

Mastering the Game of Go without Human Knowledge (AlphaGo Zero)

ABSTRACT Alphago Zero는 인간의 데이터를 빼고 강화 학습만을 기반으로 하여 압도적인 성능을 이끌어내어 이세돌과 대국하였던 Alphago Lee를 상대로 100 : 0 으로 승리하였다. Alphago Lee simple review b-1. Policy network -> 선택의 너비를 줄여주는 network : 확률분포를 리턴한다.b-2. Value network -> 선택의 깊이를 줄여주는 network : 상수를 리턴한다. a-1. Rollout policy -> 빠른 시뮬레이션을 위한 […]

Read more

Markerless tracking of user-defined features with deep learning

Abstract 본 논문에서는 최소한의 training data를 가지고 우수한 결과를 달성하는 Deep Neural Networks(DNN)를 이용한 전이 학습(transfer learning) 기반의 markerless 추적을 위한 매우 효율적인 방법을 제안한다. 놀랍게도, 적은 수의 프레임이 라벨링된 경우에도(200개), 인간의 정확도에 필적하는 뛰어난 tracking performance을 달성한다. 1. INTRODUCTION 본 논문에서는 다양한 신체 부위의 기하학적 구성에 관심이 있다. motor control 분야에서 물리적 마커와 비디오 […]

Read more