Day: July 17, 2019

Asynchronous Methods for Deep reinforcement Learning

이번것은 엄청 실용적이고, 이해하기도 쉬운데, 성능도 잡은 논문 https://docs.google.com/presentation/d/1rCkMg7eslTOM3TJxAS6g6Iyqk1Spe0AxZmqJDTAZcuw/edit?usp=sharing 출저 : 팡요랩

Read more

Trust Region Policy Optimization

완전히 어려운 수학적 베이스의 이론적인 논문 이제 시작합니다. https://docs.google.com/presentation/d/1-HM5f0vGbXYLxN3k85BxZiteCUsrL2VsPGS9KY18sxk/edit?usp=sharing 출처 : youtube 팡요랩

Read more