본 게시판의 내용은 Reinforcement Learning(RL, 강화학습)에 대해서 공부를 해보고자 정리를 하기 위해서 작성하는 내용입니다.
100% 완벽하게 이해하기도 힘들 것이고 (ai비전공자라ㅠㅠ), 얼마나 잘 활용할 수 있을지 몰라도 RL에 대해서 나름 정리해보고 차후에 복습할 때는 대비해서 나름 '공부노트' 형식으로 정리하고자 합니다.
실수나 잘못되어 있는 부분이 있으면 지적 바랍니다.
본 게시물들은 DeepMind의 수석연구자이자 University College London의 교수로 재직중인 David Silver 교수의 강화학습 강의와 이를 기반으로 친절히 설명해주는 유투브 팡요랩의 설명을 기반으로 하고 있습니다.
UCL의 David Silver 교수의 강의 링크에 가보면 동영상와 Lecture note를 모두 접근할 수 있습니다.
해당 강의 내용은 CC-NY-NC 4.0 라이센스 규정을 따르고 있으며, 일부 콘텐츠는 타사에서 제공하며 라이센스에 포함되지 않습니다.
<David Silver. (2015). Lectures on Reinforcement Learning. Available from https://www.davidsilver.uk/teaching/ >
David Silver 교수님의 강의는 총 10강으로, 유튜브 채널에서 확인할 수 있으며, 각 강의 주제는 아래와 같습니다.
Lecture 1: Introduction to Reinforcement Learning
Lecture 2: Markov Decision Processes
Lecture 3: Planning by Dynamic Programming
Lecture 4: Model-Free Prediction
Lecture 6: Value Function Approximation
Lecture 7: Policy Gradient Methods
Lecture 8: Integrating Learning and Planning
Lecture 9: Exploration and Exploitation
Lecture 10: Case Study: RL in Classic Games
앞으로 하나씩 공부해보면서 게시물을 작성 하겠지만, 별도의 언급이 되어 있지 않더라도, 위에 언급한대로 내용의 출처는 David Silver 교수님의 강의 내용과 팡요랩 유투브 채널을 참고 하였음을 알려드립니다.
(아.. 얼마나 공부를 잘하고.. 잘 정리를 할 수 있을지 벌써부터 걱정이네요...^^;;; 공부를 함 해보자 맘은 먹었지만 제대로 될지..ㅎㅎ)
댓글