[머신러닝 클래스 Review - ⑧]


Reinforcement Learning


“사이언스지 선정 2016년 올해의 10대 과학 성과 3위” 에 랭크 된 구글 딥마인드 챌린지를 계기로 대중들에게 가장 유명해진 인공지능 ‘알파고’ 를 기억하시나요?

10년이 넘는 세월 동안 프로바둑 기사로 활동해왔던 이세돌 프로九단과의 매치에서 4승 1패를 거둔 인공지능이지요.

Machine learning Class의 마지막 수업인 Day8 에서는 이 알파고의 기본원리가 되는 강화학습 (Reinforcement Learning) 에 대해 배워보았습니다.

 GYM Library 를 사용하여 컴퓨터가 실제로 움직여서 학습 할 수 있는 환경을 설치한 후에 Policy Iteration, Value Iteration, Q-learning 등 다양한 방식으로 컴퓨터를 학습시켜서 출발지점부터 목표지점까지 가장 빠르게 이동하는 법을 배웠는데요, 훈련을 거듭 할수록 컴퓨터가 효율적으로 경로를 찾아내는 법을 직접 확인 할 수 있었습니다.


강화학습은 그 자체만으로도 하나의 굉장히 큰 분야이니 만큼 바로 에이아이 아카데미에서 그 기초를 쌓아보는 것은 어떨까요?