온라인 강의

강화학습 2 (policy gradient)

강의수5강 학습자수307명 수강평4.8/5(총 5명)

강좌정보 테이블
학습내용	1. 강화학습의 Policy Gradient 기반 방법론에 대해 알아봅니다. 2. REINFORCE, Actor-Critic 등 간단한 Policy Gradient 기반 에이전트 구현 방법에 대해 학습합니다.
학습대상	MDP, Reward, Value 등 강화학습 기초 개념을 이해하고 있으신 분 * 강화학습의 기초 개념에 대한 이해가 부족하신 분은 아래 과정을 먼저 학습하시길 추천합니다. ▶ 강화학습 입문하기 : https://tacademy.skplanet.com/live/player/onlineLectureDetail.action?seq=163 <실습환경> * 본 세미나는 구글 콜랩에서 진행되었습니다. * 구글 콜랩 사용이 익숙하지 않으신 분은 아래 과정을 먼저 학습하시길 추천합니다. ▶Colab 사용환경 준비 : https://tacademy.skplanet.com/live/player/onlineLectureDetail.action?seq=157 * 본 강의는 2019. 11. 21(목)에 진행된 제64차 토크ON세미나 동영상입니다.
강사	노승은 엔씨소프트
학습기간	수강신청일로부터 30일
이수기준	진도 100% 완료

강의목록 테이블
강의 차수명	강의시간	진도율
[1강] 강화학습 기초 Review - MDP, Value, Policy, 벨만 방정식, MC, TD	41분	0%
[2강] Policy Gradient I - 개요	39분	0%
[3강] Policy Gradient II - REINFORCE 실습	36분	0%
[4강] Policy Gradient III - Vanilla Actor Critic	33분	0%
[5강] Policy Gradient 구현 IV - Vanilla Actor Critic 실습	23분	0%
▶ 강의자료
▶ 사전 학습자료