강화학습 2 (policy gradient)

강의수5강 학습자수307명 수강평4.8/5(총 5명)

  • 학습안내
  • 강의목록
  • 토론방

강좌정보

강좌정보 테이블
학습내용 1. 강화학습의 Policy Gradient 기반 방법론에 대해 알아봅니다.
2. REINFORCE, Actor-Critic 등 간단한 Policy Gradient 기반 에이전트 구현 방법에 대해 학습합니다.
학습대상 MDP, Reward, Value 등 강화학습 기초 개념을 이해하고 있으신 분
* 강화학습의 기초 개념에 대한 이해가 부족하신 분은 아래 과정을 먼저 학습하시길 추천합니다.
 ▶ 강화학습 입문하기 : https://tacademy.skplanet.com/live/player/onlineLectureDetail.action?seq=163

<실습환경>
* 본 세미나는 구글 콜랩에서 진행되었습니다. 
* 구글 콜랩 사용이 익숙하지 않으신 분은 아래 과정을 먼저 학습하시길 추천합니다.
 ▶Colab 사용환경 준비 : https://tacademy.skplanet.com/live/player/onlineLectureDetail.action?seq=157 


* 본 강의는 2019. 11. 21(목)에 진행된 제64차 토크ON세미나 동영상입니다.
강사 노승은 엔씨소프트
학습기간 수강신청일로부터 30일
이수기준 진도 100% 완료

강의목록 테이블
강의 차수명 강의시간 진도율 학습하기 학습자료
[1강] 강화학습 기초 Review - MDP, Value, Policy, 벨만 방정식, MC, TD 41분 0%
[2강] Policy Gradient I - 개요 39분 0%
[3강] Policy Gradient II - REINFORCE 실습 36분 0%
[4강] Policy Gradient III - Vanilla Actor Critic 33분 0%
[5강] Policy Gradient 구현 IV - Vanilla Actor Critic 실습 23분 0%
▶ 강의자료
▶ 사전 학습자료

페이스북 서비스

  • T아카데미 페이스북
  • Smartteen AppClub 페이스북
  • SK플래닛 페이스북
  • SK플래닛 기술블로그
  • 멘토링