강화학습 2 (policy gradient)
강의수
5강
학습자수
307명
수강평
4.8/5
(총 5명)
수강신청 >
평점/리뷰 >
학습안내
강의목록
토론방
페이스북
강좌정보
강좌정보 테이블
학습내용
1. 강화학습의 Policy Gradient 기반 방법론에 대해 알아봅니다.
2. REINFORCE, Actor-Critic 등 간단한 Policy Gradient 기반 에이전트 구현 방법에 대해 학습합니다.
학습대상
MDP, Reward, Value 등 강화학습 기초 개념을 이해하고 있으신 분
* 강화학습의 기초 개념에 대한 이해가 부족하신 분은 아래 과정을 먼저 학습하시길 추천합니다.
▶ 강화학습 입문하기 : https://tacademy.skplanet.com/live/player/onlineLectureDetail.action?seq=163
<실습환경>
* 본 세미나는 구글 콜랩에서 진행되었습니다.
* 구글 콜랩 사용이 익숙하지 않으신 분은 아래 과정을 먼저 학습하시길 추천합니다.
▶Colab 사용환경 준비 : https://tacademy.skplanet.com/live/player/onlineLectureDetail.action?seq=157
* 본 강의는 2019. 11. 21(목)에 진행된 제64차 토크ON세미나 동영상입니다.
강사
노승은 엔씨소프트
학습기간
수강신청일로부터 30일
이수기준
진도 100% 완료
강의목록 테이블
강의 차수명
강의시간
진도율
학습하기
학습자료
[1강] 강화학습 기초 Review - MDP, Value, Policy, 벨만 방정식, MC, TD
41분
0%
재생
[2강] Policy Gradient I - 개요
39분
0%
재생
[3강] Policy Gradient II - REINFORCE 실습
36분
0%
재생
[4강] Policy Gradient III - Vanilla Actor Critic
33분
0%
재생
[5강] Policy Gradient 구현 IV - Vanilla Actor Critic 실습
23분
0%
재생
▶ 강의자료
다운로드
▶ 사전 학습자료
다운로드
과정목록보기
페이스북 서비스