Search
Duplicate

MAB 문제정의

토픽 상세
(1) bandit 문제 정의
구분
MAB 개괄
발표담당
홍석진
발표자료
MAB_2_2.5_홍석진.pdf
실습담당
조수호
주차
3주차(6/12)
랩업자료
BRS_LAB_Week3_define_mab_problem_1.pdf
자료2
Empty

목표

mab 문제정의 이해
learner, action, reward, environment 정의

학습 자료

Reinforcement Learning: An Introduction(chap 2) - Sutton
2.5절까지 학습
solutions

Q & A

이혜진
김준호
조수호
강석우
김민수
홍성환
조현재
정한길
홍석진
김정우
최정
김윤경
윤이화
배수만
김강민