///
Search
Duplicate
🚘

MAB 문제 정의 (1)

Created
2021/07/04 08:19
일자
2021/06/12
토픽
MAB 문제 정의
토픽 상세
bandit 문제 정의
발표자
홍석진
정리자
조수호
Tags
k-armed bandit
MAB
✅main
포스팅 종류
모임활동

목표

mab 문제정의 이해
learner, action, reward, environment 정의

학습 자료

Reinforcement Learning: An Introduction(chap 2) - Sutton
2.5절까지 학습
solutions

발표 자료

MAB_2_2.5_홍석진.pdf
771.6KB

랩업 자료

BRS_LAB_Week3_define_mab_problem_1.pdf
1357.0KB