모두의연구소 LAB
/
자료실
/
BRS LAB 활동 (클릭)
/
MAB 문제 정의 (1)
Search
Duplicate
🚘
MAB 문제 정의 (1)
Created
2021/07/04 08:19
일자
2021/06/12
토픽
MAB 문제 정의
토픽 상세
bandit 문제 정의
발표자
홍석진
정리자
조수호
Tags
k-armed bandit
MAB
✅main
포스팅 종류
모임활동
목표
•
mab 문제정의 이해
◦
learner, action, reward, environment 정의
학습 자료
•
Reinforcement Learning: An Introduction(chap 2) - Sutton
•
2.5
절까지 학습
incompleteideas.net
•
solutions
iamhectorotero/rlai-exercises
Exercise Solutions for Reinforcement Learning: An Introduction [2nd Edition] - iamhectorotero/rlai-exercises
발표 자료
MAB_2_2.5_홍석진.pdf
771.6KB
랩업 자료
BRS_LAB_Week3_define_mab_problem_1.pdf
1357.0KB