모두의연구소 LAB
/
자료실
/
BRS LAB 활동 (클릭)
/
MAB 문제 정의 (2)
Search
Duplicate
🎟️
MAB 문제 정의 (2)
Created
2021/07/04 08:26
일자
2021/06/19
토픽
MAB 문제 정의
토픽 상세
bandit 알고리즘
발표자
윤이화
정리자
Tags
Contextual Bandit
Gradient Bandit Algorithms
✅main
포스팅 종류
모임활동
목표
•
mab 문제정의 이해
•
bandit 알고리즘 기본 이해
학습 자료
•
Reinforcement Learning: An Introduction(chap 2) - Sutton
incompleteideas.net
•
solutions
iamhectorotero/rlai-exercises
Exercise Solutions for Reinforcement Learning: An Introduction [2nd Edition] - iamhectorotero/rlai-exercises
랩업 자료
BRS_LAB_Week4_define_mab_problem_2.pdf
1166.3KB