모두의연구소 LAB
/
BRS LAB
/
📢 LAB 주차별 활동
/
MAB 문제정의
Search
Duplicate
MAB 문제정의
토픽 상세
(1) bandit 문제 정의
구분
MAB 개괄
발표담당
홍석진
자료
Reinforcement Learning: An Introduction(chap 2) -Sutton
발표자료
MAB_2_2.5_홍석진.pdf
실습담당
조수호
주차
3주차(6/12)
랩업자료
BRS_LAB_Week3_define_mab_problem_1.pdf
자료2
Empty
목표
•
mab 문제정의 이해
◦
learner, action, reward, environment 정의
학습 자료
•
Reinforcement Learning: An Introduction(chap 2) - Sutton
•
2.5
절까지 학습
incompleteideas.net
•
solutions
iamhectorotero/rlai-exercises
Exercise Solutions for Reinforcement Learning: An Introduction [2nd Edition] - iamhectorotero/rlai-exercises
Q & A
이혜진
김준호
조수호
강석우
김민수
홍성환
조현재
정한길
홍석진
김정우
최정
김윤경
윤이화
배수만
김강민