Search
Duplicate

MAB 개괄

토픽 상세
MAB 실서비스 적용 이해
구분
발표담당
김윤경
발표자료
Thompson Sampling_Multi Armed Bandit.pdf
2018-11_-_qcon_artwork_personalization_talk.pdf
Bandit based 추천시스템.pdf
MAB.pdf
실습담당
김강민
주차
2주차(6/5)
랩업자료
neflix_artwork.pdf
자료2

목표

mab 실서비스 적용 맛보기
각자 도메인에서 mab 적용 가능 영역 생각해보기 → LAB 목표 구체화

학습 자료

Netflix artwork personalization slide (main)
Netflix artwork personalization

Q & A

이혜진
김준호
조수호
강석우
김민수
홍성환
조현재
정한길
홍석진
김정우
최정
김윤경
윤이화
배수만
김강민
1. context 정의? - context feature x의 형태 2. 데이터 사이즈 - contextual bandits의 cons 중 많은 데이터가 필요한 이유? - reward가 1 >> reward가 0일 텐데, 어느 정도의 데이터가 신뢰할만한가? 3. regret - minimizing regret 과 maximize reward가 동일한 개념인가? 4. metric - replay말고 다른 지표가 있는지?
Plain Text