Search
Duplicate

Policy

토픽 상세
구분
policy module
발표담당
오상곤
발표자료
(Review) A_contextual_Bandit_Approach_to_Personalized_News_Article_Recommendation.pdf
실습담당
강석우, 김정우
주차
3주차(11/6)
랩업자료
BRS_LAB_2_Week3_personalized_news_recommendation_off_policy_evaluation.pdf
자료2
A Contextual-Bandit Approach to Personalized News Article Recommendation 리뷰
context free policy: epsilon-greedy, ucb, bernoulli-TS 이해
contexual bandit poliy: LinUCB 이해
실습
OBP 라이브러리를 활용해서 epsilon-greedy, UCB, bernoulli-TS, LinUCB 돌려보기 (2명이 각 2개 라이브러리)
obp_policy_practice.ipynb
115.4KB