标题 |
![]() 多臂强盗问题的O(log n)后悔基于样本均值的指数策略
相关领域
后悔
数学
上下界
常量(计算机编程)
指数函数
多武装匪徒
Kullback-Leibler散度
索引(排版)
贝叶斯概率
数学优化
时间范围
应用数学
组合数学
统计
数学分析
计算机科学
万维网
程序设计语言
|
网址 | |
DOI | |
其它 |
期刊:Advances in Applied Probability 作者:Rajeev Agrawal 出版日期:1995-12-01 |
求助人 | |
下载 | 求助已完成,仅限求助人下载。 |
温馨提示:该文献已被科研通 学术中心 收录,前往查看
科研通『学术中心』是文献索引库,收集文献的基本信息(如标题、摘要、期刊、作者、被引量等),不提供下载功能。如需下载文献全文,请通过文献求助获取。
|