Online Learning and Decision-Making under Generalized Linear Model with High-Dimensional Data

估计员 极小极大 后悔 维数(图论) 数学优化 数学 Lasso(编程语言) 水准点(测量) 计算机科学 甲骨文公司 线性模型 算法 统计 组合数学 地理 万维网 软件工程 大地测量学
作者
Xue Wang,Mike Mingcheng Wei,Tao Yao
出处
期刊:Cornell University - arXiv 被引量:2
标识
DOI:10.48550/arxiv.1812.02962
摘要

We propose a minimax concave penalized multi-armed bandit algorithm under generalized linear model (G-MCP-Bandit) for a decision-maker facing high-dimensional data in an online learning and decision-making process. We demonstrate that the G-MCP-Bandit algorithm asymptotically achieves the optimal cumulative regret in the sample size dimension T , O(log T), and further attains a tight bound in the covariate dimension d, O(log d). In addition, we develop a linear approximation method, the 2-step weighted Lasso procedure, to identify the MCP estimator for the G-MCP-Bandit algorithm under non-iid samples. Under this procedure, the MCP estimator matches the oracle estimator with high probability and converges to the true parameters with the optimal convergence rate. Finally, through experiments based on synthetic data and two real datasets (warfarin dosing dataset and Tencent search advertising dataset), we show that the G-MCP-Bandit algorithm outperforms other benchmark algorithms, especially when there is a high level of data sparsity or the decision set is large.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
米花完成签到 ,获得积分10
1秒前
closer发布了新的文献求助10
1秒前
科研通AI5应助xy9147采纳,获得10
1秒前
2秒前
3秒前
3秒前
雪花完成签到 ,获得积分10
3秒前
3秒前
顺利的爆米花完成签到 ,获得积分10
4秒前
张博士完成签到,获得积分10
4秒前
NexusExplorer应助冯晓潮采纳,获得10
5秒前
fanfan发布了新的文献求助10
6秒前
墨薄凉完成签到,获得积分10
6秒前
JamesPei应助COY66采纳,获得10
6秒前
天天飞人完成签到,获得积分10
7秒前
7秒前
7秒前
LHL发布了新的文献求助10
7秒前
科研通AI5应助wmq采纳,获得10
7秒前
xy发布了新的文献求助10
8秒前
砰砰发布了新的文献求助10
8秒前
张博士发布了新的文献求助10
9秒前
dbhjcncsv完成签到,获得积分10
10秒前
星辰大海应助戚薇采纳,获得10
10秒前
11秒前
隐形曼青应助吴世宇采纳,获得10
11秒前
hq完成签到 ,获得积分10
11秒前
A班袁湘琴完成签到 ,获得积分10
12秒前
13秒前
doudou发布了新的文献求助10
14秒前
洁净的代容完成签到,获得积分10
15秒前
科研通AI5应助鱼鱼鱼采纳,获得10
17秒前
Dragon完成签到,获得积分10
17秒前
17秒前
17秒前
17秒前
韭酱发布了新的文献求助30
17秒前
18秒前
英俊的铭应助砰砰采纳,获得10
18秒前
高分求助中
Les Mantodea de Guyane Insecta, Polyneoptera 2500
Mobilization, center-periphery structures and nation-building 600
Technologies supporting mass customization of apparel: A pilot project 600
Introduction to Strong Mixing Conditions Volumes 1-3 500
China—Art—Modernity: A Critical Introduction to Chinese Visual Expression from the Beginning of the Twentieth Century to the Present Day 430
Multichannel rotary joints-How they work 400
Tip60 complex regulates eggshell formation and oviposition in the white-backed planthopper, providing effective targets for pest control 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3796325
求助须知:如何正确求助?哪些是违规求助? 3341295
关于积分的说明 10306023
捐赠科研通 3057851
什么是DOI,文献DOI怎么找? 1677972
邀请新用户注册赠送积分活动 805721
科研通“疑难数据库(出版商)”最低求助积分说明 762775