亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

A Semiparametric Inverse Reinforcement Learning Approach to Characterize Decision Making for Mental Disorders

灵敏度(控制系统) 概率逻辑 统计推断 参数统计 推论 估计员 心理学 强化学习 人工智能 机器学习 计算机科学 计量经济学 数学 统计 电子工程 工程类
作者
Xingche Guo,Donglin Zeng,Yuanjia Wang
标识
DOI:10.1080/01621459.2023.2261184
摘要

Major depressive disorder (MDD) is one of the leading causes of disability-adjusted life years. Emerging evidence indicates the presence of reward processing abnormalities in MDD. An important scientific question is whether the abnormalities are due to reduced sensitivity to received rewards or reduced learning ability. Motivated by the probabilistic reward task (PRT) experiment in the EMBARC study, we propose a semiparametric inverse reinforcement learning (RL) approach to characterize the reward-based decision-making of MDD patients. The model assumes that a subject’s decision-making process is updated based on a reward prediction error weighted by the subject-specific learning rate. To account for the fact that one favors a decision leading to a potentially high reward, but this decision process is not necessarily linear, we model reward sensitivity with a nondecreasing and nonlinear function. For inference, we estimate the latter via approximation by I-splines and then maximize the joint conditional log-likelihood. We show that the resulting estimators are consistent and asymptotically normal. Through extensive simulation studies, we demonstrate that under different reward-generating distributions, the semiparametric inverse RL outperforms the parametric inverse RL. We apply the proposed method to EMBARC and find that MDD and control groups have similar learning rates but different reward sensitivity functions. There is strong statistical evidence that reward sensitivity functions have nonlinear forms. Using additional brain imaging data in the same study, we find that both reward sensitivity and learning rate are associated with brain activities in the negative affect circuitry under an emotional conflict task. Supplementary materials for this article are available online.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
科研通AI2S应助科研通管家采纳,获得10
38秒前
Criminology34应助科研通管家采纳,获得10
38秒前
Criminology34应助科研通管家采纳,获得10
38秒前
58秒前
充电宝应助高大的羿采纳,获得10
1分钟前
Kiri_0661发布了新的文献求助10
1分钟前
高大的羿完成签到,获得积分20
1分钟前
科研通AI6应助小蜻蜓采纳,获得30
1分钟前
科研通AI6应助小蜻蜓采纳,获得30
1分钟前
科研通AI6应助PALMS采纳,获得10
1分钟前
2分钟前
sissie发布了新的文献求助10
2分钟前
hb完成签到,获得积分10
2分钟前
orixero应助sissie采纳,获得10
2分钟前
积极的西牛完成签到,获得积分10
2分钟前
小二郎应助积极的西牛采纳,获得10
2分钟前
yyw完成签到,获得积分10
2分钟前
LPPQBB应助科研通管家采纳,获得200
2分钟前
Criminology34应助科研通管家采纳,获得10
2分钟前
Criminology34应助科研通管家采纳,获得10
2分钟前
yyw发布了新的文献求助10
2分钟前
2分钟前
小杨完成签到 ,获得积分10
3分钟前
ooooozhubi完成签到 ,获得积分10
3分钟前
drirshad完成签到,获得积分10
3分钟前
Dominant完成签到,获得积分10
3分钟前
共享精神应助慕青采纳,获得10
4分钟前
4分钟前
干净的烧鹅完成签到,获得积分10
4分钟前
小蜻蜓发布了新的文献求助30
4分钟前
5分钟前
小蜻蜓发布了新的文献求助30
5分钟前
SciGPT应助pursu采纳,获得30
5分钟前
小蜻蜓发布了新的文献求助30
5分钟前
5分钟前
鹏笑发布了新的文献求助10
6分钟前
6分钟前
7分钟前
yinjs158完成签到,获得积分10
8分钟前
高大的羿发布了新的文献求助10
8分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Bandwidth Choice for Bias Estimators in Dynamic Nonlinear Panel Models 2000
HIGH DYNAMIC RANGE CMOS IMAGE SENSORS FOR LOW LIGHT APPLICATIONS 1500
Constitutional and Administrative Law 1000
The Social Work Ethics Casebook: Cases and Commentary (revised 2nd ed.). Frederic G. Reamer 800
Vertébrés continentaux du Crétacé supérieur de Provence (Sud-Est de la France) 600
Vertebrate Palaeontology, 5th Edition 530
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5357085
求助须知:如何正确求助?哪些是违规求助? 4488652
关于积分的说明 13972405
捐赠科研通 4389765
什么是DOI,文献DOI怎么找? 2411715
邀请新用户注册赠送积分活动 1404271
关于科研通互助平台的介绍 1378414