DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning - 科研通

发布文献求助

已完结

文献求助详情

标题	DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning DeepSeek-R1通过强化学习激励大语言模型中的推理
网址	https://doi.org/10.1038/s41586-025-09422-z
DOI	10.1038/s41586-025-09422-z doi
其它	期刊：Nature 作者：Daya Guo; Dejian Yang; Haowei Zhang; Junxiao Song; Peiyi Wang; et al 出版日期：2025
求助人	Lojong 在 2025-09-18 11:15:05 发布自辽宁，悬赏 10 积分
下载	该求助完结已超 24 小时，文件已从服务器自动删除，无法下载。

上个求助

提交工单

该求助已完结，感谢关注

如需该文献，请重新发布求助，前往发布

科研通，破除各种障碍，优化资源分配，让科研信息充分流通

请遵守相关知识产权规定，勿将文件分享给他人，仅可用于个人研究学习

我的文献求助列表浏览历史

一分钟了解求助规则 | 捐赠本站 | 历史今天

更新

📰 新增『新锐期刊分区』 (2026-3-24)

更新

💬 新增更精细的自定义提醒设置 (2026-1-4)

新增

🕒 每天60秒读懂世界·精选全球要闻 (2026-1-2)

新增

PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台，具备全网最快的应助速度，最高的求助完成率。对每一个文献求助，科研通都将尽心尽力，给求助人一个满意的交代。

实时播报: windflake完成签到，获得积分10

刚刚; Betty发布了新的文献求助10

刚刚; 可爱的函函上传了应助文件

1秒前; zyf发布了新的文献求助10

1秒前; 脑洞疼上传了应助文件

2秒前; 嗯我就不说完成签到，获得积分10

2秒前; 上官若男的应助被高乐高采纳，获得10

3秒前; natuki完成签到，获得积分10

3秒前; 科目三上传了应助文件

4秒前; Owen的应助被科研通管家采纳，获得10

4秒前; 搜集达人上传了应助文件

4秒前; 隐形曼青的应助被科研通管家采纳，获得10

4秒前; 英姑的应助被科研通管家采纳，获得10

4秒前; 葫芦家二娃发布了新的文献求助10

4秒前; 香蕉觅云的应助被科研通管家采纳，获得10

4秒前; freshabc完成签到，获得积分10

4秒前; 希望天下0贩的0的应助被科研通管家采纳，获得10

4秒前; iNk的应助被科研通管家采纳，获得20

4秒前; 英俊的铭的应助被科研通管家采纳，获得10

4秒前; 科研通AI6.2的应助被科研通管家采纳，获得30

4秒前; 666plus完成签到，获得积分10

4秒前; 上官若男的应助被科研通管家采纳，获得30

4秒前; cougarcmx完成签到，获得积分10

4秒前; 在水一方的应助被科研通管家采纳，获得10

5秒前; iNk的应助被科研通管家采纳，获得20

5秒前; 科研通管家关闭了muyangsiyuan的文献求助

5秒前; 小二郎的应助被科研通管家采纳，获得10

5秒前; 科研通管家关闭了hd的文献求助

5秒前; 科研通管家关闭了Liangc333的文献求助

5秒前; xiaofei的应助被科研通管家采纳，获得10

5秒前; 科研通管家关闭了yzr的文献求助

5秒前; qq发布了新的文献求助10

5秒前; 科研通管家关闭了alkali的文献求助

5秒前; Lee.K.Y的应助被科研通管家采纳，获得10

5秒前; 科研通管家关闭了pingpinglver的文献求助

5秒前; SciGPT的应助被科研通管家采纳，获得20

5秒前; 慕青的应助被科研通管家采纳，获得10

5秒前; Owen的应助被科研通管家采纳，获得10

5秒前; Ava的应助被科研通管家采纳，获得10

5秒前; 喷火娃的应助被科研通管家采纳，获得10

5秒前

高分求助中: (应助此贴封号)【重要！！请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000; Salmon nasal cartilage-derived proteoglycan complexes influence the gut microbiota and bacterial metabolites in mice 2000; The Composition and Relative Chronology of Dynasties 16 and 17 in Egypt 1500; Cowries - A Guide to the Gastropod Family Cypraeidae 1200; ON THE THEORY OF BIRATIONAL BLOWING-UP 666; Signals, Systems, and Signal Processing 610; “美军军官队伍建设研究”系列（全册） 500

热门求助领域（近24小时）

热门帖子: 关注科研通微信公众号，转发送积分 6384630; 求助须知：如何正确求助？哪些是违规求助？ 8197620; 关于积分的说明 17336693; 捐赠科研通 5438242; 什么是DOI，文献DOI怎么找？ 2876052; 邀请新用户注册赠送积分活动 1852566; 关于科研通互助平台的介绍 1696978

今日热心研友

学术文献互助

大力的灵雁

殷勤的紫槐

可耐的豪英

注：热心度 = 本日应助数 + 本日被采纳获取积分÷10

Copyright © 2020-2026 AbleSci.COM, 科研通, All Right Reserved

科研通是非营利科研互助平台，不忘初心，为科研助力

本站互助的所有文件仅供个人学习研究用，禁止任何人把求助的所得文献进行盈利或传播

皖ICP备2024041134号-1

皖公网安备34019202002308

科研通【文献互助QQ群】：如果您有特殊求助，或发布求助超过24小时未得到应助，可加群求助，群号：821889395【点击一键加群】

科研通【志愿服务QQ群】：如果您热爱文献互助，有热心愿意为更多人服务，请加入小伙伴群，点击申请加入

关注微信服务号

科研通