已完结
  • 文献求助详情
系统提示
该文献链接来自ncbi,该网站是索引库,类似于搜索引擎,其准确性不能保证。此类网址会大大拖延应助,为了快速获取到文献,请核实文献信息的准确性,建议填写原始官方链接,特殊情况请在备注中说明。管理员会对该类求助适时进行关闭。
提醒:由于doi是数字文件的唯一标识,应助人将优先使用doi进行应助
标题
DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning
DeepSeek-R1通过强化学习激励大语言模型中的推理
网址
DOI
10.1038/s41586-025-09422-z doi
求助人
tanlaker 在 2025-09-18 13:28:16 发布自广东,悬赏 10 积分
下载 该求助完结已超 24 小时,文件已从服务器自动删除,无法下载。
该求助已完结,感谢关注
如需该文献,请重新发布求助,前往发布
站在巨人的肩膀上,才更有可能跳的更远
请遵守相关知识产权规定,勿将文件分享给他人,仅可用于个人研究学习
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
123456789完成签到,获得积分10
刚刚
刚刚
Camellia发布了新的文献求助10
1秒前
王丽娟应助nicelily采纳,获得10
1秒前
111完成签到 ,获得积分10
1秒前
1秒前
1秒前
2秒前
2秒前
3秒前
陈炳蓉完成签到,获得积分10
3秒前
苛帅发布了新的文献求助10
3秒前
吴帆发布了新的文献求助10
3秒前
在下小雨发布了新的文献求助10
4秒前
4秒前
4秒前
5秒前
5秒前
jia发布了新的文献求助10
6秒前
6秒前
WH完成签到,获得积分10
6秒前
王王发布了新的文献求助10
6秒前
guojingjing发布了新的文献求助10
6秒前
6秒前
lia完成签到,获得积分10
6秒前
李李李发布了新的文献求助10
6秒前
曙光完成签到,获得积分10
7秒前
风中的丝袜完成签到,获得积分10
8秒前
xs完成签到,获得积分10
8秒前
肖耶啵完成签到,获得积分10
8秒前
9秒前
忐忑的马里奥完成签到,获得积分10
9秒前
小二郎应助jia采纳,获得10
9秒前
隐形雪莲发布了新的文献求助10
9秒前
吴帆完成签到,获得积分20
9秒前
强健的雅绿完成签到,获得积分10
10秒前
旺仔发布了新的文献求助10
10秒前
10秒前
Lucky发布了新的文献求助10
10秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Encyclopedia of Reproduction Third Edition 3000
化妆品原料学 1000
《药学类医疗服务价格项目立项指南(征求意见稿)》 1000
花の香りの秘密―遺伝子情報から機能性まで 800
1st Edition Sports Rehabilitation and Training Multidisciplinary Perspectives By Richard Moss, Adam Gledhill 600
nephSAP® Nephrology Self-Assessment Program - Hypertension The American Society of Nephrology 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5631208
求助须知:如何正确求助?哪些是违规求助? 4724665
关于积分的说明 14977656
捐赠科研通 4789376
什么是DOI,文献DOI怎么找? 2557634
邀请新用户注册赠送积分活动 1518314
关于科研通互助平台的介绍 1478854