标题 |
![]() DeepSeek-R1通过强化学习激励大语言模型中的推理
|
网址 | |
DOI | |
其它 |
期刊:Nature 作者:Daya Guo; Dejian Yang; Haowei Zhang; Junxiao Song; Peiyi Wang; et al 出版日期:2025 |
求助人 | |
下载 | 求助已完成,仅限求助人下载。 |