搜尋歷史

深度研究論文搜尋知識庫

最近對話

REINFORCE++: A Simple and Efficient Approach for Aligning Large Language Models

Jian Hu

2025 · DOI: 10.48550/arXiv.2501.03262

arXiv.org · 引用 155 次