검색 기록

학술 연구 논문 검색 라이브러리

최근 대화

REINFORCE++: A Simple and Efficient Approach for Aligning Large Language Models

Jian Hu

2025 · DOI: 10.48550/arXiv.2501.03262

arXiv.org · 155 citas