새 채팅
검색 기록
학술 연구
논문 검색
라이브러리
최근 대화
Buscar
REINFORCE++: A Simple and Efficient Approach for Aligning Large Language Models
Jian Hu
2025
·
DOI: 10.48550/arXiv.2501.03262
arXiv.org · 155 citas
Ver gráfico de relaciones
뒤로