Novo Chat
Histórico de pesquisa
Pesquisa acadêmica
Pesquisa de artigos
Biblioteca
Conversas recentes
Pesquisar
REINFORCE++: A Simple and Efficient Approach for Aligning Large Language Models
Jian Hu
2025
·
DOI: 10.48550/arXiv.2501.03262
arXiv.org · 155 Citações
Ver Gráfico de Relações
Voltar