Результаты поиска
Материал из MachineLearning.
По запросу «RLAIF»
Страницы с названием «RLAIF» не существует.
Для получения более подробной информации о поиске на страницах проекта, см. справочный раздел.
Ниже показаны 2 результата, начиная с № 1.
Просмотреть (предыдущие 20) (следующие 20) (20 | 50 | 100 | 250 | 500)
Нет совпадений в названиях статей
Совпадения в текстах статей
- Обучение с подкреплением из обратной связи человека (RLHF) (9339 байт)
65: == RLAIF ==
67: RLAIF (Reinforcement Learning from AI Feedback) зам... - Конституционный искусственный интеллект (29 863 байта)
6: ...ме.<ref>Lee H., Phatale S., Mansoor H. et al. ''RLAIF vs. RLHF: Scaling Reinforcement Learning from Hum...
14: ...ка.<ref>Lee H., Phatale S., Mansoor H. et al. ''RLAIF vs. RLHF: Scaling Reinforcement Learning from Hum...
45: == RLAIF ==
47: ...ный с конституционным ИИ. В RLAIF роль источника предпочтен...
49: ...братной связи человека|RLHF]] RLAIF отличается прежде всего ис...
Просмотреть (предыдущие 20) (следующие 20) (20 | 50 | 100 | 250 | 500)

