Результаты поиска

По запросу «RLAIF»

Страницы с названием «RLAIF» не существует.

Для получения более подробной информации о поиске на страницах проекта, см. справочный раздел.

Ниже показаны 2 результата, начиная с № 1.

Просмотреть (предыдущие 20) (следующие 20) (20 | 50 | 100 | 250 | 500)

Нет совпадений в названиях статей

Обучение с подкреплением из обратной связи человека (RLHF) (9339 байт)
65: == RLAIF ==
67: RLAIF (Reinforcement Learning from AI Feedback) зам...
Конституционный искусственный интеллект (29 863 байта)
6: ...ме.<ref>Lee H., Phatale S., Mansoor H. et al. ''RLAIF vs. RLHF: Scaling Reinforcement Learning from Hum...
14: ...ка.<ref>Lee H., Phatale S., Mansoor H. et al. ''RLAIF vs. RLHF: Scaling Reinforcement Learning from Hum...
45: == RLAIF ==
47: ...ный с конституционным ИИ. В RLAIF роль источника предпочтен...
49: ...братной связи человека|RLHF]] RLAIF отличается прежде всего ис...

Просмотреть (предыдущие 20) (следующие 20) (20 | 50 | 100 | 250 | 500)