Результаты поиска

Материал из MachineLearning.

По запросу «RLAIF»

Перейти к: навигация, поиск

Страницы с названием «RLAIF» не существует.

Для получения более подробной информации о поиске на страницах проекта, см. справочный раздел.

Ниже показаны 2 результата, начиная с № 1.


Просмотреть (предыдущие 20) (следующие 20) (20 | 50 | 100 | 250 | 500)

Нет совпадений в названиях статей

Совпадения в текстах статей

  1. Обучение с подкреплением из обратной связи человека (RLHF) (9339 байт)
    65: == RLAIF ==
    67: RLAIF (Reinforcement Learning from AI Feedback) зам...
  2. Конституционный искусственный интеллект (29 863 байта)
    6: ...ме.<ref>Lee H., Phatale S., Mansoor H. et al. ''RLAIF vs. RLHF: Scaling Reinforcement Learning from Hum...
    14: ...ка.<ref>Lee H., Phatale S., Mansoor H. et al. ''RLAIF vs. RLHF: Scaling Reinforcement Learning from Hum...
    45: == RLAIF ==
    47: ...ный с конституционным ИИ. В RLAIF роль источника предпочтен...
    49: ...братной связи человека|RLHF]] RLAIF отличается прежде всего ис...

Просмотреть (предыдущие 20) (следующие 20) (20 | 50 | 100 | 250 | 500)



Искать в пространствах имён:

Показывать перенаправления
Искать
Личные инструменты