Изображение:Voron-ML-RL-slides.pdf

Материал из MachineLearning.

Перейти к: навигация, поиск

Voron-ML-RL-slides.pdf (размер файла: 940 КБ, MIME-тип: application/pdf)

Обучение с подкреплением (Reinforcement Learning)

История файла

Нажмите на дату/время, чтобы просмотреть как тогда выглядел файл.

Дата/времяУчастникРазмер объектаРазмер файлаПримечание
текущий19:41, 14 декабря 2019Vokov (Обсуждение | вклад)940 КБмелкие правки
23:29, 31 октября 2017Vokov (Обсуждение | вклад)969 КБ+policy gradient -SARSA
23:23, 16 ноября 2016Vokov (Обсуждение | вклад)996 КБ+ contextual bandit
18:46, 20 ноября 2015Vokov (Обсуждение | вклад)932 КБДобавлен слайд про общий алгоритм контекстуального бандита
23:25, 15 ноября 2015Vokov (Обсуждение | вклад)911 КБдобавлены контекстные бандиты, параметр E/E для UCB
07:13, 21 июня 2014Vokov (Обсуждение | вклад)980 КБ
21:30, 20 ноября 2012Vokov (Обсуждение | вклад)832 КБЕщё порция улучшений, исправлены опечатки
17:04, 20 ноября 2012Vokov (Обсуждение | вклад)830 КБнесколько исправлений + слайд со списком приложений
13:20, 20 ноября 2012Vokov (Обсуждение | вклад)807 КБОбучение с подкреплением (Reinforcement Learning)

Следующие страницы ссылаются на данный файл:

Личные инструменты