Все журналы
Материал из MachineLearning.
Общий список журналов сайта MachineLearning. Вы можете отфильтровать результаты по типу журнала, имени участника или затронутой странице.
Просмотреть (предыдущие 50) (следующие 50) (20 | 50 | 100 | 250 | 500)
- 05:21, 18 апреля 2025 Vokov (Обсуждение | вклад) загружена новая версия «Изображение:Voron-ML-RL-slides.pdf»
- 21:39, 4 мая 2024 Vokov (Обсуждение | вклад) загружена новая версия «Изображение:Voron-ML-RL-slides.pdf» (+исправлены неточности в Актёр-Критик)
- 15:02, 27 апреля 2023 Vokov (Обсуждение | вклад) загружена новая версия «Изображение:Voron-ML-RL-slides.pdf» (+Актёр-критик +Томпсоновское сэмплирование )
- 22:55, 18 апреля 2021 Vokov (Обсуждение | вклад) загружена новая версия «Изображение:Voron-ML-RL-slides.pdf» (весна 2021)
- 12:02, 18 ноября 2020 Vokov (Обсуждение | вклад) загружена новая версия «Изображение:Voron-ML-RL-slides.pdf» (+сократил бандитов +DQN +вернул SARSA +концепции model-free/model-based)
- 19:41, 14 декабря 2019 Vokov (Обсуждение | вклад) загружена новая версия «Изображение:Voron-ML-RL-slides.pdf» (мелкие правки)
- 23:29, 31 октября 2017 Vokov (Обсуждение | вклад) загружена новая версия «Изображение:Voron-ML-RL-slides.pdf» (+policy gradient -SARSA)
- 23:23, 16 ноября 2016 Vokov (Обсуждение | вклад) загружена новая версия «Изображение:Voron-ML-RL-slides.pdf» (+ contextual bandit )
- 18:46, 20 ноября 2015 Vokov (Обсуждение | вклад) загружена новая версия «Изображение:Voron-ML-RL-slides.pdf» (Добавлен слайд про общий алгоритм контекстуального бандита)
- 23:25, 15 ноября 2015 Vokov (Обсуждение | вклад) загружена новая версия «Изображение:Voron-ML-RL-slides.pdf» (добавлены контекстные бандиты, параметр E/E для UCB)
- 07:13, 21 июня 2014 Vokov (Обсуждение | вклад) загружена новая версия «Изображение:Voron-ML-RL-slides.pdf»
- 21:30, 20 ноября 2012 Vokov (Обсуждение | вклад) загружена новая версия «Изображение:Voron-ML-RL-slides.pdf» (Ещё порция улучшений, исправлены опечатки)
- 17:04, 20 ноября 2012 Vokov (Обсуждение | вклад) загружена новая версия «Изображение:Voron-ML-RL-slides.pdf» (несколько исправлений + слайд со списком приложений)
- 13:20, 20 ноября 2012 Vokov (Обсуждение | вклад) загружено «Изображение:Voron-ML-RL-slides.pdf» (Обучение с подкреплением (Reinforcement Learning))
Просмотреть (предыдущие 50) (следующие 50) (20 | 50 | 100 | 250 | 500)