Результаты поиска
Материал из MachineLearning.
По запросу «Softmax»
Страницы с названием «Softmax» не существует.
Для получения более подробной информации о поиске на страницах проекта, см. справочный раздел.
Ниже показаны 16 результатов, начиная с № 1.
Просмотреть (предыдущие 20) (следующие 20) (20 | 50 | 100 | 250 | 500)
Нет совпадений в названиях статей
Совпадения в текстах статей
- Машинное обучение (курс лекций, К.В.Воронцов) (70 667 байт)
378: ...аммы [[word2vec]]. Иерархический SoftMax. - Машинное обучение (курс лекций, К.В.Воронцов)/Семестровый курс (27 171 байт)
200: ... UCB (upper confidence bound). Стратегия Softmax. - Практикум на ЭВМ (317)/Autoencoder (30 048 байт)
90: ...en.wikipedia.org/wiki/Softmax_activation_function softmax]. Это естественная функция ... - Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Примеры (13 067 байт)
180: ===Title: Optimal Brain Damage for softmax classifier=== - Практикум на ЭВМ (317)/2012-2013/Autoencoder (28 968 байт)
90: ...en.wikipedia.org/wiki/Softmax_activation_function softmax]. Это естественная функция ... - Словарь терминов машинного обучения (8727 байт)
66: '''Softmax function''' — функция мягкого м... - Практикум на ЭВМ (317)/2018 (весна) (19 180 байт)
224: | CBOW, Skip-Gram, Hierarchical softmax, Negative sampling - Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 474, весна 2018 (35 373 байта)
90: ... Чем отличается gating function от softmax в случае смеси экспертов? - Глубинное обучение (курс лекций)/2019 (7469 байт)
70: ...s://arxiv.org/abs/1611.01144 A paper about Gumbel-Softmax] - Математические методы прогнозирования (практика, В.В. Стрижов)/Группа 574, осень 2019 (5338 байт)
73: * Gumbel-Softmax - Математические методы распознавания образов (конференция)/Программа ММРО-20 (43 282 байта)
122: ...ц, обученных с применением softmax с отступами] - Компьютерное зрение (24 997 байт)
61: ...ью вероятность (после слоя Softmax). Данная функция нестабиль... - Трансформер (модель) (13 457 байт)
33: :<tex>\text{Attention}(Q, K, V) = \text{softmax}\!\left(\frac{QK^\top}{\sqrt{d_k}}\right) V.</tex...
35: ...вращает насыщение функции softmax при большой размерности. М... - Механизм внимания (10 099 байт)
18: ...енки нормируются функцией softmax:
32: :<tex>\text{Attention}(Q, K, V) = \text{softmax}\!\left(\frac{QK^\top}{\sqrt{d_k}}\right) V.</tex...
34: ...с малым градиентом функции softmax при больших значениях скал...
42: ...), получают <tex>-\infty</tex> перед softmax, что обнуляет соответствую...
60: ...erformer) — аппроксимация ядра softmax случайными признаками, лин... - Дистилляция моделей (20 701 байт)
23: ...ощью стандартной функции [[Softmax|софтмакс]]:
81: * [[Softmax]] - Ранжирование (47 397 байт)
64: ...ю многомерного обобщения [[Softmax]], после чего минимизирует [...
135: ... задается как многомерный [[Softmax]]:
Просмотреть (предыдущие 20) (следующие 20) (20 | 50 | 100 | 250 | 500)

