Определение гиперпараметров для MVR

Материал из MachineLearning.

(Различия между версиями)

Перейти к: навигация, поиск

Версия 08:23, 13 апреля 2009

При максимизации вероятности появления данных D для гиперпараметров α и β мы получаем:

$\ln p(D|\alpha , \beta ) = -E_W^{MP} - \frac{1}{2}\sum_{j=1}^{W}\frac{1}{\lambda_j+\alpha} +\frac{W}{2\alpha}$

Отсюда, приравнивая логарифм к 0, получаем выражение для α.

$2\alpha E_{MP}^W = W - \sum_{j=1}^{W}\frac{\alpha}{\lambda_j+\alpha}$

Выражаем γ - мера числа хорошо обусловленных параметров модели:

$\gamma = \sum_{j=1}^{W}\frac{\alpha}{\lambda_j+\alpha}$

Далее, находя оптимальное β, получим, что

$2 \beta E_D^{MP}= N - \sum_{j=1}^{W}\frac{\lambda_j}{\lambda_j+\alpha}$

Таким образом, на каждом шаге у нас для модели определены гиперпараметры α,β,γ. При этом β определена для всей модели, а α и γ для каждой функции из суперпозиции. Так как оптимизация параметров w дает нам положительно определенную форму гессиана, его собственные значения λ больше нуля, и, таким образом, γ меньше нуля.

Мы имеем следующий итерационный процесс пересчета α и γ:

$\alpha_{ij}^{new} = \frac{W-\gamma_i}{E_W(b_{ij})}$

$\gamma = \sum_{j=1}^{W}\frac{\alpha}{\lambda_j+\alpha}$

Процесс сходится, так как увеличение α ведет к увеличению γ, что на следующем шаге ведет к уменьшению α.

Код, считающий гиперпараметры:

   for m=1:limit
       gamma(m)=0;
       for i=1:size(Model.wFound,2)
           gamma(m)=gamma(m)+max(alpha)/(lambda(i)+max(alpha));
       end
       for i=1:size(Model.wFound,2)
           alpha(i)=(size(Model.wFound,2)-gamma(m))/Model.wFound(i)^2
       end
       beta(m)=(size(y,1)-gamma(m))/Model.errTest;
   end

Источник — «http://www.machinelearning.ru/wiki/index.php?title=%D0%9E%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B3%D0%B8%D0%BF%D0%B5%D1%80%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%BE%D0%B2_%D0%B4%D0%BB%D1%8F_MVR»

Определение гиперпараметров для MVR

Материал из MachineLearning.

Версия 08:23, 13 апреля 2009

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты

@@ Строка 1: / Строка 1: @@
 При максимизации вероятности появления данных D для гиперпараметров α и β мы получаем:
-<math>ln p(D|\alpha , \beta ) = -E_W^{MP} - \frac{1,2}\Sum{j=1,W}\frac{1,\lambda_j+\alpha +\frac{W,2\alpha} </math>
+<tex>\ln p(D|\alpha , \beta ) = -E_W^{MP} - \frac{1}{2}\sum_{j=1}^{W}\frac{1}{\lambda_j+\alpha} +\frac{W}{2\alpha} </tex>
 Отсюда, приравнивая логарифм к 0, получаем выражение для α.
-<здесь будет выражение для альфа, когда я разберусь с местным синтаксисом>
+<tex>2\alpha E_{MP}^W = W - \sum_{j=1}^{W}\frac{\alpha}{\lambda_j+\alpha}</tex>
 Выражаем γ - мера числа хорошо обусловленных параметров модели:
-<здесь будет выражение для гамма, когда я разберусь с местным синтаксисом>
+<tex>\gamma = \sum_{j=1}^{W}\frac{\alpha}{\lambda_j+\alpha}</tex>
 Далее, находя оптимальное β, получим, что
-<здесь будет выражение для бетта, когда я разберусь с местным синтаксисом>
+<tex>2 \beta E_D^{MP}= N - \sum_{j=1}^{W}\frac{\lambda_j}{\lambda_j+\alpha}</tex>
 Таким образом, на каждом шаге у нас для модели определены гиперпараметры α,β,γ. При этом β определена для всей модели, а α и γ для каждой функции из суперпозиции. Так как оптимизация параметров w дает нам положительно определенную форму гессиана, его собственные значения λ больше нуля, и, таким образом, γ меньше нуля.
@@ Строка 19: / Строка 19: @@
 Мы имеем следующий итерационный процесс пересчета α и γ:
-<Здесь будут две простые формулы>.
+<tex>\alpha_{ij}^{new} = \frac{W-\gamma_i}{E_W(b_{ij})}</tex>
+<tex>\gamma = \sum_{j=1}^{W}\frac{\alpha}{\lambda_j+\alpha}</tex>
 Процесс сходится, так как увеличение α ведет к увеличению γ, что на следующем шаге ведет к уменьшению α.
-Код, считающий гиперпараметры:
+{{Hider|
+title=Код, считающий гиперпараметры:|
+content=<br />
+    for m=1:limit
+        gamma(m)=0;
+        for i=1:size(Model.wFound,2)
+            gamma(m)=gamma(m)+max(alpha)/(lambda(i)+max(alpha));
+        end
+        for i=1:size(Model.wFound,2)
+            alpha(i)=(size(Model.wFound,2)-gamma(m))/Model.wFound(i)^2
+        end
+        beta(m)=(size(y,1)-gamma(m))/Model.errTest;
+    end
+}}