Обсуждение:Тематическое моделирование

Материал из MachineLearning.

Костя, нашел у вас в переводном обзоре

http://www.machinelearning.ru/wiki/images/9/90/Daud2009survey-rus.pdf

"В терминах кластерного анализа тема (topic) — это результат би-кластеризации, то есть одновременной кластеризации и слов, и документов по их семантической близости."

А говорили, что не совсем то :)

Участник:Dmitry

Дмитрий, мы старались не делать дословный перевод, а правильно передавать идеи, смысл. Есть и отсебятина. В частности, би-кластеризация в исходном тексте не упоминалась. Вообще, исходный текст содержит слишком много воды и повторов (пакистанско-китайский менталитет?). Это редкий случай, когда русский перевод получился короче английского исходника без потери смысла :) — К.В.Воронцов 15:28, 3 января 2012 (MSK)

Спасибо, Константин! Постараюсь дочитать до конца праздников пересказ. Уж больно тема полезная. Обычно смысловых повторов не миновать, особенно, если обзор большой, авторов несколько, а написать надо быстро. — machine 16:10, 3 января 2012 (MSK)

Простите что придираюсь, но почему это метод максимизации правдоподобия в PLSA ведет к минимизации функционала

$\sum_{d\in D} \sum_{w\in d} n_{dw}\log p(d,w) \to \min_{\Phi,\Theta}$ ?

Ведь плотность вероятности нужно наоборот увеличивать

Очевидно, минус забыт, либо мин с максом перепутан... все люди ашыпаюца — К.В.Воронцов 02:23, 8 октября 2012 (MSD)

Источник — «http://www.machinelearning.ru/wiki/index.php?title=%D0%9E%D0%B1%D1%81%D1%83%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5:%D0%A2%D0%B5%D0%BC%D0%B0%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B5_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5»

Обсуждение:Тематическое моделирование

Материал из MachineLearning.

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты