Участник:А.Б.Казаков/Коллаборативная фильтрация (заготовка)

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Создал заготовку)
м
Строка 1: Строка 1:
{{TOCright}}
{{TOCright}}
-
'''Коллаборативная фильтрация''' (collaborative filtering, CF)
+
'''Коллаборативная фильтрация''' (collaborative filtering, CF) — ''что это? облать, раздел? найти грамотные определения! Сказать что мы хотим делать очень кратко''
 +
 
 +
''Написать, что дальнейшим развитием латентных методов, построением согласованных метрик + изучением конкретных практических приложений такого совместного анализа - это в рамках АКС - смотри туда...''
== Определения ==
== Определения ==
Строка 6: Строка 8:
Объект, товар, сервис, ресурс (item)
Объект, товар, сервис, ресурс (item)
 +
 +
''Математически сформулировать эти два множества, привести примеры очень кратко (может сделать ссылку в АКС).''
=== Исходные данные ===
=== Исходные данные ===
-
Протокол пользования.
+
Протокол пользования.
Данные о покупках.
Данные о покупках.
Рейтинги.
Рейтинги.
Матрица «пользователи-объекты».
Матрица «пользователи-объекты».
 +
 +
''Собственно в формульном виде показать как выглядят эти данные + написать про бинарность или рейтинги. Текст понятный и простой''
=== Постановки задач ===
=== Постановки задач ===
Предсказание рейтингов.
Предсказание рейтингов.
Формирование списка предложений.
Формирование списка предложений.
 +
 +
''Предсказание рейтингов = угадывание незаполненной ячейки, + добавить оценка сходства, формирование списка предложений = top-N...''
== История ==
== История ==
== Методы и алгоритмы ==
== Методы и алгоритмы ==
 +
''Бывают на хранение матрицы табуляции, бывают латентные? могут быть и для таких и для таких данных? Сделать некую сопоставительную характеристику.''
=== Контентные методы ===
=== Контентные методы ===
(item-based CF)
(item-based CF)
 +
''Пояснить, что контентные не имеет никакого отношения к контенту. Описать кратко''
=== Коллаборативные методы ===
=== Коллаборативные методы ===
(user-based CF)
(user-based CF)
 +
''Описать идею кратко''
=== Гибридные методы ===
=== Гибридные методы ===
 +
=== Латентные модели ===
=== Латентные модели ===
Строка 41: Строка 53:
=== Совместный анализ контента и данных о пользовании ===
=== Совместный анализ контента и данных о пользовании ===
-
== Приложения ==
+
== Программные инструменты ==
 +
''Тут сделать список с краткими комментами. Если потом надо будет - кто-нить создаст странички...''
== Ссылки ==
== Ссылки ==
Строка 47: Строка 60:
* [http://jamesthornton.com/cf/ Collaborative Filtering Research Papers] (James Thornton)
* [http://jamesthornton.com/cf/ Collaborative Filtering Research Papers] (James Thornton)
* [http://en.wikipedia.org/wiki/Collaborative_Filtering Википедия]
* [http://en.wikipedia.org/wiki/Collaborative_Filtering Википедия]
 +
 +
''Добавить ссылку на презентацию Воронцова для ВШЭ? Да, стоит ибо многое взято оттуда''
== Литература ==
== Литература ==
 +
''Найти официальную классическую литературу по этому вопросу - ссылки на статьи и публикации''
{{Stub}}
{{Stub}}

Версия 20:52, 23 ноября 2008

Содержание

Коллаборативная фильтрация (collaborative filtering, CF) — что это? облать, раздел? найти грамотные определения! Сказать что мы хотим делать очень кратко

Написать, что дальнейшим развитием латентных методов, построением согласованных метрик + изучением конкретных практических приложений такого совместного анализа - это в рамках АКС - смотри туда...

Определения

Пользователь, клиент, субъект (user)

Объект, товар, сервис, ресурс (item)

Математически сформулировать эти два множества, привести примеры очень кратко (может сделать ссылку в АКС).

Исходные данные

Протокол пользования. Данные о покупках. Рейтинги. Матрица «пользователи-объекты».

Собственно в формульном виде показать как выглядят эти данные + написать про бинарность или рейтинги. Текст понятный и простой

Постановки задач

Предсказание рейтингов. Формирование списка предложений.

Предсказание рейтингов = угадывание незаполненной ячейки, + добавить оценка сходства, формирование списка предложений = top-N...

История

Методы и алгоритмы

Бывают на хранение матрицы табуляции, бывают латентные? могут быть и для таких и для таких данных? Сделать некую сопоставительную характеристику.

Контентные методы

(item-based CF) Пояснить, что контентные не имеет никакого отношения к контенту. Описать кратко

Коллаборативные методы

(user-based CF) Описать идею кратко

Гибридные методы

Латентные модели

Байсовские сети

Матричные разложения

Кластеризация

Поиск ассоциативных правил

Совместный анализ контента и данных о пользовании

Программные инструменты

Тут сделать список с краткими комментами. Если потом надо будет - кто-нить создаст странички...

Ссылки

Добавить ссылку на презентацию Воронцова для ВШЭ? Да, стоит ибо многое взято оттуда

Литература

Найти официальную классическую литературу по этому вопросу - ссылки на статьи и публикации

Личные инструменты