MachineLearning:Концепция ресурса

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Цели создания Ресурса MachineLearning.Ru)
Строка 1: Строка 1:
{{Shortcut|ML:КР}}'''MachineLearning.Ru''' — профессиональный русскоязычный информационно-аналитический ресурс по машинному обучению и интеллектуальному анализу данных.
{{Shortcut|ML:КР}}'''MachineLearning.Ru''' — профессиональный русскоязычный информационно-аналитический ресурс по машинному обучению и интеллектуальному анализу данных.
 +
{{TOCright}}
== Цели создания Ресурса MachineLearning.Ru ==
== Цели создания Ресурса MachineLearning.Ru ==
* Сконцентрировать информацию о достижениях научных школ России и стран СНГ в области [[машинное обучение|машинного обучения]] и [[интеллектуальный анализ данных|интеллектуального анализа данных]].
* Сконцентрировать информацию о достижениях научных школ России и стран СНГ в области [[машинное обучение|машинного обучения]] и [[интеллектуальный анализ данных|интеллектуального анализа данных]].
* Способствовать обмену опытом, накоплению и распространению научных знаний в этой области.
* Способствовать обмену опытом, накоплению и распространению научных знаний в этой области.
-
* Способствовать структурированию и оценке научной информации, выработки единой терминологии, решению других проблем, связанных с информационной разобщённостью исследователей.
+
* Способствовать структурированию и оценке научной информации, выработке единой терминологии и решению других проблем, связанных с информационной разобщённостью исследователей.
* Предоставить площадку для виртуальных научных семинаров и обсуждений.
* Предоставить площадку для виртуальных научных семинаров и обсуждений.
* Предоставить доступ к [[Полигон алгоритмов|распределенной системе тестирования алгоритмов классификации и прогнозирования]].
* Предоставить доступ к [[Полигон алгоритмов|распределенной системе тестирования алгоритмов классификации и прогнозирования]].
== Научные направления ==
== Научные направления ==
 +
[[Машинное обучение]] (Machine Learning) — это обширный подраздел прикладной математики, находящийся на стыке [[Математическая статистика|математической статистики]], [[Методы оптимизации|оптимизации]], [[Искусственный интеллект|искусственного интеллекта]], изучающий методы построения алгоритмов, способных обучаться по эмпирическим (прецедентным) данным.
 +
 +
[[Интеллектуальный анализ данных]] в широком смысле слова — это совокупность концепций, подходов, методов, алгоритмов, применяемых для автоматического получения каких-либо нетривиальных выводов на основе каких-либо эмпирических данных, в том числе сигналов, изображений, текстов, и т. д. В более узком смысле ''интеллектуальный анализ данных'' можно понимать как попытку русского перевода термина Data Mining.
 +
 +
Некоторые '''[[:Категория:Научные направления|научные направления]]''' Ресурса имеют значительные пересечения с [[Машинное обучение|машинным обучением]], но не является его частью.
 +
Например, [[:Категория:Прикладная статистика|прикладная статистика]] с одной стороны существенно шире машинного обучения, с другой стороны существуют и не-статистические подходы к обучению.
 +
[[:Категория:Распознавание образов|Распознавание образов]],
 +
[[:Категория:Анализ изображений|анализ изображений]],
 +
[[:Категория:Компьютерное зрение|компьютерное зрение]],
 +
[[:Категория:Обработка и анализ текстов|обработка и анализ текстов]]
 +
активно используют методы [[машинное обучение|машинного обучения]] в качестве инструментария, но имеют также массу собственных подходов, методов, алгоритмов, которые не принято рассматривать в рамках Machine Learning.
 +
Эти и другие научные направления можно относить к [[Интеллектуальный анализ данных|интеллектуальному анализу данных]] в широком смысле. Они несомненно также попадают в сферу научных интересов Ресурса MachineLearning.Ru.
 +
Ниже приводится примерный перечень направлений.
Ниже приводится примерный перечень направлений.
-
Тематическая иерархия Ресурса начинается в корневой категории [[:Категория:Научные направления|научные направления]] и постоянно уточняется участниками проекта.
+
Тематическая иерархия Ресурса начинается в корневой категории '''[[:Категория:Научные направления|Научные направления]]''' и постоянно уточняется участниками проекта.
* [[:Категория:Машинное обучение|Машинное обучение]] (machine learning) — теория, подходы и методы обучения по прецедентам:
* [[:Категория:Машинное обучение|Машинное обучение]] (machine learning) — теория, подходы и методы обучения по прецедентам:
Строка 20: Строка 34:
* [[:Категория:Интеллектуальный анализ данных|Интеллектуальный анализ данных]] (data mining) — методы анализа больших объёмов информации, в которых используется обучение по прецедентам:
* [[:Категория:Интеллектуальный анализ данных|Интеллектуальный анализ данных]] (data mining) — методы анализа больших объёмов информации, в которых используется обучение по прецедентам:
** [[добыча знаний]] (knowledge discovery in databases);
** [[добыча знаний]] (knowledge discovery in databases);
-
** [[анализ изображений|анализ]], [[распознавание изображений|распознавание]] и [[понимание изображений|понимание]] изображений (image analysis, recognition & understanding);
+
** [[:Категория:Анализ изображений|анализ]], [[:Категория:Распознавание изображений|распознавание]] и [[понимание изображений|понимание]] изображений (image analysis, recognition & understanding);
-
** [[компьютерное зрение]] (computer vision);
+
** [[:Категория:Компьютерное зрение|компьютерное зрение]] (computer vision);
** [[анализ речи|анализ]], [[распознавание речи|распознавание]] и [[понимание речи|понимание]] речи (speach analysis, recognition & understanding);
** [[анализ речи|анализ]], [[распознавание речи|распознавание]] и [[понимание речи|понимание]] речи (speach analysis, recognition & understanding);
-
** [[анализ текста|анализ]] и [[понимание текста|понимание]] текста (text mining);
+
** [[:Категория:Обработка и анализ текстов|обработка и анализ текстов]], [[понимание текстов]] (text mining);
-
** [[анализ веба|анализ информации в сети Интернет]] (web mining).
+
** [[:Категория:Анализ веба|анализ информации в сети Интернет]] (web mining).
* [[Анализ данных]] — теория, подходы и методы анализа данных, в которых не используется обучение по прецедентам:
* [[Анализ данных]] — теория, подходы и методы анализа данных, в которых не используется обучение по прецедентам:
** [[:Категория:Прикладная статистика|прикладная статистика]] (applied statistics);
** [[:Категория:Прикладная статистика|прикладная статистика]] (applied statistics);
** [[:Категория:Обработка сигналов|обработка сигналов]] (signal processing);
** [[:Категория:Обработка сигналов|обработка сигналов]] (signal processing);
-
** [[обработка изображений|обработка]] и [[синтез изображений|синтез]] изображений (image analysis & synthesis);
+
** [[:Категория:Обработка изображений|обработка]] и [[:Категория:Синтез изображений|синтез]] изображений (image analysis & synthesis);
-
** [[поиск информации]] (information retrieval).
+
** [[:Категория:Поиск информации|поиск информации]] (information retrieval).
* [[:Категория:Прикладные задачи анализа данных|Прикладные задачи]] и [[:Категория:Прикладные системы анализа данных|системы]] анализа данных (applications) — приложения машинного обучения и анализа данных в различных предметных областях:
* [[:Категория:Прикладные задачи анализа данных|Прикладные задачи]] и [[:Категория:Прикладные системы анализа данных|системы]] анализа данных (applications) — приложения машинного обучения и анализа данных в различных предметных областях:
Строка 50: Строка 64:
=== Соблюдение тематики ===
=== Соблюдение тематики ===
* Ресурс не претендует на охват всей прикладной математики и, тем более, всей науки (есть пример проекта с противоположной концепцией — [http://ru.science.wikia.com Викинаука]).
* Ресурс не претендует на охват всей прикладной математики и, тем более, всей науки (есть пример проекта с противоположной концепцией — [http://ru.science.wikia.com Викинаука]).
-
* Статьи по смежным областям знания допускаются, но только в контексте их связи с [[:Категория:Научные направления|основной тематикой]] Ресурса.
+
* Статьи по смежным областям знания допускаются в контексте их связи с [[:Категория:Научные направления|основной тематикой]] Ресурса.
* В рамках основной тематики Ресурса категоризация областей и направлений может свободно изменяться участниками проекта, отражая текущие тенденции и приоритеты.
* В рамках основной тематики Ресурса категоризация областей и направлений может свободно изменяться участниками проекта, отражая текущие тенденции и приоритеты.

Версия 14:27, 1 июня 2008

ML:КР

MachineLearning.Ru — профессиональный русскоязычный информационно-аналитический ресурс по машинному обучению и интеллектуальному анализу данных.

Содержание

Цели создания Ресурса MachineLearning.Ru

Научные направления

Машинное обучение (Machine Learning) — это обширный подраздел прикладной математики, находящийся на стыке математической статистики, оптимизации, искусственного интеллекта, изучающий методы построения алгоритмов, способных обучаться по эмпирическим (прецедентным) данным.

Интеллектуальный анализ данных в широком смысле слова — это совокупность концепций, подходов, методов, алгоритмов, применяемых для автоматического получения каких-либо нетривиальных выводов на основе каких-либо эмпирических данных, в том числе сигналов, изображений, текстов, и т. д. В более узком смысле интеллектуальный анализ данных можно понимать как попытку русского перевода термина Data Mining.

Некоторые научные направления Ресурса имеют значительные пересечения с машинным обучением, но не является его частью. Например, прикладная статистика с одной стороны существенно шире машинного обучения, с другой стороны существуют и не-статистические подходы к обучению. Распознавание образов, анализ изображений, компьютерное зрение, обработка и анализ текстов активно используют методы машинного обучения в качестве инструментария, но имеют также массу собственных подходов, методов, алгоритмов, которые не принято рассматривать в рамках Machine Learning. Эти и другие научные направления можно относить к интеллектуальному анализу данных в широком смысле. Они несомненно также попадают в сферу научных интересов Ресурса MachineLearning.Ru.

Ниже приводится примерный перечень направлений. Тематическая иерархия Ресурса начинается в корневой категории Научные направления и постоянно уточняется участниками проекта.

Для кого предназначен Ресурс

Аудитория Ресурса — русскоязычная, включающая следующие уровни:

  • Эксперты по анализу данных. Для них публикуются работы, чтение которых требует профессиональных знаний.
  • Эксперты в прикладных областях. Для них публикуется энциклопедия анализа данных, рекомендации по практическому применению методов анализа данных, примеры решённых прикладных задач.
  • Руководители, которым адресованы статьи по стратегии применения интеллектуальных продуктов в бизнесе, производстве и других сферах.
  • Студенты, аспиранты, преподаватели, использующие Ресурс в образовательных целях.

Принципы построения Ресурса

Соблюдение тематики

  • Ресурс не претендует на охват всей прикладной математики и, тем более, всей науки (есть пример проекта с противоположной концепцией — Викинаука).
  • Статьи по смежным областям знания допускаются в контексте их связи с основной тематикой Ресурса.
  • В рамках основной тематики Ресурса категоризация областей и направлений может свободно изменяться участниками проекта, отражая текущие тенденции и приоритеты.

Открытость

  • Содержимое Ресурса создаётся научным сообществом и является общественным достоянием. Статьи публикуются под открытым лицензионным соглашением GNU FDL.
  • Создатели Ресурса (научная школа академика РАН Ю. И. Журавлёва и чл.-корр. РАН К. В. Рудакова) осуществляют его техническую поддержку и продвижение, но не определяют его содержимое и не претендуют на право обладания Ресурсом.

Сходство с Википедией

Ресурс строится по принципам Википедии — свободной энциклопедии и обладает всеми её основными возможностями и преимуществами:

  • каждый пользователь ресурса может создать или изменить страницу (статью) или раздел (категорию) в любое время, в любом месте, располагая только доступом в Интернет;
  • любая статья или категория может быть включена в любое количество категорий, что позволяет гибко выстраивать структуру Ресурса;
  • история всех правок сохраняется в системе, любую правку можно отменить, любые две версии статьи можно сравнить;
  • с каждой статьёй связана страница обсуждения;

Отличия от Википедии

Имеются концептуальные отличия от Википедии, из-за которых данный Ресурс не может быть частью Википедии:

  • тематика Википедии практически не ограничена — тематика Ресурса охватывает только области знания, связанные с анализом данных;
  • Википедия создаётся широким кругом энтузиастов, в основной массе не являющихся экспертами — Ресурс является профессиональным и создаётся специалистами в области анализа данных;
  • статьи Википедии обязаны быть достаточно популярными и базироваться только на признанных источниках — статьи Ресурса могут быть специальными, полемическими, учебными, содержать данные незавершенных исследований, исходные коды алгоритмов и программ;
  • любой участник Википедии имеет право модифицировать личные страницы других участников — здесь эта возможность запрещена.

Имеющиеся отличия не исключают возможность обмена материалами с Википедией и другими сетевыми энциклопедиями.

Создание пространства для совместной работы

  • С технической точки зрения MediaWiki даёт только одну ключевую возможность — совместно править страницы Ресурса. Однако использовать её можно не только для создания общедоступной энциклопедии, но и для организации совместной работы научных групп, обмена информацией по текущим исследованиям, поиска и привлечения новых заинтересованных участников в свои проекты.
  • Основные категории Ресурса (см. полный перечень), поддерживающие различные формы научного общения:
    • научные конференции — страницы конференций, способные выполнять функции официальных сайтов конференций; на них могут размещаться объявления, текущая информация, материалы конференций;
    • виртуальные семинары — страницы, предназначенные для ведения научных дискуссий и обмена информацией по текущим исследованиям;
    • публикации — страницы, посвящённые обсуждению статей, книг, диссертаций, отчётов и т. д.;
    • конкурсы — открытые конкурсы по решению задач интеллекуального анализа данных;
    • учебные курсы — страницы учебных курсов, которые не исключают совместную работу преподавателей и студентов над содержимым отдельных страниц;
    • страницы участников — персональные страницы, на которых участники могут размещать информацию о себе, своих научных интересах, публикациях, проектах.
  • Значительная часть работы учёного может вестись на страницах Ресурса:
    • поиск научной информации и новых идей;
    • установление научных контактов, образование научных сообществ;
    • работа с литературой, коллекционирование ссылок, реферирование и обсуждение статей;
    • совместное ведение черновых записей;
    • документирование и обсуждение результатов текущих исследований;
    • проведение семинаров и дискуссий с коллегами, находящимися как в других городах, так и в соседней комнате;
    • обмен исходными кодами программ и алгоритмов;
    • размещение в широком доступе учебных материалов: лекций, заданий, практикумов;
    • контроль за выполнением студенческих работ.
  • Образно говоря, MachineLearning.Ru — это инструмент для огранизации научной работы, совмещающий в себе энциклопедию, научную конференцию, учебный семинар и блокнот для черновых записей.

Перспективы

  • Благодаря Ресурсу научное знание становится общедоступным практически в момент его появления.
  • Ресурс может стать тем местом, где предельно оперативно концентрируется информация о последних разработках и достижениях в области машинного обучения и интеллектуального анализа данных.
  • Значительная часть рабочего времени учёного может проходить на страницах Ресурса. Здесь можно жить — читать, писать, общаться, думать и вдохновляться. Чтобы это действительно стало так, Ресурс должен быть, во-первых, наполнен полезной информацией, во-вторых, популярен и признан научной общественностью. Второе без первого невозможно, а первое без второго неэффективно. Становление такого Ресурса — постепенный (итерационный) процесс.

Поддержка проекта

Создание и развитие Ресурса MachineLearning.Ru поддержано Российским фондом фундаментальных исследований (проект № 07-07-00372) и компанией Forecsys.

История

  • 2007, 3 октября. Концепция Ресурса MachineLearning.Ru анонсирована на Всероссийской конференции ММРО-13.
  • 2008, 5 февраля. Ресурс открыт для общего доступа и подготовлен к массовому наполнению.

Полный архив новостей Ресурса MachineLearning.Ru.

Адреса

Ресурс MachineLearning.Ru доступен по адресам www.machinelearning.ru и recognition.su.

Личные инструменты