MachineLearning:Концепция ресурса
Материал из MachineLearning.
MachineLearning.Ru — русскоязычный информационно-аналитический профессиональный ресурс по интеллектуальному анализу данных и машинному обучению.
Содержание |
Цели создания Ресурса MachineLearning.Ru
- Сконцентрировать информацию о достижениях ведущих российских научных школ в области машинного обучения и интеллектуального анализа данных.
- Способствовать обмену опытом, накоплению и распространению научных знаний в этой области. Предоставить площадку для виртуальных научных семинаров и обсуждений.
- Предоставить доступ к распределенной системе тестирования алгоритмов классификации и прогнозирования.
Научные направления
- Машинное обучение (machine learning):
- классификация (classification);
- кластеризация (clustering);
- регрессия (regression);
- прогнозирование (forecasting).
- Интеллектуальный анализ данных (data mining):
- обработка, анализ и понимание текста (text mining);
- обработка и анализ информации в Интернет (web mining);
- добыча знаний (knowledge discovery in databases).
- Обработка, анализ, распознавание, понимание и синтез изображений.
- Обработка, анализ, распознавание, понимание и синтез речи.
- Обработка сигналов (signal processing).
- Прикладная статистика (applied statistics).
- Прикладные задачи и системы анализа данных (applications).
Приветствуется уточнение списка направлений участниками проекта.
Для кого предназначен Ресурс
Аудитория ресурса — русскоязычная, включающая следующие уровни:
- Эксперты по анализу данных. Для них публикуются работы, чтение которых требует профессиональных знаний.
- Эксперты в прикладных областях. Для них публикуется энциклопедия анализа данных, рекомендации по практическому применению методов анализа данных, примеры решённых прикладных задач.
- Руководители, которым будут адресованы статьи по стратегии применения интеллектуальных продуктов в бизнесе.
- Студенты, аспиранты, преподаватели, использующие ресурс в образовательных целях.
Принципы построения Ресурса
Открытость
- Содержимое ресурса создаётся научным сообществом и является общественным достоянием. Статьи публикуются под открытым лицензионным соглашением GNU FDL.
- Создатели Ресурса (научная школа академика РАН Ю. И. Журавлёва и чл.-корр. РАН К. В. Рудакова) осуществляют его техническую поддержку и продвижение, но не определяют его содержимое и не претендуют на право обладания Ресурсом.
Википедия: сходство и отличия
Ресурс строится по принципам Википедии — свободной энциклопедии и обладает всеми её основными возможностями и преимуществами:
- каждый пользователь ресурса может создать или изменить страницу (статью) или раздел (категорию) в любое время, в любом месте, располагая только доступом в Интернет;
- любая статья или категория может быть включена в любое количество категорий, что позволяет гибко выстраивать структуру ресурса;
- история всех правок сохраняется в системе, любую правку можно отменить, любые две версии статьи можно сравнить;
- с каждой статьёй связана страница обсуждения;
- пользователи могут размещать информацию о себе на страницах участников, однако, в отличие от Википедии, участник не имеет права модифицировать личные страницы других участников.
Имеются концептуальные отличия от Википедии, из-за которых данный Ресурс не может быть частью Википедии:
- тематика Википедии практически не ограничена — тематика Ресурса охватывает только области знания, связанные с анализом данных;
- Википедия создаётся широким кругом энтузиастов, в основной массе не являющихся экспертами — Ресурс является профессиональным и создаётся специалистами в области анализа данных;
- статьи Википедии обязаны быть достаточно популярными и базироваться только на признанных источниках — статьи Ресурса могут быть специальными, полемическими, учебными, содержать данные незавершенных исследований, исходные коды алгоритмов и программ.
Не исключается возможность обмена материалами с Википедией и другими сетевыми энциклопедиями.
Эффективность обмена научной информацией
Некоторые из основных категорий реализуют специфические формы обмена научной информацией:
- Научные конференции — страницы конференций, способные выполнять функции официальных сайтов конференций. На них могут размещаться объявления, текущая информация, материалы конференций.
- Виртуальные семинары — страницы, предназначенные для ведения научных дискуссий и обмена информацией по текущим исследованиям.
- Энциклопедия анализа данных — терминологические, популярные и обзорные статьи.
- Конкурсы — открытые конкурсы по решению задач интеллекуального анализа данных.
- Библиография — электронная библиотека статей, книг, методических пособий, диссертаций и т. д., в которой могут размещаться как электронные версии публикаций, так и ссылки на внешние хранилища, такие как CiteSeer, arXiv, REXA. Страница, посвященная статье или книге, может содержать её реферат, фрагменты перевода, дискуссию.
Значительная часть работы учёного может вестись на страницах Ресурса:
- поиск научной информации и источников вдохновения;
- установление научных контактов;
- работа с литературой, коллекционирование ссылок, реферирование прочитанных статей;
- ведение черновых записей, в том числе о новых идеях и планах будущих исследований;
- фиксация результатов текущих экспериментов;
- проведение семинаров и дискуссий с коллегами, находящимися как в других городах, так и в соседней комнате;
- обмен исходными кодами программ и алгоритмов;
- ведение персональной страницы, блогов или форумов;
- размещение в широком доступе учебных материалов: лекций, заданий, практикумов;
- контроль за выполнением студенческих работ.
Поддержка проекта
Создание и развитие Ресурса MachineLearning.Ru поддержано Российским фондом фундаментальных исследований (проект № 07-07-00372) и компанией Forecsys.
История
- 2007, 3 октября. Концепция Ресурса MachineLearning.Ru анонсирована на Всероссийской конференции ММРО-13.
- 2008, 5 февраля. Ресурс открыт для общего доступа и подготовлен к массовому наполнению.
Полный архив новостей Ресурса MachineLearning.Ru.
Адреса
Ресурс MachineLearning.Ru доступен по адресам www.machinelearning.ru и recognition.su.