Численные методы обучения по прецедентам (практика, В.В. Стрижов)

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 136: Строка 136:
* Для просроченных заданий будет учитываться время задержки.
* Для просроченных заданий будет учитываться время задержки.
-
 
+
== Домашние задания ==
-
== Домашнее задание-1 ==
+
Ниже перечисленные пункты являются критериями оценки качества работы (для студентов и консультантов)
 +
=== Домашнее задание-1 ===
# Поставить систему компьютерной алгебры [[Matlab]] (класс есть на факультете) или реруцированный заменитель [http://www.gnu.org/software/octave/ Octave].
# Поставить систему компьютерной алгебры [[Matlab]] (класс есть на факультете) или реруцированный заменитель [http://www.gnu.org/software/octave/ Octave].
# Поставить систему верстки TeX [http://miktex.org MikTeX].
# Поставить систему верстки TeX [http://miktex.org MikTeX].
Строка 151: Строка 152:
[Пока недоступно] Зарегистрироваться на сайте [http://www.machinelearning.ru/wiki/index.php?title=%D0%A1%D0%BB%D1%83%D0%B6%D0%B5%D0%B1%D0%BD%D0%B0%D1%8F:Userlogin&type=signup&returnto=%D0%97%D0%B0%D0%B3%D0%BB%D0%B0%D0%B2%D0%BD%D0%B0%D1%8F_%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0 MachineLearning.ru].
[Пока недоступно] Зарегистрироваться на сайте [http://www.machinelearning.ru/wiki/index.php?title=%D0%A1%D0%BB%D1%83%D0%B6%D0%B5%D0%B1%D0%BD%D0%B0%D1%8F:Userlogin&type=signup&returnto=%D0%97%D0%B0%D0%B3%D0%BB%D0%B0%D0%B2%D0%BD%D0%B0%D1%8F_%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0 MachineLearning.ru].
-
== Домашнее задание-2 ==
+
=== Домашнее задание-2 ===
# Прочитать статью про [http://ru.wikipedia.org/wiki/LaTeX LaTeX].
# Прочитать статью про [http://ru.wikipedia.org/wiki/LaTeX LaTeX].
# Прочитать основные главы ''Львовский С. М.'' [http://www.mccme.ru/free-books/llang/newllang.pdf Набор и верстка в системе LaTeX].
# Прочитать основные главы ''Львовский С. М.'' [http://www.mccme.ru/free-books/llang/newllang.pdf Набор и верстка в системе LaTeX].
Строка 161: Строка 162:
* [http://en.wikipedia.org/wiki/List_of_academic_databases_and_search_engines Список баз и поисковых машин ]
* [http://en.wikipedia.org/wiki/List_of_academic_databases_and_search_engines Список баз и поисковых машин ]
-
== Домашнее задание-2 (вторая часть) ==
+
=== Домашнее задание-2 (вторая часть) ===
# Прочитать статью [[Matlab|Введение в Матлаб]].
# Прочитать статью [[Matlab|Введение в Матлаб]].
# Прочитать [[Документирование функций Matlab|Документирование функций Matlab, соглашение об именах переменных и создание отчетов о вычислительных экспериментах]].
# Прочитать [[Документирование функций Matlab|Документирование функций Matlab, соглашение об именах переменных и создание отчетов о вычислительных экспериментах]].
Строка 167: Строка 168:
# Оформить свой график согласно [[Машинное обучение и анализ данных (журнал)/Оформление графиков|рекомендациям журнала]].
# Оформить свой график согласно [[Машинное обучение и анализ данных (журнал)/Оформление графиков|рекомендациям журнала]].
-
== Домашнее задание-3 (пробное программирование) ==
+
=== Домашнее задание-3 (пробное программирование) ===
# Выбрать [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 074, весна 2013|одну из задач]], написать свою фамилию напротив задачи.
# Выбрать [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 074, весна 2013|одну из задач]], написать свою фамилию напротив задачи.
# В папке MLAlgorithms/Example2013Code cоздать папку Surmame2013Title.
# В папке MLAlgorithms/Example2013Code cоздать папку Surmame2013Title.
Строка 176: Строка 177:
# Срок выполнения работ — до следующей лекции.
# Срок выполнения работ — до следующей лекции.
-
== Домашнее задание-4 ==
+
=== Домашнее задание-4 ===
# Выбрать задание, записать название, <s>автора и рецензента (с его согласия)</s> в таблицу ([[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 074, весна 2013 | см. группа 074, весна 2013]]).
# Выбрать задание, записать название, <s>автора и рецензента (с его согласия)</s> в таблицу ([[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 074, весна 2013 | см. группа 074, весна 2013]]).
# Найти базовую литературу, занести ее в BibTeX (вариант — в список). Посмотреть данные.
# Найти базовую литературу, занести ее в BibTeX (вариант — в список). Посмотреть данные.
Строка 182: Строка 183:
# Подготовить вопросы предложения по задаче.
# Подготовить вопросы предложения по задаче.
-
=== Аннотация ===
+
''' Аннотация '''
Не более 600 символов. Строится по плану:
Не более 600 символов. Строится по плану:
* чему посвящена работа в целом,
* чему посвящена работа в целом,
Строка 190: Строка 191:
* какими примерами проиллюстрирована?
* какими примерами проиллюстрирована?
-
== Доклад-1 ==
+
=== Доклад-1 ===
Доклад по исследованию литературы и результатам постановки задач на пять минут. Требуется:
Доклад по исследованию литературы и результатам постановки задач на пять минут. Требуется:
* Список литературы, посвященной решаемой задаче
* Список литературы, посвященной решаемой задаче
Строка 197: Строка 198:
* Желателен черновик постановки задачи и пути решения задачи
* Желателен черновик постановки задачи и пути решения задачи
 +
=== Подготовка к зачету ===
 +
Экзамен будет проходить в виде доклада. Продолжительность '''5-10 минут''' и три дополнительные минуты на вопросы.
 +
Цель — показать, что результаты работы понятны специалисту, и могут быть им использованы в дальнейшем.
 +
Под специалистами понимаются ваши одногруппники и преподаватели кафедры.
-
=== Написание отчета ===
+
Во время презентации требуется:
-
* Техника, основные ошибки, типографика и русский язык (на лекции)
+
* Поставить задачу
 +
* Осветить основные принципы работы алгоритма (кратко, без деталей)
 +
* Описать интерфейсы модулей алгоритма
 +
* Показать работу алгоритма на примерах
 +
* Проанализировать свойства алгоритма
 +
 
 +
На презентации нужны:
 +
* Отчет
 +
* Код на sourceforge.net
 +
 
 +
Советы:
 +
# Подготовьте доклад с секундомером в руках
 +
# Расскажите его другу, ответьте на его вопросы
 +
 
 +
На экзамене оценивается:
 +
# Корректность математической постановки задачи
 +
# Полнота описания алгоритма
 +
# Продуманность интерфейсов
 +
# Соответствие стандартам программирования
 +
# Ясность изложения результатов
 +
# Глубина анализа свойств алгоритма
 +
# Качество рецензирования (чужой работы)
== План научной статьи ==
== План научной статьи ==
Строка 206: Строка 232:
* Название
* Название
-
* Аннотация (пишется в последнюю очередь)
+
* Аннотация (пишется в последнюю очередь): изложение краткого содержания и основных результатов (не более 600 знаков)
* Ключевые слова (используются те, которые дали хорошие результаты поиска)
* Ключевые слова (используются те, которые дали хорошие результаты поиска)
* Введение (около страницы); ниже — по абзацам, примерный план)
* Введение (около страницы); ниже — по абзацам, примерный план)
Строка 213: Строка 239:
** Современное состояние области (два-четыре абзаца)
** Современное состояние области (два-четыре абзаца)
** Что предлагается (два абзаца)
** Что предлагается (два абзаца)
 +
** Как организована работа
* Постановка задачи (примерно страница)
* Постановка задачи (примерно страница)
** Дано (как устроена выборка)
** Дано (как устроена выборка)
Строка 230: Строка 257:
** Описание полученных результатов
** Описание полученных результатов
** Выводы, сравнение результатов, полученных альтернативным путем
** Выводы, сравнение результатов, полученных альтернативным путем
-
* Заключение (пишется в последнюю очередь)
+
* Заключение (пишется в последнюю очередь): сжатое изложение результатов (1/4 страницы)
-
** Вставить ссылку на mlalgorithms/ваша_папка для того, чтобы другие исследователи могли проверить результаты или использовать их в дальнейшей работе.
+
** Желательно вставить ссылку на mlalgorithms/ваша_папка для того, чтобы другие исследователи могли проверить результаты или использовать их в дальнейшей работе.
-
* Литература
+
* Литература: опорные статьи за последние 10 лет, максимально покрывающие тематику (не менее 20 статей)
-
** Литература должна у вас уже быть по результатам доклада-1.
+
** Литература должна у вас уже быть по результатам доклада-1 (даже если она не вся указана во введении, пожалуйста, приведите полный список)
-
 
+
** Совет: используйте команду TeX \notice{*} при выводе из файла bbl для получения полного списка.
-
=== [[Написание отчётов и статей (рекомендации)|Технический отчет]]: еще раз, сжато ===
+
=== [[Написание отчётов и статей (рекомендации)|План технического отчета]] ===
* Аннотация: изложение краткого содержания и основных результатов (не более 600 знаков).
* Аннотация: изложение краткого содержания и основных результатов (не более 600 знаков).
* Введение: раскрытие темы статьи, общая постановка задачи, обзор литературы, описание подхода к решению задачи.
* Введение: раскрытие темы статьи, общая постановка задачи, обзор литературы, описание подхода к решению задачи.
Строка 244: Строка 271:
* Список литературы: желательно найти опорные статьи за последние 10 лет, максимально покрывающие тематику.
* Список литературы: желательно найти опорные статьи за последние 10 лет, максимально покрывающие тематику.
-
== Создание алгоритма ==
+
=== Разработка алгоритма ===
Основные приемы программирования — на лекции.
Основные приемы программирования — на лекции.
-
=== Папки проекта ===
+
=== Работа с репозиторием ===
В репозитории MLAlgorithms должны лежать следующие файлы и папки:
В репозитории MLAlgorithms должны лежать следующие файлы и папки:
* папка — название проекта,
* папка — название проекта,
Строка 257: Строка 284:
* (необязательно) папка '''report''' c промежуточными рисунками (рисунки и черновики отчетов вместе с кодом хранить нежелательно).
* (необязательно) папка '''report''' c промежуточными рисунками (рисунки и черновики отчетов вместе с кодом хранить нежелательно).
-
=== Работа с репозиторием ===
+
На сайте machinelearning.ru находится только вводная часть и ссылки на код и на статью.
 +
Ниже приведен шаблон, который следует скопировать и вставить в создаваемую статью.
 +
 
 +
<pre>'''Название проекта''' и его краткая аннотация, не более 600 символов
 +
== Постановка задачи ==
 +
Не более 1/2 стр.
 +
== Пути решения задачи ==
 +
Не более 1/2 стр.
 +
== Смотри также ==
 +
* [http://example.com/ Ссылка на текст статьи]
 +
* [http://example.com/ Ссылка на код]
 +
== Литература ==
 +
{{Задание|Иван Иванов|В.В.Стрижов|24 декабря 2010|Ivanov|Strijov}}
 +
[[Категория:Практика и вычислительные эксперименты]]
 +
</pre>
 +
Полезная информация:
* Адрес репозитория [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms].
* Адрес репозитория [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms].
* Совет: не загружайте в репозиторий вспомогательный файлы '''Thumbs.db''', '''.asv''' они будут мешать.
* Совет: не загружайте в репозиторий вспомогательный файлы '''Thumbs.db''', '''.asv''' они будут мешать.
Строка 295: Строка 337:
</source>
</source>
-
== Рецензирование статьей ==
+
=== Примеры рецензий ===
Примеры рецензий, который обсуждались на лекции, [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Example2012Reviews/ находятся здесь].
Примеры рецензий, который обсуждались на лекции, [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/Example2012Reviews/ находятся здесь].
-
 
+
== Справочные материалы ==
-
== Политика ==
+
=== Политика ===
# Списывание (то есть цитирование) приветствуется; использование чужого кода приветствуется вдвойне. При этом следует корректно указывать оригинального автора. Цитаты следует заключать в кавычки, например: ''«Мера~--- превыше всего»~\cite{Gasparov2004Greece}''.
# Списывание (то есть цитирование) приветствуется; использование чужого кода приветствуется вдвойне. При этом следует корректно указывать оригинального автора. Цитаты следует заключать в кавычки, например: ''«Мера~--- превыше всего»~\cite{Gasparov2004Greece}''.
# Изобретать велосипед грешно; усовершенствовать почетно.
# Изобретать велосипед грешно; усовершенствовать почетно.
# Результат важнее процесса.
# Результат важнее процесса.
-
==== NB лекционные заметки о карьере ====
+
=== Правила оформления научных работ ===
 +
* [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Рекомендуемые обозначения|Рекомендуемые обозначения]]
 +
* '''NB''' [[Media:2010`PaperExample.zip‎‎|Заготовка для русскоязычной статьи со стилевым пакетом журнала «Вычислительные технологии», ZIP]]
 +
* '''NB''' [https://mvr.svn.sourceforge.net/svnroot/mvr/TeXsamples/BeamerSlides/ Шаблон презентации Beamer-TeX]
 +
* [http://www.elsevier.com/wps/find/authors.authors/howtosubmitpaper Elsevier’s guide to publication]
 +
* [http://www.elsevier.com/framework_authors/misc/elsdoc.pdf elsarticle.cls A better way to format your submission]
 +
* [http://www.elsevier.com/framework_authors/Artwork/Artwork_2010.pdf Author Artwork Instructions]
 +
* [http://www.elsevier.com/wps/find/authorsview.authors/elsarticle The elsarticle LaTeX document class]
 +
* Russian: \usepackage[cp1251]{inputenc} \usepackage[russian]{babel}
 +
* Ключевые слова по MSC-кодам[http://www.ams.org/mathscinet/msc/msc2010.html?t=&s=15A18++Eigenvalues,+singular+values,+and+eigenvectors&btn=Search&ls=Cs]
-
Карьера:
+
{{tip|'''Совет.''' Прежде, чем показать свою работу, проверьте орфографию и пунктуацию. Формулы (в том числе и выключенные) являются частью системы пунктуации. Сверяйтесь с хорошими образцами!}}
-
# Академическая (исследования и преподавание)
+
-
# Промышленная (исследования и разработки)
+
-
# Финансовая (анализ и разработки)
+
-
# Управление (анализ и принятие решений)
+
-
== Подготовка к зачету ==
+
==== Список обозначений ====
 +
[[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Рекомендуемые обозначения]]
-
Экзамен будет проходить в виде доклада. Продолжительность '''5-10 минут''' и три дополнительные минуты на вопросы.
+
* [http://en.wikipedia.org/wiki/Notation_in_probability_and_statistics Notation in probability and statistics]
-
Цель — показать, что результаты работы понятны специалисту, и могут быть им использованы в дальнейшем.
+
* [http://en.wikipedia.org/wiki/Table_of_logic_symbols List of logic symbols]
-
Под специалистами понимаются ваши одногруппники и преподаватели кафедры.
+
* [http://en.wikipedia.org/wiki/Mathematical_notation Mathematical notation] общие сведения
 +
* Стандарт [http://en.wikipedia.org/wiki/ISO_31-11 ISO 31-11] из группы [http://en.wikipedia.org/wiki/ISO_80000 ISO 80000]; по нашей специальности [http://www.iso.org/iso/ru/catalogue_detail?csnumber=31898 IEC 80000-13:2008] (Quantities and units -- Part 13: Information science and technology)
 +
* [http://en.wikipedia.org/wiki/Abuse_of_notation Abuse of notation]
 +
* [http://en.wikipedia.org/wiki/Greek_letters_used_in_mathematics Greek letters used in mathematics]
 +
* [http://en.wikipedia.org/wiki/Roman_letters_used_in_mathematics Latin letters used in mathematics]
 +
* [http://en.wikipedia.org/wiki/Table_of_mathematical_symbols List of mathematical symbols]
 +
* [http://en.wikipedia.org/wiki/Typographical_conventions_in_mathematical_formulae Typographical conventions in mathematical formulae]
 +
* [http://en.wikipedia.org/wiki/Blackletter Blackletter]
-
Во время презентации требуется:
+
=== Необходимые программы ===
-
* Поставить задачу
+
* MiKTeX… typesetting beautiful documents… Basic MiKTeX 2.8" Installer[http://miktex.org/2.8/setup]
-
* Осветить основные принципы работы алгоритма (кратко, без деталей)
+
* LaTeX editors WinEdit[http://www.winedt.com/] OR TeXnicCenter[http://www.texniccenter.org/]
-
* Описать интерфейсы модулей алгоритма
+
* JabRef, an open source bibliography reference manager[http://jabref.sourceforge.net/]
-
* Показать работу алгоритма на примерах
+
* SciLab, the Free Platform for Numerical Computation[http://www.scilab.org/en]
-
* Проанализировать свойства алгоритма
+
* Русский словарь для редактора WinEdit [[Media:User.zip|ZIP, [1,53Мб]]], записать в папку C:\Program Files (x86)\WinEdt Team\WinEdt\Dict
 +
* InkScape, графический редактор с экспортом в LaTeX [http://www.inkscape.org сайт] и [http://www.ctan.org/tex-archive/info/svg-inkscape пример использования]
-
На презентации нужны:
+
=== Руководства по ТеХнической части ===
-
* Отчет
+
* [[LaTeX]]
-
* Код на sourceforge.net
+
* [[BibTeX]]
 +
* [http://ru.wikipedia.org/wiki/BibTeX BibTeX на Wiki]
 +
* [http://www.markschenk.com/tools/jabref/ Custom Export для JabRef]
-
Советы:
+
=== Полезные материалы и ссылки ===
-
# Подготовьте доклад с секундомером в руках
+
-
# Расскажите его другу, ответьте на его вопросы
+
-
 
+
-
На экзамене оценивается:
+
-
# Корректность математической постановки задачи
+
-
# Полнота описания алгоритма
+
-
# Продуманность интерфейсов
+
-
# Соответствие стандартам программирования
+
-
# Ясность изложения результатов
+
-
# Глубина анализа свойств алгоритма
+
-
# Качество рецензирования (чужой работы)
+
-
 
+
-
== Полезные материалы ==
+
* [[Media:PracticeStrijovTemplate1.rtf| Заготовка для статьи на machinelearning.ru]]
* [[Media:PracticeStrijovTemplate1.rtf| Заготовка для статьи на machinelearning.ru]]
* [[Логистическая регрессия (пример)|Образец статьи о выполненном практическом задании]]
* [[Логистическая регрессия (пример)|Образец статьи о выполненном практическом задании]]
Строка 358: Строка 403:
* [[CRISP-DM|CRoss Industry Standard Process for Data Mining]]
* [[CRISP-DM|CRoss Industry Standard Process for Data Mining]]
* [http://www.ml-class.org/course/video/preview_list Машинное обучение и Octave (Stanford Uni.)]
* [http://www.ml-class.org/course/video/preview_list Машинное обучение и Octave (Stanford Uni.)]
 +
* Умберто Эко. Как написать дипомную работу. Гуманитарные науки: Учебно-методическое пособие / Пер. с ит. Е.Костюкович. — 3 изд. — М., КДУ, 2004. — 240 с [http://mozg.by/system/files/UmbertoEkoDiplomnajaRabota.pdf]
 +
* А. Б. Сосинский. Как написать математическую статью по-английски. — М: Изд-во «Факториал Пресс», 2000. [http://ega-math.narod.ru/Quant/ABS.htm]
 +
* С. С. Кутателадзе. Russian-To-English in Writing: Советы эпизодическому переводчику. Новосибирск: Изд-во Ин-та математики, 2000. [http://vivovoco.rsl.ru/VV/BOOKS/RUSTOENG/CONTENT.HTM]
 +
* Ф. А. Кузин. Кандидатская диссертация. Методика написания, правила оформления и порядок защиты: Практ. пособие для аспирантов и соискателей ученой степени. — 2 - е изд. — М.: «Ось-89», 1998. [http://www.diplom-online.info/books/files/kandiser.rar]
 +
* Как написать рецензию на дипломную работу. [http://www.sessia.net/statia/23]
 +
* [http://mipt.ru/study/net_libr/ Электронные Библиотеки в МФТИ]
 +
* [http://libserv.mi.ras.ru/ Библиотека Математического института РАН]
 +
*...
-
== Заметки ==
+
=== Советы ===
-
1 лекция: вводная, плюс показ инструментов.
+
[http://aspirantspb.ru/articles/disser/wikipedia/ "Можно ли невозбранно цитировать материалы Википедии"]
-
2 лекция: введение в Матлаб (общий рассказ о роли Матлаба в программировании) / проверить как поставился софт.
+
[http://aspirantspb.ru/articles/disser/plagiat/ "Как избежать плагиата"]
-
3 лекция: структура научной статьи, плюс легкие задачи на программирование / проверить ДЗ2 + конструкции Матлаб и ТеХ.
+
 
-
4 лекция: проверка и обсуждение написанного кода (все работы)
+
== Организационные материалы ==
-
5 или 6 лекция: постановка задач.
+
=== Как подать статью в русский журнал ===
 +
Для справки: [[индекс цитирования (инструменты)]]
 +
==== Журналы ВАК ====
 +
* Журнал вычислительной математики и математической физики[http://www.maik.ru/cgi-perl/journal.pl?lang=rus&name=vychmat&page=main]
 +
* Автоматизация и современные технологии[http://www.mashin.ru/jurnal/content.php?id=2]
 +
* Проблемы машиностроения
 +
* Автоматика, связь, информатика
 +
* Интеллектуальные системы[http://intsys.msu.ru/magazine/] (Мехмат МГУ, МАТИС)
 +
* Информатика и ее применения[http://www.ipiran.ru/journal/issues/]
 +
* Информационные технологии[http://www.novtex.ru/IT/]
 +
* Информационные технологии и вычислительные системы[http://www.jitcs.ru/index.php?option=com_content&view=article&id=208]
 +
* Теория вероятностей и ее применения[http://www.tvp.ru/] (Журнал SIAM)
 +
* Обозрение прикладной и промышленной математики[http://www.tvp.ru/] (Сайт ТВП)
 +
* Проблемы прогнозирования[http://www.ecfor.ru/fp/index.php]
 +
* Заводская лаборатория[http://www.zldm.ru/]
 +
* Математическая биология и биоинформатика[http://www.matbio.org/]
 +
{{tip|'''Замечание.''' Название журнала иногда слабо связано с его тематикой.}}
 +
 
 +
==== Подаем статью в редакцию ====
 +
Статья написана, нужно:
 +
* прочитать ее громко вслух,
 +
* дать почитать рецензенту, получить критические замечания, доработать.
 +
 
 +
Затем переходим к формированию пакета документов.
 +
 
 +
# Делаем перевод названия статьи, аннотации, ключевых слов, на английский язык, внимательно вычитываем. Вставляем этот блок (название, авторы, аннотация, ключевые слова) в конец статьи.
 +
# Находим [http://www.teacode.com/online/udc/51/519.2.html подходящий УДК], ставим в первую строку, до заголовка статьи.
 +
# Собираем файл tex>pdf, проверяем название: «Author2011Title.pdf» (фамилия автора и первое или ключевое слово названия статьи).
 +
# Читаем раздел «Авторам, требования к оформлению статей» на сайте журнала, выполняем эти требования.
 +
## Если журнал принимает статьи TeX, то посылаем файлы .pdf, .tex и .eps. Рисунки .eps должны компилироваться из одной папки со статьей, из названия должны иметь вид «Author2011Title_Fig1.eps». Если журнал предлагает стилевой файл (.sty, .cls) компилируем с ним, если не предлагаем, пользуемся по умолчанию стилем atricle.
 +
## Если журнал принимает статьи MS-Word, то пользуемся конвертором [http://www.grindeq.com/ LaTeX-to-Word]; то, что он не сделал, дорабатываем руками. Замечание: рисунки для MS-Word лучше всего записывать не в формате .eps, а в формате .emf.
 +
# Делаем файл «Сведения_об_авторах.doc‎», вписываем себя (и соавторов, если есть).
 +
<pre>
 +
Сведения об авторах
 +
 
 +
Фамилия Имя Отчество
 +
студент
 +
Московский физико-технический институт
 +
119991, ГСП-1, Москва, Вавилова д. 42, оф. 151
 +
Тел. служебный: 8 (495) 135-4163
 +
Факс: 8 (495) 137-2848
 +
E-mail: Name.Surname@mipt.ru
 +
</pre>
 +
Пишем письмо следующего вида и отсылаем в журнал письмо и файл-статью (файлы, если это TeX) и файл-сведения по адресу, указанному журналом.
 +
<pre>
 +
Тема: Новая статья [Автор И.О. Название]
 +
 +
Уважаемый [Имя Отчество главного редактора журнала]!
 +
 
 +
Прошу Вас принять к рассмотрению для публикации в журнале "[Название журнала]"
 +
статью "[Название статьи]". Статья посвящена проблеме [выбора регрессионных
 +
моделей] и ранее нигде не публиковалась.
 +
 
 +
Прилагаю статью с аннотациями на русском и английском языках, а также сведения об авторах.
 +
 
 +
С уважением,
 +
[Имя Отчество Фамилия]
 +
[Организация]
 +
[телефоны для связи]
 +
 
 +
И. О. Автор, студ., Московский физико-технический институт
 +
[Название статьи]
 +
[Текст аннотации на русском языке]
 +
Ключевые слова: [пять слов или словосочетаний через запятую].
 +
 
 +
N. M. Surname, Moscow Institute of Physics and Technology
 +
[Feature selection in autoregression forecasting]
 +
[The abstract itself]
 +
Keywords: [keywords].
 +
</pre>
 +
 
 +
'''Замечание.''' Процесс рецензирования в некоторых журналах иногда занимает более года. После возможно отклонение статьи по разным причинам. Тем не менее, подавать одну и ту же статью сразу в несколько журналов не принято.
 +
 
 +
==== Работа с рецензентами ====
 +
Через некоторое время (одна-две недели) автору приходит сообщение, что статья получена редколлегией и направлена на рецензирование. Если сообщение не приходит, то нужно вежливо написать или позвонить секретарю (или ответственному редактору).
 +
 
 +
Через несколько месяцев (максимум — полгода) должна прийти одна рецензия от одного или нескольких рецензентов. Возможны варианты.
 +
# ''Статья принята при условии доработки с учетом замечаний рецензентов'' — прекрасно. Это означает, что статью внимательно прочитали и ее можно улучшить. Исправляем статью и составляем отчет о проделанной работе, который вместе со статьей отправляем в журнал. [[Media:Surname2011Title_ToRewievers.pdf|См. пример отчета.]]
 +
# ''Статья требует будет повторно рассмотрена после доработки'' — хорошо, бывают такие строгие журналы. Делаем как в пункте выше.
 +
# ''Статья принята без доработки'' — нормально, но к таким журналам нужно относиться осторожно, возможно, редколлегия статью детально не читала. Если это так, больше там не публикуемся.
 +
# ''Статья отвергнута по каким-то причинам'' — скорее всего ошибка автора статьи: статья не соответствует тематике или в редколлегии не нашлось специалиста. (А еще и так бывает: статья написана плохо, см. предпоследний пункт).
 +
# ''Статья требует существенной переработки'' — плохо;
 +
## если с детальным указанием что нужно делать, то можно попытаться исправить как в п. 1,
 +
## если без указания что нужно делать, то считаем, что редколлегия отвергла статью в вежливой форме (хотя нужно было отвергнуть явно),
 +
## статья действительно плохо написана, советуемся с коллегами/научными руководителями, они вам скажут, что думают о вашей работе.
 +
# Ответа из редколлегии нет — плохо, статью либо потеряли, либо работа редколлегии плохо организована, добиваемся ответа.
 +
 
 +
==== Работа с редактором ====
 +
Перед публикацией статьи может прийти письмо с предложением встретиться с редактором журнала для технической правки текста. Рекомендуется пойти, познакомиться с редактором и поработать вместе над статьей. Это занимает два-четыре часа. Результат — статья, приведенная в соответствие со стандартами и с нормами русского языка. Вариант: редактор присылает технические правки в файле PDF, автор их принимает или отвергает.
 +
 
 +
=== Как подать статью в международный журнал ===
 +
TODO к апрелю 2012: написать, на что нужно обратить внимание при подаче статью в журнал с высоким импакт-фактором.
 +
 
 +
==== Что сделать ====
 +
* Найти журналы опубликовавшие статьи, на которые нужно сослаться. В работе, подаваемой в журнал, желательно иметь 3-5 ссылок на его ранние номера (1-4-летней давности). В идеале нужно найти журнал, содержащий статьи, в которых предлагается "почти то же самое", что и в подаваемой статье. Желательно иметь список из 3-7 журналов. (Предпочтение научного руководителя - IF 2.0-4.0, но можно и меньше).
 +
* Журналы искать в коллекциях
 +
** [http://www.elsevier.com/wps/find/journal_browse.cws_home Elsevier]
 +
** [http://www.tandfonline.com/action/showPublications?category=43983483 Taylor&Francis]
 +
** [http://www.springer.com/computer/computer+journals?SGWID=0-40100-0-0-0 Springer]
 +
** [http://www.sciencedirect.com/science/journals Hindawi Publishing Corporation]
 +
** Других (пополнить)
 +
* Найденные журналы должны быть в списках ВАК, то есть «включены в хотя бы одну из систем цитирования Web of Science, Scopus, Web of Knowledge, [], Mathematics, [], Springer»[http://vak.ed.gov.ru/ru/help_desk/list/].
 +
** Вставить ссылку (платный вход во все перечисленные системы?[http://www.scopus.com/home.url])
 +
** Возможно, похожа база [http://www.sciencedirect.com/science/journals ScienceDirect] (там ссылка на SciVerse, они что, все слились в одну систему?).
 +
* Найти статьи, опубликованные за последние восемь лет, на которые опирается подаваемая статья. Желательно иметь список из 20 статей.
 +
* Статьи искать по всему интернету, включая платные коллекции. Желательно ссылаться на статьи из журналов списка SicenceDirect/WebOfKnowledge.
 +
 
 +
==== Список журналов ====
 +
* [http://www.journals.elsevier.com/journal-of-statistical-planning-and-inference/#description Journal of Statistical Planning and Inference] IF=0.691
 +
* [http://ieeexplore.ieee.org/xpl/RecentIssue.jsp?punumber=34 IEEE PAMI] IF=?
 +
* [http://jmlr.csail.mit.edu/ JMLR] IF=2.94.
 +
* [[Журналы ВАК по тематике ресурса]]
 +
* [[Обсуждение:Автоматизация и стандартизация научных исследований (практика, В.В. Стрижов)|Черновик в обсуждении этой страницы]]
 +
 
 +
==== Коллекции и наукометрические системы ====
 +
* [http://www.sciencedirect.com/science/journals ScienceDirect]
 +
* [http://thomsonreuters.com/products_services/science/science_products/a-z/science_citation_index?parentKey=441594 Thomson Reuters]
 +
* [http://www.hub.sciverse.com/action/home/proceed SciVerse]
 +
* [http://www.harzing.com/pop.htm Publish or Perish]
 +
* [http://academic.research.microsoft.com/ Microsof Academic Search]
 +
* [http://en.wikipedia.org/wiki/Science_Citation_Index Science Citation Index на Википедии]
 +
 
 +
==== Ликбез от Elsevier ====
 +
* [http://mediazone.brighttalk.com/comm/ReedElsevier/643174e08d-28219-2251-31480 Preparing your Manuscript]
 +
* [http://mediazone.brighttalk.com/comm/ReedElsevier/6df160b9de-28220-2251-31265 Using Proper Manuscript Language]
 +
* [http://mediazone.brighttalk.com/comm/ReedElsevier/509ba7e7a9-28221-2251-31500 Structuring an Article]
 +
* [http://www.elsevier.com/wps/find/authors.authors/editchecklist Edit checklist]
 +
* [http://www.elsevier.com/wps/find/authors.authors/highlights Article highlights]
 +
* [http://www.articleofthefuture.com/ Article of the future]
 +
 
 +
=== Библиографические базы ===
 +
* [http://liinwww.ira.uka.de/bibliography/ The Collection of Computer Science Bibliographies]
 +
* [http://en.wikipedia.org/wiki/List_of_academic_databases_and_search_engines List of academic databases and search engines на Википедии]
 +
 
 +
== На лекциях (заметки преподавателю) ==
 +
* 1 лекция: вводная, плюс показ инструментов.
 +
* 2 лекция: введение в Матлаб (общий рассказ о роли Матлаба в программировании) / проверить как поставился софт.
 +
* 3 лекция: структура научной статьи, плюс легкие задачи на программирование / проверить ДЗ2 + конструкции Матлаб и ТеХ.
 +
* 4 лекция: проверка и обсуждение написанного кода (все работы)
 +
* 5 или 6 лекция: постановка задач.
Резюме. Сократить материал не получается даже для ровной группы, курс стабилизировался.
Резюме. Сократить материал не получается даже для ровной группы, курс стабилизировался.
 +
 +
* технология работы над статьей,
 +
* способы постановки задач в ML (третье занятие),
 +
* формулировка теорем и оформление доказательств (откуда берутся и зачем нужны теоремы) ,
 +
* полнота материла (сколько материала необходимо дать, чтобы работу понимал не только автор, но и читатель),
 +
* построения предложений (собрать список неудачных фраз) (сделано),
 +
* типографика в <tex>\TeX</tex> (сделано),
 +
* написание рецензий,
 +
* написание заявок на гранты,
 +
* перевод на английский язык,
 +
* международные доклады,
 +
* [http://www.bowker.com/index.php/supportfaq-doi/346-faqs-doi-general#04 пример работы DOI]:[http://dx.doi.org/10.1016/j.camwa.2010.03.021 10.1016/j.camwa.2010.03.021] (Penalty ~ $270).
 +
*[http://www.crossref.org/guestquery/ locate a DOI]
 +
 +
=== NB лекционные заметки о карьере ===
 +
 +
Карьера:
 +
# Академическая (исследования и преподавание)
 +
# Промышленная (исследования и разработки)
 +
# Финансовая (анализ и разработки)
 +
# Управление (анализ и принятие решений)
 +
[[Категория:Учебные курсы]]
== История развития курса ==
== История развития курса ==
Строка 388: Строка 602:
</pre>
</pre>
-
== Журнал [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Машинное обучение и анализ данных|«Машинное обучение и анализ данных»]] ==
+
=== Журнал [[Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Машинное обучение и анализ данных|«Машинное обучение и анализ данных»]] ===
[http://jmlda.org/?page_id=35 Начиная с весны 2011 избранные работы по этому курсу публикуются в специальном журнале]. Цель журнала — развитие методов проведения вычислительных экспериментов в области машинного обучения и интеллектуального анализа данных.
[http://jmlda.org/?page_id=35 Начиная с весны 2011 избранные работы по этому курсу публикуются в специальном журнале]. Цель журнала — развитие методов проведения вычислительных экспериментов в области машинного обучения и интеллектуального анализа данных.
* [http://strijov.ru/uploads/ThePractice2010MIPT.pdf Пилотный выпуск, 2010]
* [http://strijov.ru/uploads/ThePractice2010MIPT.pdf Пилотный выпуск, 2010]

Версия 14:59, 10 февраля 2014

Идут ремонтные работы! Действующая страница по этой ссылке: версия этой страницы 2010-2013. Окончание работ 20 февраля.



Чтобы получать новости об изменении этой страницы, выберите вкладку "править" и поставьте галочку "Включить эту страницу в список наблюдения".


Содержание

Введение

’’Численные методы обучения по прецедентам’’ — практические занятия, посвященные исследованию свойств алгоритмов машинного обучения. Задачей третьекурсников является исследование свойств алгоритмов прогнозирования. В процессе работы студенты изучают методы и технику написания научных статей и проведения вычислительных экспериментов, а также сопутствующие этому процессу технологии — язык разметки научных текстов LaTeX, формат представления библиографической записи BibTeX, язык программирования высокого уровня m-code. Были использованы следующие инструменты: WinEdit/TeXnicCenter — набор текста, MikTex — компиляция статьи, JabRef — создание библиографический базы, SciLab/Octave/Matlab — проведение вычислительных экспериментов.

Работа включает следующие этапы: сбор и анализ литературы, математическая постановка задачи, описание метода решения задачи и исследование его свойств, проведение вычислительного эксперимента. Каждому студенту предлагается персональная тема, по которой он анализирует публикации отечественных и зарубежных исследователей за последние десять лет, ставит задачу и делает доклад для группы о полученных результатах. Далее выполняется математическое описание метода, делается промежуточный доклад о состоянии работ. Последним шагом работы становится вычислительный эксперимент, иллюстрирующий свойства метода и использующий синтетические или реальные данные. Каждая статья рецензируется одногруппниками автора, работы синхронизируются на сайте SourceForge.org, проект «MLAlgorithms».

Данный курс является первой частью цикла

  1. Численные методы обучения по прецедентам
  2. Автоматизация и стандартизация научных исследований
  3. Выполнение исследовательских проектов
  4. Руководство исследовательскими проектами

и подготовкой к основному теоретическому курсу

Элементы цикла и полезные страницы

См. также

Задачи


Цели

Абстрактная

Научиться точно, ясно, красиво излагать свои и чужие идеи.

Конкретная

Написать научную статью, которая была бы принята другими исследователями, работающими в нашей области; сделать доклад.

Результат

Научная статья, поданная в рецензируемый журнал из списка ВАК.

Требования к студентам

Предполагается, что студенты прошли следующие курсы:

  • Математический анализ.

О.В. Бесов - лекции ч. 1-2.

  • Аналитическия геометрия.

Д.В. Беклемишев. Курс аналитической геометрии и линейной алгебры

  • Дискретный анализ. Алгебра логики, комбинаторика, теория графов.

Пособие Ю.А. Флерова, Ю.И. Журавлева «Дискретный анализ»

  • Дискретный анализ. Основы высшей алгебры и теории кодирования

Ю.И. Журавлев, Ю.А. Флеров. Основы высшей алгебры

  • Дискретный анализ. Теория формальных систем и алгоритмов.

Ю.И. Журавлев, Ю.А. Флеров, М.Н. Вялый. Дискретный анализ. Основы высшей алгебры

  • Дифференциальные уравнения.

В.К. Романко. Курс дифференциальных уравнений и вариационного исчисления

  • Уравнения математической физики.
  • Теория функций комплексного переменного.

Е.С. Половинкин. Курс лекций по теории функций комплексного переменного

  • Функциональный анализ.

Р.В. Константинов. Лекции по функциональному анализу

  • Теория вероятностей.

А.А. Натан, О.Г. Горбачев, С.А. Гуз. Теория вероятностей

  • Случайные процессы

А.А. Натан, О.Г. Горбачев, С.А. Гуз. Основы теории случайных процессов

  • Математическая статистика

А.А. Натан, О.Г. Горбачев, С.А. Гуз. Математическая статистика

  • Методы оптимизации.

А.Г. Сухарев, А.В. Тимохов, В.В. Федоров. Курс методов оптимизации

  • Методы оптимального управления.

Л.А. Бекларян. Методы оптимального управления

  • Колмогоровская сложность.

В.В.Вьюгин. Колмогоровская сложность и алгоритмическая случайность

  • Прикладная статистика.

К.В. Воронцов. Прикладной статистический анализ данных

План работы

  1. Найти и описать данные. Составить список литературы, собрать публикации в bib-файл. Сделать заголовок статьи: название, аннотация.
  2. Визуализировать данные, описать полученные рисунки. Сделать обзор литературы.
  3. Написать введение: обзор методов решения задачи, описание предлагаемого подхода в целом.
  4. Поставить задачу, описать новизну подхода, сделать черновик решения задачи.
  5. Поставить вычислительный эксперимент, получить первые результаты.
  6. Описать предлагаемый подход в деталях.
  7. Завершение вычислительного эксперимента.
  8. Описание результатов вычислительного эксперимента.
  9. Критическое сравнение результатов, анализ метода.
  10. Корректировка статьи, последовательности изложения с учетом замечаний рецензента.
  11. Корректировка теоретической части статьи.
  12. Корректировка согласованности статьи. Результатом должна являться рукопись, доступная для понимания.
  13. Выбор журнала, подача статьи в журнал.
  14. Отчет

Содержание отчета

Отчет состоит из следующих материалов:

  1. научная статья,
  2. исходный код алгоритма,
  3. рецензия на работу,
  4. доклад.

Консультации и оценивание

  • На выполнение каждого задания отводится одна неделя.
  • Крайний срок предоставления результатов очередного этапа работы на проверку - Четверг, 6 утра.
  • Желательно предоставление результатов заранее.
  • Для просроченных заданий будет учитываться время задержки.

Домашние задания

Ниже перечисленные пункты являются критериями оценки качества работы (для студентов и консультантов)

Домашнее задание-1

  1. Поставить систему компьютерной алгебры Matlab (класс есть на факультете) или реруцированный заменитель Octave.
  2. Поставить систему верстки TeX MikTeX.
  3. Поставить текстовый редактор TeXnic Center, или его вариант WinEdt.
  4. Поставить библиографическую систему JabRef.
  5. Зарегистрироваться сайте-репозитории открытого кода SourceForge.net, послать логин координатору (по умолчанию это староста группы). Вводные слайды: (см. слайды по CVS).
  6. Скачать программу-оболочку для обмена кодом TortoiseSVN.
  7. Прочитать статью про SourceForge, загрузить MLAlgorithms.

Посмотреть все, что поставили, понять, как этим пользоваться на уровне интерфейсов.

[Пока недоступно] Зарегистрироваться на сайте MachineLearning.ru.

Домашнее задание-2

  1. Прочитать статью про LaTeX.
  2. Прочитать основные главы Львовский С. М. Набор и верстка в системе LaTeX.
  3. Настроить русский язык (Start->Programs->MikTeX 2.9->Maitenance->Setteings->Languages->Russian->General->Refresh/Update).
  4. Загрузить шаблон статьи, ZIP и скомпилировать.
  5. Прочитать про BibTeX.

Домашнее задание-2 (вторая часть)

  1. Прочитать статью Введение в Матлаб.
  2. Прочитать Документирование функций Matlab, соглашение об именах переменных и создание отчетов о вычислительных экспериментах.
  3. Прочитать Matlab Programming Style Guidelines.
  4. Оформить свой график согласно рекомендациям журнала.

Домашнее задание-3 (пробное программирование)

  1. Выбрать одну из задач, написать свою фамилию напротив задачи.
  2. В папке MLAlgorithms/Example2013Code cоздать папку Surmame2013Title.
  3. Сохранить туда код и графики (если задача предполагает).
  4. Графики оформлять в соответствии с рекомендациями (достаточно файла PNG).
  5. Предлагается руководствоваться стилевыми рекомендациями (в частности, назвать первый файл main или demoTitle) — этими и |этими.
  6. Собрать литературу по задаче. (На лекции: как, где и что искать? Ключевые слова для поиска.)
  7. Срок выполнения работ — до следующей лекции.

Домашнее задание-4

  1. Выбрать задание, записать название, автора и рецензента (с его согласия) в таблицу ( см. группа 074, весна 2013).
  2. Найти базовую литературу, занести ее в BibTeX (вариант — в список). Посмотреть данные.
  3. Написать аннотацию задания, поместить его в шаблон статьи (взять по ссылке тут). под задачей, там где черновой список. Обсуждаем аннотацию.
  4. Подготовить вопросы предложения по задаче.

Аннотация Не более 600 символов. Строится по плану:

  • чему посвящена работа в целом,
  • на чем сконцентрировано исследование,
  • в чем особенности исследования,
  • что новое предлагается,
  • какими примерами проиллюстрирована?

Доклад-1

Доклад по исследованию литературы и результатам постановки задач на пять минут. Требуется:

  • Список литературы, посвященной решаемой задаче
  • Аннотация работы, исправленная
  • Введение, примерно страница со ссылками на литературу
  • Желателен черновик постановки задачи и пути решения задачи

Подготовка к зачету

Экзамен будет проходить в виде доклада. Продолжительность 5-10 минут и три дополнительные минуты на вопросы. Цель — показать, что результаты работы понятны специалисту, и могут быть им использованы в дальнейшем. Под специалистами понимаются ваши одногруппники и преподаватели кафедры.

Во время презентации требуется:

  • Поставить задачу
  • Осветить основные принципы работы алгоритма (кратко, без деталей)
  • Описать интерфейсы модулей алгоритма
  • Показать работу алгоритма на примерах
  • Проанализировать свойства алгоритма

На презентации нужны:

  • Отчет
  • Код на sourceforge.net

Советы:

  1. Подготовьте доклад с секундомером в руках
  2. Расскажите его другу, ответьте на его вопросы

На экзамене оценивается:

  1. Корректность математической постановки задачи
  2. Полнота описания алгоритма
  3. Продуманность интерфейсов
  4. Соответствие стандартам программирования
  5. Ясность изложения результатов
  6. Глубина анализа свойств алгоритма
  7. Качество рецензирования (чужой работы)

План научной статьи

Пункт плана «Написание введения и постановочной части»

  • Название
  • Аннотация (пишется в последнюю очередь): изложение краткого содержания и основных результатов (не более 600 знаков)
  • Ключевые слова (используются те, которые дали хорошие результаты поиска)
  • Введение (около страницы); ниже — по абзацам, примерный план)
    • Основное сообщение — чему посвящена работа (одна-две фразы)
    • Обзор литературы — развитие предлагаемой идеи (не более двух абзацев)
    • Современное состояние области (два-четыре абзаца)
    • Что предлагается (два абзаца)
    • Как организована работа
  • Постановка задачи (примерно страница)
    • Дано (как устроена выборка)
    • Предполагается, что (статистические гипотезы, гипотезы порождения данных)
    • Ограничения и другие предположения о характере данных
    • Функционал или критерий качества искомой модели, решения (часто вытекает из гипотезы порождения данных)
    • Дополнительные требования (разбиения выборки, скользящий контроль, требования к мультиколлинеарности и подобное)
  • Решение: математическая часть (тут название первого раздела)
    • Описание алгоритма
    • Исследуемые свойства алгоритма
  • Другие разделы (если есть)
  • Решение: алгоритмическая часть (часто уходит в следующий раздел)
  • Вычислительный эксперимент
    • Описание задачи, кратко
    • Описание данных, достаточное, чтобы воспроизвести эксперимент самостоятельно
    • Описание алгоритма или ход эксперимента
    • Описание полученных результатов
    • Выводы, сравнение результатов, полученных альтернативным путем
  • Заключение (пишется в последнюю очередь): сжатое изложение результатов (1/4 страницы)
    • Желательно вставить ссылку на mlalgorithms/ваша_папка для того, чтобы другие исследователи могли проверить результаты или использовать их в дальнейшей работе.
  • Литература: опорные статьи за последние 10 лет, максимально покрывающие тематику (не менее 20 статей)
    • Литература должна у вас уже быть по результатам доклада-1 (даже если она не вся указана во введении, пожалуйста, приведите полный список)
    • Совет: используйте команду TeX \notice{*} при выводе из файла bbl для получения полного списка.

План технического отчета

  • Аннотация: изложение краткого содержания и основных результатов (не более 600 знаков).
  • Введение: раскрытие темы статьи, общая постановка задачи, обзор литературы, описание подхода к решению задачи.
  • Постановка задачи: полная формальная постановка, введение обозначений, принятие необходимых гипотез, задание функционалов качества.
  • Описание алгоритма (возможно несколько разделов): математическое описание предлагаемого алгоритма, исследование его свойств, доказательство необходимых теорем.
  • Вычислительный эксперимент: описание исходных и производных данных, описание технической части алгоритма (если необходимо), описание результатов, сравнение их с результатами других алгоритмов; крайне желательны иллюстрации.
  • Заключение: сжатое изложение результатов (1/4 страницы).
  • Список литературы: желательно найти опорные статьи за последние 10 лет, максимально покрывающие тематику.

Разработка алгоритма

Основные приемы программирования — на лекции.

Работа с репозиторием

В репозитории MLAlgorithms должны лежать следующие файлы и папки:

  • папка — название проекта,
  • (необязательно) в ее корне файл plan_Ivan_Ivanov.tex с текущими замечаниями и договоренностями,
  • папка code с кодом проекта,
    • в этой папке выделить файл, который нужно запустить, чтобы посмотреть отчет, например demoProjectName.mat,
  • папка data с данными по проекту (исходными и производными в .mat),
  • папка doc с документацией и со статьей (обязательно хранить там .pdf, .tex, финальные версии рисунков .eps/.pdf; удалять все временные файлы),
  • (необязательно) папка report c промежуточными рисунками (рисунки и черновики отчетов вместе с кодом хранить нежелательно).

На сайте machinelearning.ru находится только вводная часть и ссылки на код и на статью. Ниже приведен шаблон, который следует скопировать и вставить в создаваемую статью.

'''Название проекта''' и его краткая аннотация, не более 600 символов
== Постановка задачи ==
Не более 1/2 стр. 
== Пути решения задачи ==
Не более 1/2 стр. 
== Смотри также == 
* [http://example.com/ Ссылка на текст статьи]
* [http://example.com/ Ссылка на код]
== Литература ==
{{Задание|Иван Иванов|В.В.Стрижов|24 декабря 2010|Ivanov|Strijov}}
[[Категория:Практика и вычислительные эксперименты]]

Полезная информация:

Вычислительный эксперимент

Вычислительный эксперимент состоит следующих шагов:

  1. Порождение модельных данных или загрузка реальных данных
  2. Предобработка данных (если требуется)
  3. Визуализация данных (если требуется)
  4. Выполнение алгоритма, получение результатов
  5. Визуализация результатов
  6. Исследование свойств алгоритма
  7. Выводы

Рецензирование работы

После написания текста статьи, кода алгоритмов и кода вычислительного эксперимента, студент должен написать рецензенту письмо о готовности к получению рецензии. После этого:

Рецензент

  • В статье на ML ставит пометки \footnote{Замечание к статье}.
  • В m-файлах ставит пометки % FIXIT Замечание к коду.

Рецензенту желательно сохранить список найденных ошибок, чтобы показать качество своей работы на экзамене.

Исполнитель

  • В статье на ML вносит требуемые исправления и снимает пометки \footnote{Замечание к статье}.
  • В m-файлах вносит требуемые исправления и исправляет пометки % FIXIT на %FIXED.
Рецензент отвечает за качество работы, но должен быть благожелателен к исполнителю. Критерий качества работы: рецензент с удовольствием готов использовать рецензируемую работу для решения своих задач.


Соглашение о комментировании

Приняты следующие комментарии, добавляемые в код при его проверке:

% FIXIT - желательно изменить код (улучшить структуру кода или устранить ошибку), 
% FIXED - устраненные ошибки или улучшенный код, 
% NOTE - комментарий для обмена мнениями,
% TODO - желательно выполнить работу.

Примеры рецензий

Примеры рецензий, который обсуждались на лекции, находятся здесь.

Справочные материалы

Политика

  1. Списывание (то есть цитирование) приветствуется; использование чужого кода приветствуется вдвойне. При этом следует корректно указывать оригинального автора. Цитаты следует заключать в кавычки, например: «Мера~--- превыше всего»~\cite{Gasparov2004Greece}.
  2. Изобретать велосипед грешно; усовершенствовать почетно.
  3. Результат важнее процесса.

Правила оформления научных работ


Совет. Прежде, чем показать свою работу, проверьте орфографию и пунктуацию. Формулы (в том числе и выключенные) являются частью системы пунктуации. Сверяйтесь с хорошими образцами!


Список обозначений

Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Рекомендуемые обозначения

Необходимые программы

  • MiKTeX… typesetting beautiful documents… Basic MiKTeX 2.8" Installer[2]
  • LaTeX editors WinEdit[3] OR TeXnicCenter[4]
  • JabRef, an open source bibliography reference manager[5]
  • SciLab, the Free Platform for Numerical Computation[6]
  • Русский словарь для редактора WinEdit ZIP, [1,53Мб], записать в папку C:\Program Files (x86)\WinEdt Team\WinEdt\Dict
  • InkScape, графический редактор с экспортом в LaTeX сайт и пример использования

Руководства по ТеХнической части

Полезные материалы и ссылки

Советы

"Можно ли невозбранно цитировать материалы Википедии" "Как избежать плагиата"

Организационные материалы

Как подать статью в русский журнал

Для справки: индекс цитирования (инструменты)

Журналы ВАК

  • Журнал вычислительной математики и математической физики[12]
  • Автоматизация и современные технологии[13]
  • Проблемы машиностроения
  • Автоматика, связь, информатика
  • Интеллектуальные системы[14] (Мехмат МГУ, МАТИС)
  • Информатика и ее применения[15]
  • Информационные технологии[16]
  • Информационные технологии и вычислительные системы[17]
  • Теория вероятностей и ее применения[18] (Журнал SIAM)
  • Обозрение прикладной и промышленной математики[19] (Сайт ТВП)
  • Проблемы прогнозирования[20]
  • Заводская лаборатория[21]
  • Математическая биология и биоинформатика[22]
Замечание. Название журнала иногда слабо связано с его тематикой.


Подаем статью в редакцию

Статья написана, нужно:

  • прочитать ее громко вслух,
  • дать почитать рецензенту, получить критические замечания, доработать.

Затем переходим к формированию пакета документов.

  1. Делаем перевод названия статьи, аннотации, ключевых слов, на английский язык, внимательно вычитываем. Вставляем этот блок (название, авторы, аннотация, ключевые слова) в конец статьи.
  2. Находим подходящий УДК, ставим в первую строку, до заголовка статьи.
  3. Собираем файл tex>pdf, проверяем название: «Author2011Title.pdf» (фамилия автора и первое или ключевое слово названия статьи).
  4. Читаем раздел «Авторам, требования к оформлению статей» на сайте журнала, выполняем эти требования.
    1. Если журнал принимает статьи TeX, то посылаем файлы .pdf, .tex и .eps. Рисунки .eps должны компилироваться из одной папки со статьей, из названия должны иметь вид «Author2011Title_Fig1.eps». Если журнал предлагает стилевой файл (.sty, .cls) компилируем с ним, если не предлагаем, пользуемся по умолчанию стилем atricle.
    2. Если журнал принимает статьи MS-Word, то пользуемся конвертором LaTeX-to-Word; то, что он не сделал, дорабатываем руками. Замечание: рисунки для MS-Word лучше всего записывать не в формате .eps, а в формате .emf.
  5. Делаем файл «Сведения_об_авторах.doc‎», вписываем себя (и соавторов, если есть).
Сведения об авторах

Фамилия Имя Отчество
студент
Московский физико-технический институт
119991, ГСП-1, Москва, Вавилова д. 42, оф. 151
Тел. служебный: 8 (495) 135-4163 
Факс: 8 (495) 137-2848 
E-mail: Name.Surname@mipt.ru

Пишем письмо следующего вида и отсылаем в журнал письмо и файл-статью (файлы, если это TeX) и файл-сведения по адресу, указанному журналом.

Тема: Новая статья [Автор И.О. Название]
 
Уважаемый [Имя Отчество главного редактора журнала]!

Прошу Вас принять к рассмотрению для публикации в журнале "[Название журнала]"
статью "[Название статьи]". Статья посвящена проблеме [выбора регрессионных 
моделей] и ранее нигде не публиковалась. 

Прилагаю статью с аннотациями на русском и английском языках, а также сведения об авторах.

С уважением,
[Имя Отчество Фамилия]
[Организация]
[телефоны для связи]

И. О. Автор, студ., Московский физико-технический институт
[Название статьи]
[Текст аннотации на русском языке]
Ключевые слова: [пять слов или словосочетаний через запятую].

N. M. Surname, Moscow Institute of Physics and Technology
[Feature selection in autoregression forecasting]
[The abstract itself]
Keywords: [keywords].

Замечание. Процесс рецензирования в некоторых журналах иногда занимает более года. После возможно отклонение статьи по разным причинам. Тем не менее, подавать одну и ту же статью сразу в несколько журналов не принято.

Работа с рецензентами

Через некоторое время (одна-две недели) автору приходит сообщение, что статья получена редколлегией и направлена на рецензирование. Если сообщение не приходит, то нужно вежливо написать или позвонить секретарю (или ответственному редактору).

Через несколько месяцев (максимум — полгода) должна прийти одна рецензия от одного или нескольких рецензентов. Возможны варианты.

  1. Статья принята при условии доработки с учетом замечаний рецензентов — прекрасно. Это означает, что статью внимательно прочитали и ее можно улучшить. Исправляем статью и составляем отчет о проделанной работе, который вместе со статьей отправляем в журнал. См. пример отчета.
  2. Статья требует будет повторно рассмотрена после доработки — хорошо, бывают такие строгие журналы. Делаем как в пункте выше.
  3. Статья принята без доработки — нормально, но к таким журналам нужно относиться осторожно, возможно, редколлегия статью детально не читала. Если это так, больше там не публикуемся.
  4. Статья отвергнута по каким-то причинам — скорее всего ошибка автора статьи: статья не соответствует тематике или в редколлегии не нашлось специалиста. (А еще и так бывает: статья написана плохо, см. предпоследний пункт).
  5. Статья требует существенной переработки — плохо;
    1. если с детальным указанием что нужно делать, то можно попытаться исправить как в п. 1,
    2. если без указания что нужно делать, то считаем, что редколлегия отвергла статью в вежливой форме (хотя нужно было отвергнуть явно),
    3. статья действительно плохо написана, советуемся с коллегами/научными руководителями, они вам скажут, что думают о вашей работе.
  6. Ответа из редколлегии нет — плохо, статью либо потеряли, либо работа редколлегии плохо организована, добиваемся ответа.

Работа с редактором

Перед публикацией статьи может прийти письмо с предложением встретиться с редактором журнала для технической правки текста. Рекомендуется пойти, познакомиться с редактором и поработать вместе над статьей. Это занимает два-четыре часа. Результат — статья, приведенная в соответствие со стандартами и с нормами русского языка. Вариант: редактор присылает технические правки в файле PDF, автор их принимает или отвергает.

Как подать статью в международный журнал

TODO к апрелю 2012: написать, на что нужно обратить внимание при подаче статью в журнал с высоким импакт-фактором.

Что сделать

  • Найти журналы опубликовавшие статьи, на которые нужно сослаться. В работе, подаваемой в журнал, желательно иметь 3-5 ссылок на его ранние номера (1-4-летней давности). В идеале нужно найти журнал, содержащий статьи, в которых предлагается "почти то же самое", что и в подаваемой статье. Желательно иметь список из 3-7 журналов. (Предпочтение научного руководителя - IF 2.0-4.0, но можно и меньше).
  • Журналы искать в коллекциях
  • Найденные журналы должны быть в списках ВАК, то есть «включены в хотя бы одну из систем цитирования Web of Science, Scopus, Web of Knowledge, [], Mathematics, [], Springer»[23].
    • Вставить ссылку (платный вход во все перечисленные системы?[24])
    • Возможно, похожа база ScienceDirect (там ссылка на SciVerse, они что, все слились в одну систему?).
  • Найти статьи, опубликованные за последние восемь лет, на которые опирается подаваемая статья. Желательно иметь список из 20 статей.
  • Статьи искать по всему интернету, включая платные коллекции. Желательно ссылаться на статьи из журналов списка SicenceDirect/WebOfKnowledge.

Список журналов

Коллекции и наукометрические системы

Ликбез от Elsevier

Библиографические базы

На лекциях (заметки преподавателю)

  • 1 лекция: вводная, плюс показ инструментов.
  • 2 лекция: введение в Матлаб (общий рассказ о роли Матлаба в программировании) / проверить как поставился софт.
  • 3 лекция: структура научной статьи, плюс легкие задачи на программирование / проверить ДЗ2 + конструкции Матлаб и ТеХ.
  • 4 лекция: проверка и обсуждение написанного кода (все работы)
  • 5 или 6 лекция: постановка задач.

Резюме. Сократить материал не получается даже для ровной группы, курс стабилизировался.

  • технология работы над статьей,
  • способы постановки задач в ML (третье занятие),
  • формулировка теорем и оформление доказательств (откуда берутся и зачем нужны теоремы) ,
  • полнота материла (сколько материала необходимо дать, чтобы работу понимал не только автор, но и читатель),
  • построения предложений (собрать список неудачных фраз) (сделано),
  • типографика в \TeX (сделано),
  • написание рецензий,
  • написание заявок на гранты,
  • перевод на английский язык,
  • международные доклады,
  • пример работы DOI:10.1016/j.camwa.2010.03.021 (Penalty ~ $270).
  • locate a DOI

NB лекционные заметки о карьере

Карьера:

  1. Академическая (исследования и преподавание)
  2. Промышленная (исследования и разработки)
  3. Финансовая (анализ и разработки)
  4. Управление (анализ и принятие решений)

История развития курса

Ранние версии:

Шаблон статьи для сайта ML

'''Название проекта''' и его аннотация, не более 600 символов
== Постановка задачи ==

== Описание алгоритма ==
И другие разделы

== Смотри также == 
* Полный текст этой работы [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/electricity%20forcasting/doc/Dzhamtyrova10forecasting.pdf PDF]
* Ссылка на код [https://mlalgorithms.svn.sourceforge.net/svnroot/mlalgorithms/electricity%20forcasting/doc/Dzhamtyrova10forecasting.pdf PDF]

== Литература ==
{{Задание|Иван Иванов|В.В.Стрижов|24 декабря 2010|Ivanov|Strijov}}
[[Категория:Практика и вычислительные эксперименты]]

Журнал «Машинное обучение и анализ данных»

Начиная с весны 2011 избранные работы по этому курсу публикуются в специальном журнале. Цель журнала — развитие методов проведения вычислительных экспериментов в области машинного обучения и интеллектуального анализа данных.

Личные инструменты