Участник:Камиль
Материал из MachineLearning.
Научно-исследовательская работа
МФТИ, ФУПМ
Кафедра "Интеллектуальные системы"
Направление "Интеллектуальный анализ данных"
kamilsafin.95@gmail.com
Весна 2016, 6-й семестр
Определение заимствований в тексте без указания источника.
Работа посвящена поиску внутренних заимствований в тексте. Предполагается, что большая часть текста написана одним автором. Необходимо выделить участки текста, написанные другим автором, если таковые имеются. При этом документ анализируется изолированно, то есть источники заимствований неизвестны. В работе предлагается алгоритм, строящий статистику сегментов текста, по которой определяется факт зависимости. Эксперимент проводится на коллекции конкурса PAN-2011.
Публикации
К.Ф. Сафин, М.П. Кузнецов, М.В. Кузнецова Определение заимствований в тексте без указания источника. // Подана в журнал "Информатика и ее приложения"
Конференции
К.Ф. Сафин Определение заимствований в тексте без указания источника. "59-я научная конференция МФТИ"