Анализ поведения по сигналам носимых устройств

Материал из MachineLearning.

(Различия между версиями)

Перейти к: навигация, поиск

Текущая версия

Короткий адрес: http://bit.ly/2r3y70F

Содержание

1 Проекты
- 1.1 Задача
2 Данные, ссылки на коллекции
3 Библиографические коллекции

Проекты

Задача

Название: Порождение признаков с помощью локально-аппроксимирующих моделей
Задача: Требуется проверить выполнимость гипотезы о простоте выборки для порожденных признаков. Признаки - оптимальные параметры аппроксимирующих моделей. При этом вся выборка не является простой и требует смеси моделей для ее аппроксимации. Исследовать информативность порожденных признаков - параметров аппроксимирующих моделей, обученных на сегментах исходного временного ряда.
Данные:
- WISDM (Kwapisz, J.R., G.M. Weiss, and S.A. Moore. 2011. Activity recognition using cell phone accelerometers. ACM SigKDD Explorations Newsletter. 12(2):74–82.), USC-HAD или сложнее. Данные акселерометра (Human activity recognition using smart phone embedded sensors: A Linear Dynamical Systems method, W Wang, H Liu, L Yu, F Sun - Neural Networks (IJCNN), 2014)
- (Временной ряд (библиотека примеров), раздел Accelerometry).
Литература:
- Кузнецов М.П., Ивкин Н.П. Алгоритм классификации временных рядов акселерометра по комбинированному признаковому описанию // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1471-1483.[1]
- Карасиков М.Е., Стрижов В.В. Классификация временных рядов в пространстве параметров порождающих моделей // Информатика и ее применения, 2016.URL
- Кузнецов М.П., Ивкин Н.П. Алгоритм классификации временных рядов акселерометра по комбинированному признаковому описанию // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1471 - 1483. URL
- Исаченко Р.В., Стрижов В.В. Метрическое обучение в задачах многоклассовой классификации временных рядов // Информатика и ее применения, 2016, 10(2) : 48-57. URL
- Задаянчук А.И., Попова М.С., Стрижов В.В. Выбор оптимальной модели классификации физической активности по измерениям акселерометра // Информационные технологии, 2016. URL
- Motrenko A.P., Strijov V.V. Extracting fundamental periods to segment human motion time series // Journal of Biomedical and Health Informatics, 2016, Vol. 20, No. 6, 1466 - 1476. URL
- Ignatov A., Strijov V. Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer // Multimedia Tools and Applications, 2015, 17.05.2015 : 1-14. URL
- Аникеев Д.А., Пенкин Г.О., Стрижов В.В. Классификация физической активности человека с помощью локальных аппроксимирующих моделей // Информатика и ее применения, 2018, 18(1) : 144-145. [2]
- Isachenko R.V., Bochkarev А.М., Zharikov I.N., Strijov V.V. Feature Generation for Physical Activity Classification // Artificial Intelligence and Decision Making, 2018, 3 : 20-27. [3]
Базовый алгоритм: Описан в работе Кузнецова, Ивкина.
Решение: Требуется построить набор локально-аппроксимирующих моделей и выбрать наиболее адекватные.
Новизна: Создан стандарт построения локально-аппроксимирующих моделей.
Авторы: С.Д. Иванычев, Р.Г. Нейчев, В.В. Стрижов

Данные, ссылки на коллекции

https://data.world/uci/smartphone-dataset-for-human-activity-recognition

Smartphone Dataset for Human Activity Recognition, created 08/2017/

This dataset contains data from 30 users within the age group of 22-79 years.

http://extrasensory.ucsd.edu/

A dataset for behavioral context recognition in-the-wild from mobile sensors, the dataset was collected in 2015-2016.

This dataset contains data from 60 users.

https://easy.dans.knaw.nl/ui/datasets/id/easy-dataset:78937/tab/1

Multi sensor-orientation movement data of goats, created 03/2018 3-axis accelerometer,

high-impact accelerometer, gyroscope, and magnetometer. All sensors were sampled at 100 Hz.

https://easy.dans.knaw.nl/ui/datasets/id/easy-dataset:76131

Generic online animal activity recognition on collar tags, created 09/2017. This dataset contains data from 6 animals.

http://physionet.org/

“PhysioNet offers free web access to large collections of recorded physiologic signals (PhysioBank) and related open-source software (PhysioToolkit).”

http://www.cis.fordham.edu/wisdm/dataset.php

WISDM

Библиографические коллекции

Категория:Статьи

Способы оценки качества и сравнения результатов

http://libgen.asia/db54d550f5d5e7c8612212517e59adf0/fuchs2010.pdf

Эталон

Andre Gensler, Bernhard Sick. Novel Criteria to Measure Performance of Time Series

Segmentation Techniques // In: T. Seidl, M. Hassani, C. Beecks (Eds.): Proceedings of the LWA 2014 Workshops: KDML, IR, FGWM, Aachen, Germany, 8-10 September 2014

Основные проблемы анализа поведения и классификации движений

Построение суперпозиций движений

Алгоритмы подсчета числа/выделения шагов по данным акселерометра

http://www.cl.cam.ac.uk/~ab818/StepDetectionSmartphones.pdf

обзор подходов к выдлению куска, где человек идет, и шагов на этом куске

Many algorithms search instead for the periods inherent in the cyclic nature of walking [1, 18, 24]. Technically the cycle is

across a stride (two steps), although a sensor sited along the body’s mid-axis can exhibit a one-step period if the user’s gait

is symmetric. Typical stride frequencies are around 1–2 Hz, a range that few activities other than walking exhibit.

http://nitarc.be/map/bachelor/Olaf/Sources/Projectcode%20Filters/Papers/Automatic%20Step%20Detection%20in%20the%20Accelerometer%20Signal.pdf

H. Ying, C. Silex, A. Schnitzer, S. Leonhardt, and M.Schiek,

“Automatic step detection in the accelerometer signal.”

1) определение пиков и их подсчет (trshold method, adaptive/dynamic treshold ).

2) Pan-Tompkins: применяется набор фильтров, после чего сигнал имеет дискретный вид типа -1 0 1

3) С использованием модели - сравнение с шаблоном (template matching) - DTW или кросскорреляция

http://nitarc.be/map/paper/AMBIT_ThuerVerwimp.pdf

Step Detection Algorithms for Accelerometers

Применяют все перечисленное + на выделенных шагах ищут момент heel strike - вроде как тоже модель

http://www.am.sanken.osaka-u.ac.jp/~makihara/pdf/accv2010_phase.pdf

Phase Registration of a Single Quasi-Periodic Signal Using Self Dynamic Time Warping

3 Hz-filtering: nobody can walk with a speed of more than three steps per second. [Accelerometry based assessment of gait parameters in children, https://www.mcroberts.nl/files/Brandes.pdf]

Работы по выделению периода для периодических и квазипериодических временных рядов

http://www.stat.tamu.edu/~suhasini/teaching613/walker71.pdf

Walker, A. M. (1971) On the estimation of a harmonic component in a time series with stationary independent residuals. Biometrika 58, 21–36.

Приближаем сигнал моделью вида сумма синусоид с различными частотами + шум и приближаем все это наименьшими квадратами

По понятным причинам не очень хорошо работает для квазипериодических рядов

http://www.jstor.org/stable/3212772

Hannan, E. J. (1973) The estimation of frequency. Journal of Applied Probability 10, 510–9.

Почти такая же классика - максимизация периодограммы, асимптотически эквивалентная наименьшим квадратам (Quinn, B. G. (2009) Recent advances in rapid frequency estimation. DigitalSignalProcessing 19, 942–8, http://linkinghub.elsevier.com.sci-hub.org/retrieve/pii/S1051200408000559)

как правило, осуществляется с помощью FFT

http://biomet.oxfordjournals.org.sci-hub.org/content/78/3/489.short

B.G. Quinn, J.M. Fernandes, A fast eﬃcient technique for the estimation of frequency, Biometrika 78 (1991) 489–498

Расширение методов фильтрации, основанных на применении FFT/максимизации периодограммы - поволяет отказаться от прдположений о независимости ошибок в модели

Ряд приближается моделью ARMA(2,2), частота оценивается итеративно

http://cseweb.ucsd.edu/~saul/papers/nmf_nips04.pdf

Sha, F. and Saul, L. K. (2005) Real-time pitch determination of one or more voices by nonnegative matrix factorization

Рассматривают аргумент гармоники как меняющуюся во времени фазу, а частоту определют как ее проиводную (instatenious frequency, IF). Также вводят понятие фундаментальной частоты - это самая низкая частота. Фундаментальная частота определяется как неподвижная точка преобразования, определяемого как производная фазы фурье-компонент (short time FT) исходного сигнала по времени. Неотрицательное разложение матриц используется для выделения разных голосов в обработке речи.

http://www.wakayama-u.ac.jp/~kawahara/PSSws/k012.pdf

Kawahara, H., Katayose, H., Cheveigne, A. de and Patterson, R. D. (1999) Fixed point analysis of frequency to instantaneous frequency mapping for

accurate estimation of f0 and periodicity

Развитие метода, предложенного в предыдущей статье: среди всех неподвижных точек выбирается точка с наименьшей оценкой Carrier-to-noise ratio. Для оценки C/N ration используется соображние о необходимости выполения основного тригонометрического тождества для первой и второй прозводных выделенного процесса. Также предлагается использовать квадратичное приближение кривых частоты-фазы для устранения размытия в области высоких частот (непонятная часть)

http://qspace.qu.edu.qa/bitstream/handle/10576/10682/Boashash_1992_Proceedings%20of%20IEEE_tutorial%20on%20IF%20algorithms%20&%20applications.pdf?sequence=1

Boashash, B. (1992b) Estimating and interpreting the instantaneous frequency of a signal–part 2: algorithms and applications

переписывает множество оценок частоты непрерывного сигнала в дискретном случае

On multiple pattern extraction using singular value decomposition

Partha Pratim Kanjilal, Sarbani Palit

IEEE transactions on signal processing, Vol. 43, No. 6, pp. 1536-1540. 1995.

Robust method for periodicity detection and characterization of irregular cyclical seriesin terms of embedded periodic components, 1999

P. P. Kanjilal, J. Bhattacharya and G. Saha

Про устойчивость сингулярного разложения: SVD is the most robust null-space detector

of a matrix compared to other eigen decompositions [22]; it is numerically well conditioned and can be computed in a numerically stable way. The efficiency of SVD in noise separation and in estimating embedding dimension is well established [23]

http://people.duke.edu/~mk176/publications/KumarEtAl_CRB_JofHydrology.pdf

Выбор главных компонент на основе анализа пространства сингулярные величины главных компонент - соответствующие им частоты

Построение ансамблей моделей для порождения простых выборок (Сергей Иванычев – диплом)

Построение моделей локальной аппроксимации. Разметка времени жизни, стандартизация моделей локальной аппроксимации

https://doi.org/10.1109/TNNLS.2016.2531089

https://doi.org/10.1007/s10444-016-9483-y

https://doi.org/10.1007/s00521-015-2039-0

https://doi.org/10.1016/j.neucom.2018.02.074

https://academic.oup.com/biostatistics/advance-article/doi/10.1093/biostatistics/kxx070/4788724

https://doi.org/10.1016/j.ins.2018.02.041

https://doi.org/10.1016/j.asoc.2017.11.037

https://doi.org/10.1016/j.asoc.2018.01.002

Обучение по частичной разметке и локальная аппроксимация (Оценка необходимого числа измерений, необходимого объема выборки)

https://doi.org/10.1002/bimj.201700021

Сегментация временного ряда (Технологическая - прогнозирование времени отключения акселерометра)

http://repository.cmu.edu/cgi/viewcontent.cgi?article=1146&context=robotics

Aligned Cluster Analysis for Temporal Segmentation of Human Motion

Feng Zhou, Fernando De la Torre

Используют kernel k-means для клатеризации сегментов. В качестве расстояния между сегментами берется модификация DTW, Dynamic Time Alignment Kernel (DTAK). Этот вариант расстояния хорош тем, что он является метрикой на временных рядах (удовлетворяет свойству треуголиника, в отличие от DTW). Решается задача оптимизации суммарного расстояния от каждого сегмента до центра кластера методом координатного спуска. Результатом становится разбиение ряда на сегменты и кластеризация сегментов.

Предлагают решать это все динамическим программированием, разбивая сегменты и находя оптимум на подсегментах. Такое представление позволяет контролировать длину сегмента.

Еще тут предлагают уменьшить количество обрабатываемых данных (removing redundancy). Говорят, что человек двигается достаточно плавно и все ряды локально линейны, так что какие-то линейные куски можно вообще выбросить. Эта часть мне пока не очень понятна.

http://citeseerx.ist.psu.edu/viewdoc/download?rep=rep1&type=pdf&doi=10.1.1.214.2162

Hierarchical Aligned Cluster Analysis for Temporal Clustering of Human Motion

Тот же метод (ACA) предлагают использовать иерархически, применяя его снизу вверх: сначала ряд делится на буквы, затем раз из букв на слова и т.д. При этом расстояние Dynamic Time Alignment Kernel между ::сегментами текущего уровня вычиляетс с учетом его значений на предыдущих уровнях.

https://www.ri.cmu.edu/pub_files/pub4/de_la_torre_frade_fernando_2007_1/de_la_torre_frade_fernando_2007_1.pdf

Temporal Segmentation of Facial Behavior

Fernando De la Torre

Тут тоже есть иерархия: сначала выделяют отдельные кластеры с “изображениями” лиц (буквы?), а затем группируют их в динамические выражения лица (видимо, слова).

Выделение букв делается приблизительно тем же kernel k-means, расстояние - Гауссово + прикручивается матрица, которая отвечает за инвариантность относительно угла обзора.

Затем они хотят выделять слова - повторяющиеся последовательности букв. Для этого они сначала находят подпоследовательности одинаковых букв и сопоставляют каждой подпоследовательности его букву. Так получается уменьшенный ряд (это проявление все того же removing redundancy). Затем из полученного ряда берутся длинные куски (8-9 букв) и вычисляется нормализованная корреляция куска с исходным рядом (видимо, с его уменьшенно-буквенным представлением). Все куски, у которых корреляция порядка единицы, удаляются. Затем смотрим куски меньшей длины, и так пока не рассмотрим все буквы.

Статья написана достаточно мутно

http://graphics.cs.cmu.edu/projects/segmentation/segmentation.pdf

Segmenting Motion Capture Data into Distinct Behaviors

Jernej Barbic Alla Safonova Jia-Yu Pan Christos Faloutsos

Утверждают, что сегментируют ряды на более высоком уровне - слова в предложения

Используют вероятностный PCA. Временные ряды в пространстве двух первых главных компонент образуют кластеры, соотвествующие типам движения

Скользящим окном читается расстояние Махаланобиса и по его поведению определяется момент разладки

http://web.media.mit.edu/~cynthiab/Readings/Mataric-etal-02.pdf

O. C. Jenkins and M. J. Mataric. Deriving action and behavior primitives from human motion data

Тоже PCA, для разрезов берутся

1) точки нулевой скорости, так как при изменении движения меняется скорость и ее направления.

2) минимумы угловой скорости, видимо, из тех же соображений

http://machinelearning.wustl.edu/mlpapers/paper_files/icml2004_JenkinsM04.pdf

further extended the work by finding a non-linear embedding that reveals the temporal structure of segmented motion

http://www.cs.ubc.ca/~beaudoin/papers/2008-sca-mmg.pdf

P. Beaudoin, S. Coros, M. van de Panne, and P. Poulin, “Motion-motif graphs,” in ACM SIGGRAPH / Eurographics Symposium on Computer Animation, 2008.

Developed a string-based motif-ﬁnding algorithm to decompose actions into action primitives and interpret actions as a composition on the alphabet of these action primitives. The algorithm allows for a user-controlled compromise between motif length and the number of motions in a motif.

1) уменьшают размерность с помощью PCA

2) каждому отсчету времени - по букве с помощью k-means кластеризации

3) повторения одной и той же буквы сокращаются до одного

4) подпоследовательности букв кластеризуются с использованием матрицы смежности букв (буквы читаются смежными, если соответсвующие им сферические кластеры пересекаются). Наличие пути между словами подразумевает возможность построить разумное соответствие между ними

Получаем кластеризацию слов. Слова в кластере усредняются, по усредненному слова осуществляется интерпретация?

5) Для порождающих целей строится направленный граф с вершинами-словами. Из вершины в вершмну есть ребро, если существует путь от слова к слову.

https://doi.org/10.1007/s11063-017-9592-8

https://web.stanford.edu/~hallac/GGS.pdf

http://eprints.lse.ac.uk/64863/8/Fryzlewicz_Multiple%20change-point%20detection_2017_published%20LSERO.pdf

https://doi.org/10.1177/0278364917713116

https://doi.org/10.1109/JSEN.2017.2703859

https://doi.org/10.1117/12.2262918

https://doi.org/10.1145/3014812.3014875

Оптимизация параметров моделей на оси времени, замена DTW на градиентный алгоритм применение при построении моделей SEMOR

Иерархическая классификация, три характеристических времени (эл дв, движение, действие, жизнь/работа). Алгебраический и байесовский подход

https://doi.org/10.1145/3056540.3076194

https://doi.org/10.1016/j.procs.2016.05.345

https://doi.org/10.1177/1550147716683687

Идентификация пользователя - по ряду определить ID независимо от класса

https://doi.org/10.1109/35021BIGCOMP.2015.7072841

https://dl.acm.org/citation.cfm?id=2997017

https://doi.org/10.1016/j.ins.2017.11.045

Определения изменения в поведении (настроение, состояние здоровья)

http://www.mdpi.com/1424-8220/18/4/1126/htm

http://www.mdpi.com/1424-8220/18/2/623/htm

https://doi.org/10.1007/s11042-015-3188-y

https://doi.org/10.1142/S021951941850015X

Определение ЧСС, частоты дыхания, других показателей, потребляемые суточные калории

https://doi.org/10.1016/j.ins.2017.11.045

Классификация движений человека. Обзор литературы по проекту “Весёлый строитель”

Работы команды Стрижова по декодированию временных рядов

Isachenko R.V., Vladimirova M.R., Strijov V.V. Dimensionality reduction for time series decoding and forecasting problems // DEStech Transactions on Computer Science and Engineering, 2018. Article

Работы команды Стрижова по акселерометрам

Карасиков М.Е., Стрижов В.В. Классификация временных рядов в пространстве параметров порождающих моделей // Информатика и ее применения, 2016.

Кузнецов М.П., Ивкин Н.П. Алгоритм классификации временных рядов акселерометра по комбинированному признаковому описанию // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1471 - 1483.

Исаченко Р.В., Стрижов В.В. Метрическое обучение в задачах многоклассовой классификации временных рядов // Информатика и ее применения, 2016, 10(2) : 48-57.

Задаянчук А.И., Попова М.С., Стрижов В.В. Выбор оптимальной модели классификации физической активности по измерениям акселерометра // Информационные технологии, 2016.

Аникеев Д.А., Пенкин Г.О., Стрижов В.В. Классификация физической активности человека с помощью локальных аппроксимирующих моделей // Информатика и ее применения, 2018, 18(1) : 144-145.

Motrenko A.P., Strijov V.V. Extracting fundamental periods to segment human motion time series // Journal of Biomedical and Health Informatics, 2015, PP(99).

Ignatov A., Strijov V. Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer // Multimedia Tools and Applications, 2015, 17.05.2015 : 1-14. Прочие работы по этой теме тут www.ccas.ru/strijov

Isachenko R.V., Bochkarev А.М., Zharikov I.N., Strijov V.V. Feature Generation for Physical Activity Classification // Artificial Intelligence and Decision Making, 2018, 3 : 20-27. Article

Источник — «http://www.machinelearning.ru/wiki/index.php?title=%D0%90%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7_%D0%BF%D0%BE%D0%B2%D0%B5%D0%B4%D0%B5%D0%BD%D0%B8%D1%8F_%D0%BF%D0%BE_%D1%81%D0%B8%D0%B3%D0%BD%D0%B0%D0%BB%D0%B0%D0%BC_%D0%BD%D0%BE%D1%81%D0%B8%D0%BC%D1%8B%D1%85_%D1%83%D1%81%D1%82%D1%80%D0%BE%D0%B9%D1%81%D1%82%D0%B2»

Анализ поведения по сигналам носимых устройств

Материал из MachineLearning.

Текущая версия

Содержание

Проекты

Задача

Данные, ссылки на коллекции

Библиографические коллекции

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты

@@ Строка 2: / Строка 2: @@
 == Проекты ==
@@ Строка 32: / Строка 26: @@
 * '''Авторы''': С.Д. Иванычев, Р.Г. Нейчев, В.В. Стрижов
+== Данные, ссылки на коллекции ==
+*https://data.world/uci/smartphone-dataset-for-human-activity-recognition
+: Smartphone Dataset for Human Activity Recognition, created 08/2017/
+: This dataset contains data from 30 users within the age group of 22-79 years.
+*http://extrasensory.ucsd.edu/
+: A dataset for behavioral context recognition in-the-wild from mobile sensors, the dataset was collected in 2015-2016.
+: This dataset contains data from 60 users.
+*https://easy.dans.knaw.nl/ui/datasets/id/easy-dataset:78937/tab/1
+: Multi sensor-orientation movement data of goats, created 03/2018 3-axis accelerometer,
+: high-impact accelerometer, gyroscope, and magnetometer. All sensors were sampled at 100 Hz.
+*https://easy.dans.knaw.nl/ui/datasets/id/easy-dataset:76131
+: Generic online animal activity recognition on collar tags, created 09/2017. This dataset contains data from 6 animals.
+*http://physionet.org/
+: “PhysioNet offers free web access to large collections of recorded physiologic signals (PhysioBank) and related open-source software (PhysioToolkit).”
+*http://www.cis.fordham.edu/wisdm/dataset.php
+: WISDM
-=== Задача 13 ===
+== Библиографические коллекции ==
-* '''Название''': Deep learning for RNA secondary structure prediction
-* '''Задача''': RNA secondary structure is an important feature which defines RNA functional properties. Its importance can be illustrated by the fact, that it is evolutionary preserved and some types of functional RNAs always * have the same secondary structure, for example all tRNAs fold into cloverleaf.  As secondary structure often defines functions, knowing RNAs secondary structure may help investigate functions of novel RNA molecules. RNA folding is not as easy as DNA folding, because RNA is single stranded molecule which forms complicated base-pairing interactions, while DNA mostly exists as fully base paired double helices. Current methods of RNA structure prediction rely on experimentally evaluated thermodynamic rules, but with thermodynamics alone only 80% of structures can be accurately predicted. We propose an AI-driven method for predicting RNA secondary structure inspired by neural machine translation model.
-* '''Данные''': RNA sequences in form of strings of characters
-* '''Литература''': https://arxiv.org/abs/1609.08144
-* '''Базовой алгоритм''': https://www.ncbi.nlm.nih.gov/pubmed/16873527
-* '''Решение''': Deep learning recurrent encoder-decoder model with attention
-* '''Новизна''': Currently RNA secondary structure prediction still remains unsolved problem and to the best of our knowledge DL approach has never been introduced in the literature before
-* '''Авторы''': консультант Мария Попова
-=== Задача 14 ===
+[[:Категория:Статьи]]
-to be done
-* '''Название''': Предсказание музыкальных плейлистов пользователей в рекомендательной системе.
-* '''Задача''':
-* '''Данные''': [https://recsys-challenge.spotify.com конкурса конференции RecSys'18].
-* '''Литература''':
-*# ''Воронцов К.В.'' [[Media:voron17survey-artm.pdf|Обзор вероятностных тематических моделей]]. 2017.
-* '''Базовой алгоритм''':
-* '''Решение''': построение тематической модели с помощью библиотеки [http://bigartm.org BigARTM].
-* '''Новизна''':
-* '''Авторы''': К.В.Воронцов.
-=== Задача 15 ===
+*[[Способы оценки качества и сравнения результатов]]
-to be done
+: http://libgen.asia/db54d550f5d5e7c8612212517e59adf0/fuchs2010.pdf
-* '''Название''': Иерархическое тематическое моделирование текстовой коллекции
+:: Эталон
-* '''Задача''': (варианты: новостной поток на русском / выпускные работы студентов на русском / научные статьи на английском / научпоп на русском).
+:: Andre Gensler, Bernhard Sick. Novel Criteria to Measure Performance of Time Series
-* '''Данные''':
+:: Segmentation Techniques // In: T. Seidl, M. Hassani, C. Beecks (Eds.): Proceedings of the LWA 2014 Workshops: KDML, IR, FGWM, Aachen, Germany, 8-10 September 2014
-* '''Литература''':
-*# ''Воронцов К.В.'' [[Media:voron17survey-artm.pdf|Обзор вероятностных тематических моделей]]. 2017.
+*[[Основные проблемы анализа поведения и классификации движений]]
-* '''Базовой алгоритм''':
-* '''Решение''': построение тематической модели с помощью библиотеки [http://bigartm.org BigARTM].
-* '''Новизна''':
-* '''Авторы''': К.В.Воронцов
-=== Задача 16 ===
+*[[Построение суперпозиций движений]]
-to be done
-* '''Название''': Анализ банковских транзакционных данных физических лиц для выявления паттернов потребления клиентов.
-* '''Задача''':
-* '''Данные''':
-* '''Литература''':
-*# ''Воронцов К.В.'' [[Media:voron17survey-artm.pdf|Обзор вероятностных тематических моделей]]. 2017.
-* '''Базовой алгоритм''':
-* '''Решение''': построение тематической модели с помощью библиотеки [http://bigartm.org BigARTM].
-* '''Новизна''':
-* '''Авторы''': К.В.Воронцов, консультанты Роза Айсина, Филипп Никитин.
-=== Задача 17 ===
+*[[Алгоритмы подсчета  числа/выделения шагов  по данным акселерометра]]
-to be done
-* '''Название''': Анализ банковских транзакционных данных юридических лиц для выявления видов экономической деятельности компаний.
-* '''Задача''':
-* '''Данные''':
-* '''Литература''':
-*# ''Айсина Р.М.'' [[Media:2017AysinaBsc.pdf|Тематическое моделирование финансовых потоков корпоративных клиентов банка по транзакционным данным]].
-* '''Базовой алгоритм''':
-* '''Решение''': построение тематической модели с помощью библиотеки [http://bigartm.org BigARTM].
-* '''Новизна''': задача восстановления структуры товарно-денежных потоков в отрасли по банковским транзакционным данным ранее не ставилась.
-* '''Авторы''': К.В.Воронцов, консультант Роза Айсина.
-=== Задача 18 ===
+: http://www.cl.cam.ac.uk/~ab818/StepDetectionSmartphones.pdf
-* '''Название''': Сравнение нейросетевых и непрерывно-морфологических методов в задаче детекции текста (Text Detection).
+:: обзор подходов к выдлению куска, где человек идет, и шагов на этом куске
-* '''Задача''': Automatically Detect Text in Natural Images.
+:: Many algorithms search instead for the periods inherent in the cyclic nature of walking [1, 18, 24]. Technically the cycle is
-* '''Данные''':  синтетические сгенерированные данные + подготовленная выборка фотографий + [https://vision.cornell.edu/se3/coco-text-2/ COCO-Text dataset] + [http://www.machinelearning.ru/wiki/index.php?title=%D0%9A%D0%BE%D0%BD%D0%BA%D1%83%D1%80%D1%81_Avito.ru-2014:_%D1%80%D0%B0%D1%81%D0%BF%D0%BE%D0%B7%D0%BD%D0%B0%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D0%BA%D0%BE%D0%BD%D1%82%D0%B0%D0%BA%D1%82%D0%BD%D0%BE%D0%B9_%D0%B8%D0%BD%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%86%D0%B8%D0%B8_%D0%BD%D0%B0_%D0%B8%D0%B7%D0%BE%D0%B1%D1%80%D0%B0%D0%B6%D0%B5%D0%BD%D0%B8%D1%8F%D1%85 Конкурс Avito 2014].
+:: across a stride (two steps), although a sensor sited along the body’s mid-axis can exhibit a one-step period if the user’s gait
-* '''Литература''': [https://vision.cornell.edu/se3/wp-content/uploads/2016/01/1601.07140v1.pdf COCO benchmark], [https://vision.cornell.edu/se3/wp-content/uploads/2016/01/1601.07140v1.pdf One of a state-of-the-art architecture]
+:: is symmetric. Typical stride frequencies are around 1–2 Hz, a range that few activities other than walking exhibit.
-* '''Базовой алгоритм''': [https://github.com/eragonruan/text-detection-ctpn code] + морфологические методы, [http://www.machinelearning.ru/wiki/images/f/f1/Avito.ru-2014_Ulyanov_presentation.pdf Avito 2014 winner's solution].
-* '''Решение''': Предлагается сравнить работы нескольких state-of-the-art алгоритмов, которым нужна обширная обучающая выборка, с морфологическими методы, требующие небольшого числа данных. Предлагается определить границы применимости тех или иных методов.
-* '''Новизна''': предложить алгоритм, основанный на использовании как нейросетевых, так и морфологических методов (решение задачи word detection).
-* '''Авторы''': И.Н. Жариков.
-* '''Эксперт''': Л.М. Местецкий (морфологические методы).
-=== Задача 1 (1-2) ===
+:http://nitarc.be/map/bachelor/Olaf/Sources/Projectcode%20Filters/Papers/Automatic%20Step%20Detection%20in%20the%20Accelerometer%20Signal.pdf
-* '''Название''': Классификация суперпозиций движений физической активности
+::  H. Ying, C. Silex, A. Schnitzer, S. Leonhardt, and M.Schiek,
-* '''Задача''': Анализ поведения человека по измерениям датчиков мобильного телефона: по данным акселерометра определить движения человека. Данные акселерометра представляют собой сигнал, не имеющий точной периодики, который содержит неизвестную суперпозицию физических моделей. Будем рассматривать суперпозицию моделей: тело + рука/сумка/рюкзак.
+:: “Automatic step detection in the accelerometer signal.”
-Классификация видов деятельности человека по измерениям фитнес-браслетов. По измерениям акселерометра и гироскопа требуется определить вид деятельности рабочего. Предполагается, что временные ряды измерений содержат элементарные движения, которые образуют кластеры в пространстве описаний временных рядов. (Развитие: Характерная продолжительность движения — секунды. Временные ряды размечены метками вида деятельности: работа, отдых. Характерная продолжительность деятельности — минуты. Требуется по описанию временного ряда и кластера восстановить вид деятельности.)
+:: 1) определение пиков и их подсчет (trshold method, adaptive/dynamic treshold ).
-* '''Данные''':
+:: 2) Pan-Tompkins: применяется набор фильтров, после чего сигнал имеет дискретный вид типа -1 0 1
-** Собираются самостоятельно
+:: 3) С использованием модели - сравнение с шаблоном (template matching) - DTW или кросскорреляция
-** Данные строителей
-** Временные ряды акселерометра WISDM ([[Временной ряд (библиотека примеров)]], раздел Accelerometry).
-* '''Литература''':
-** Карасиков М. Е., Стрижов В. В. Классификация временных рядов в пространстве параметров порождающих моделей // Информатика и ее применения, 2016. [[http://strijov.com/papers/Karasikov2016TSC.pdf URL]]
-** Кузнецов М. П., Ивкин Н. П. Алгоритм классификации временных рядов акселерометра по комбинированному признаковому описанию // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1471—1483. [[http://jmlda.org/papers/doc/2015/no11/Ivkin2015TSclassification.pdf URL]]
-** Исаченко Р. В., Стрижов В. В. Метрическое обучение в задачах многоклассовой классификации временных рядов // Информатика и ее применения, 2016, 10(2) : 48-57. [[http://strijov.com/papers/Isachenko2016MetricsLearning.pdf URL]]
-** Задаянчук А. И., Попова М. С., Стрижов В. В. Выбор оптимальной модели классификации физической активности по измерениям акселерометра // Информационные технологии, 2016. [[http://strijov.com/papers/Zadayanchuk2015OptimalNN4.pdf URL]]
-** Motrenko A.P., Strijov V.V. Extracting fundamental periods to segment human motion time series // Journal of Biomedical and Health Informatics, 2016, Vol. 20, No. 6, 1466—1476. [[http://sourceforge.net/p/mlalgorithms/code/HEAD/tree/Group874/Motrenko2014TSsegmentation/JBHI/MotrenkoStrijov2014RV2.pdf?format=raw URL]]
-** Ignatov A., Strijov V. Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer // Multimedia Tools and Applications, 2015, 17.05.2015 : 1-14. [[http://strijov.com/papers/Ignatov2015HumanActivity.pdf URL]]
-* '''Базовой алгоритм''': Базовый алгоритм описан в работах [Карасиков, Стрижов: 2016] и [Кузнецов, Ивкин: 2014].
-* '''Решение''': Найти оптимальный способ сегментации и оптимальное описание временного ряда. Построить метрическое пространство описаний элементарных движений.
-* '''Новизна''': Предложен способ классификации и анализа сложных движений (Развитие: Соединение двух характеристических времен описания жизни человека, комбинированная постановка задачи.)
-* '''Авторы''': Александра Малькова, Мария Владимирова, Р. Г. Нейчев, В. В. Стрижов,
-=== Задача 2 (1) ===
+: http://nitarc.be/map/paper/AMBIT_ThuerVerwimp.pdf
-* '''Название''': Сравнение нейросетевых и непрерывно-морфологических методов в задаче детекции текста (Text Detection).
+:: Step Detection Algorithms for Accelerometers
-* '''Задача''': Automatically Detect Text in Natural Images.
+:: Применяют все перечисленное + на выделенных шагах ищут момент heel strike - вроде как тоже модель
-* '''Данные''': синтетические сгенерированные данные + подготовленная выборка фотографий + [https://vision.cornell.edu/se3/coco-text-2/ COCO-Text dataset] + [http://www.machinelearning.ru/wiki/index.php?title=%D0%9A%D0%BE%D0%BD%D0%BA%D1%83%D1%80%D1%81_Avito.ru-2014:_%D1%80%D0%B0%D1%81%D0%BF%D0%BE%D0%B7%D0%BD%D0%B0%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D0%BA%D0%BE%D0%BD%D1%82%D0%B0%D0%BA%D1%82%D0%BD%D0%BE%D0%B9_%D0%B8%D0%BD%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%86%D0%B8%D0%B8_%D0%BD%D0%B0_%D0%B8%D0%B7%D0%BE%D0%B1%D1%80%D0%B0%D0%B6%D0%B5%D0%BD%D0%B8%D1%8F%D1%85 Конкурс Avito 2014].
-* '''Литература''': [https://vision.cornell.edu/se3/wp-content/uploads/2016/01/1601.07140v1.pdf COCO benchmark], [https://vision.cornell.edu/se3/wp-content/uploads/2016/01/1601.07140v1.pdf One of a state-of-the-art architecture]
-* '''Базовой алгоритм''': [https://github.com/eragonruan/text-detection-ctpn code] + морфологические методы, [http://www.machinelearning.ru/wiki/images/f/f1/Avito.ru-2014_Ulyanov_presentation.pdf Avito 2014 winner’s solution].
-* '''Решение''': Предлагается сравнить работы нескольких state-of-the-art алгоритмов, которым нужна обширная обучающая выборка, с морфологическими методы, требующие небольшого числа данных. Предлагается определить границы применимости тех или иных методов.
-* '''Новизна''': предложить алгоритм, основанный на использовании как нейросетевых, так и морфологических методов (решение задачи word detection).
-* '''Авторы''': И. Н. Жариков.
-* '''Эксперт''': Л. М. Местецкий (морфологические методы).
-=== Задача 3 (1-2) ===
+: http://www.am.sanken.osaka-u.ac.jp/~makihara/pdf/accv2010_phase.pdf
-* '''Название''': Распознавание текста на основе скелетного представления толстых линий и сверточных сетей
+:: Phase Registration of a Single Quasi-Periodic Signal Using Self Dynamic Time Warping
-* '''Задача''': Требуется построить две CNN, одна распознает растровое представление изображения, другая векторное. (Развитие: порождение толстых линий нейросетями)
+:: 3 Hz-filtering: nobody can walk with a speed of more than three steps per second. [Accelerometry based assessment of gait parameters in children, https://www.mcroberts.nl/files/Brandes.pdf]
-* '''Данные''': Шрифты в растровом представлении.
-* '''Литература''': Список работ [http://www.machinelearning.ru/wiki/images/a/a2/Morozov2017Synthesis_of_medicines.pdf], в частности arXiv:1611.03199 и
-* '''Базовый алгоритм''': Сверточная сеть для растрового изображения.
-* '''Решение''': Требуется предложить способ свертывания графовых структур, позволяющий породить информативное описание скелета толстой линии.
-* '''Новизна''': Предложен способ повышения качества распознавания толстых линий за счет нового способа порождения их описаний.
-* '''Авторы''': Л. М. Местецкий, И. А. Рейер, В. В. Стрижов
-=== Задача 4 (1-2) ===
+*[[Работы по выделению периода для периодических и квазипериодических временных рядов]]
-* '''Название''': Создание ранжирующих моделей для систем информационного поиска. Алгоритм прогнозирования структуры локально-оптимальных моделей
-* '''Задача''': Требуется спрогнозировать временной ряд с помощью некоторой параметрической суперпозицией алгебраических функций. Предлагается не стоить прогностическую модель, а спрогнозировать ее, то есть предсказать структуру аппроксимирующей суперпозиции. Вводится класс рассматриваемых суперпозиций, и на множестве таких структурных описаний проводится поиск локально-оптимальной модели для рассматриваемой задачи. Задача состоит в 1) поиске подходящего структурного описания модели 2) описания алгоритма поиска той структуры, которая будет соответствовать оптимальной модели 3) описания алгоритма обратного построения модели по ее структурному описанию. В качестве уже имеющегося примера ответа на вопросы 1-3, смотри работы А. А. Варфоломеевой.
-* '''Данные''':
-** Коллекция текстовых документов TREC (!)
-** Набор временных рядов, который подразумевает восстановление функциональных зависимостей. Предлагается сначала использовать синтетические данные или сразу применить алгоритм к прогнозированию временных рядов 1) потребления электроэнергии 2) физической активности с последующим анализом получающихся структур.
-* '''Литература''':
-** (!) Kulunchakov A.S., Strijov V.V. Generation of simple structured Information Retrieval functions by genetic algorithm without stagnation // [http://strijov.com/papers/Kulunchakov2014RankingBySimpleFun.pdf  Expert Systems with Applications, 2017, 85 : 221—230.]
-** А. А. Варфоломеева Выбор признаков при разметке библиографических списков методами структурного обучения, 2013, [http://www.machinelearning.ru/wiki/images/f/f2/Varfolomeeva2013Diploma.pdf?format=raw]
-** Bin Cao, Ying Li and Jianwei Yin Measuring Similarity between Graphs Based on the Levenshtein Distance, 2012, [http://naturalspublishing.com/files/published/92cn7jm44d8wt1.pdf?format=raw]
-* '''Базовой алгоритм''': Конкретно к предлагаемой проблеме базового алгоритма нет. Предлагается попробовать повторить эксперимент А. А. Варфоломеевой для другого структурного описания, чтобы понять, что происходит.
-* '''Решение''': Суперпозиция алгебраических функций задает ордерево, на вершинах которого заданы метки соответствующих алгебраических функций или переменных. Поэтому структурным описанием такой суперпозиции может являться ее DFS-code. Это строка, состоящая из меток вершин, записанных в порядке обхода дерева поиском в глубину. Зная арности соответствующих алгебраических функций, можем любой такой DFS-code восстановить за O(n) и получить обратно суперпозицию функций. На множестве подобных строковых описаний предлагается искать то строковое описание, которое будет соответствовать оптимальной модели.
-* '''Авторы''': Кулунчаков Андрей, В. В. Стрижов
-=== Задача 5 (1) ===
+: http://www.stat.tamu.edu/~suhasini/teaching613/walker71.pdf
-* '''Название''': Определение параметров нейросети, подлежащих оптимизации.
+:: Walker, A. M. (1971) On the estimation of a harmonic component in a time series with stationary independent residuals. Biometrika 58, 21–36.
-* '''Задача''': Рассматривается задача оптимизации нейросети. Требуется разделить параметры модели на две группы:
+:: Приближаем сигнал моделью вида сумма синусоид с различными частотами + шум и приближаем все это наименьшими квадратами
-** а) Параметры модели, подлежащие оптимизации
+:: По понятным причинам не очень хорошо работает для квазипериодических рядов
-** б) Параметры модели, оптимизация которых завершилась. Дальнейшая оптимизация данных параметров не даст улучшения качества модели.
-Предлагается рассматривать оптимизацию параметров как стохастический процесс. Основываясь на истории процесса найдем те параметры, чья оптимизация больше не требуется.
-* '''Данные''': Выборка рукописных цифр MNIST
-* '''Базовый алгоритм''': Случайный выбор параметров.
-* '''Литература''':
-** [https://arxiv.org/pdf/1704.04289.pdf] SGD как стохастический процесс.
-** [http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.704.7138&rep=rep1&type=pdf] Вариационный вывод в нейросетях.
-* '''Новизна''': полученный алгоритм позволит существенно снизить вычислительную стоимость оптимизации нейросетей. Возможным дальнейшим развитием метода является получение оценок на параметры сети, полученной из исходной операциями расширения, сжатия, добавления и удаления слоев.
-* '''Авторы''': Бахтеев Олег, В. В. Стрижов
-=== Задача 6 (1) ===
+: http://www.jstor.org/stable/3212772
-* '''Название''': Предсказание графовой структуры нейросетевой модели.
+:: Hannan, E. J. (1973) The estimation of frequency. Journal of Applied Probability 10, 510–9.
-* '''Задача''': Рассматривается задача нахождения устойчивой (и не избыточной по параметрам) структуры сверточной нейросети. Предлагается предсказывать структуру нейросети с использованием doubly-recurrent нейросетей. В качестве обучающей выборки предлагается использовать структуры моделей, показавших хорошее качество на подвыборках небольшой мощности.
+:: Почти такая же классика - максимизация периодограммы, асимптотически эквивалентная наименьшим квадратам (Quinn, B. G. (2009) Recent advances in rapid frequency estimation. DigitalSignalProcessing 19, 942–8, http://linkinghub.elsevier.com.sci-hub.org/retrieve/pii/S1051200408000559)
-* '''Данные''': Выборки MNIST, CIFAR-10
+:: как правило, осуществляется с помощью FFT
-* '''Базовый алгоритм''': случайный поиск. Возможно сравнение с работами по обучению с подкреплением.
-* '''Литература''':
-** [https://pdfs.semanticscholar.org/e7bd/0e7a7ee6b0904d5de6e76e095a6a3b88dd12.pdf] doubly-recurrent нейросети.
-** [https://arxiv.org/pdf/1707.07012]  Схожий подход с использованием обучения с подкреплением.
-* '''Авторы''': Бахтеев Олег, В. В. Стрижов
-=== Задача 7 (1) ===
+: http://biomet.oxfordjournals.org.sci-hub.org/content/78/3/489.short
-* '''Название''': Style Change Detection.
+:: B.G. Quinn, J.M. Fernandes, A fast eﬃcient technique for the estimation of frequency, Biometrika 78 (1991) 489–498
-* '''Задача''': Дана коллекция документов, требуется определить, написан ли каждый документ одним автором, или несколькими (http://pan.webis.de/clef18/pan18-web/author-identification.html).
+:: Расширение методов фильтрации, основанных на применении FFT/максимизации периодограммы - поволяет отказаться от прдположений о независимости ошибок в модели
-* '''Данные''': PAN 2018 (http://pan.webis.de/clef18/pan18-web/author-identification.html)
+:: Ряд приближается моделью ARMA(2,2), частота оценивается итеративно
-PAN 2017 (http://pan.webis.de/clef17/pan17-web/author-identification.html)
-PAN 2016 (http://pan.webis.de/clef16/pan16-web/author-identification.html)
-* '''Литература''':
-. Ian Goodfellow. NIPS 2016 Tutorial: Generative Adversarial Networks (https://arxiv.org/pdf/1701.06547.pdf)
-. Jiwei Li, Will Monroe, Tianlin Shi, Sebastien Jean, Alan Ritter and Dan Jurafsky. Adversarial Learning for Neural Dialogue Generation(https://arxiv.org/pdf/1701.06547.pdf)
-. M. Kuznetsov, A. Motrenko, R. Kuznetsova, V. Strijov. Methods for Intrinsic Plagiarism Detection and Author Diarization (https://pdfs.semanticscholar.org/1011/6d82a8438c78877a8a142be47c4ee8662138.pdf)
-. K. Safin, R. Kuznetsova. Style Breach Detection with Neural Sentence Embeddings (https://pdfs.semanticscholar.org/c70e/7f8fbc561520accda7eea2f9bbf254edb255.pdf)
-* '''Базовый алгоритм''': решение, описанное в [3, 4].
-* '''Решение''': предлагается решать задачу, используя generative adversarial networks — генеративная модель порождает тексты в одном авторском стиле, дискриминативная модель — бинарный классификатор.
-* '''Новизна''': предполагается, что решение этой задачи предлагаемым методом может дать прирост качества по сравнению с типичными методами решениями этой задачи, а также связанных с ней задач кластеризации авторов.
-* '''Авторы''': Рита Кузнецова (консультант), В. В. Стрижов
-=== Задача 8 (1) ===
+: http://cseweb.ucsd.edu/~saul/papers/nmf_nips04.pdf
-* '''Название''': Получение оценок правдоподобия с использованием автокодировщиков
+:: Sha, F. and Saul, L. K. (2005) Real-time pitch determination of one or more voices by nonnegative matrix factorization
-* '''Задача''': предполагается, что рассматриваемые объекты подчиняются гипотезе многообразия (manifold learning) — вектора высокий размерности сосредоточились вокруг некоторого подпространства меньшей размерности. Работы [1, 2] показывают, что некоторые модификации автокодировщиков ищут k-мерное многообразие в пространстве объектов, которое наиболее полно передает структуру данных. В работе [2] выводится оценка плотности вероятности данных с помощью автокодировщика. Требуется получить эту оценку на правдоподобие модели.
+:: Рассматривают аргумент гармоники как меняющуюся во времени фазу, а частоту определют как ее проиводную (instatenious frequency, IF). Также вводят понятие фундаментальной частоты - это самая низкая частота. Фундаментальная частота определяется как неподвижная точка преобразования, определяемого как производная фазы фурье-компонент  (short time FT) исходного сигнала по времени. Неотрицательное разложение матриц используется для выделения разных голосов в обработке речи.
-* '''Данные''': предлагается провести эксперимент на коротких текстовых фрагментах Google ngrams (http://storage.googleapis.com/books/ngrams/books/datasetsv2.html)
-* '''Литература''':
-## Pascal Vincent, Hugo Larochelle, Isabelle Lajoie, Yoshua Bengio, Pierre-Antoine Manzagol. Stacked Denoising Autoencoders: Learning Useful Representations in a Deep Network with a Local Denoising Criterion (http://www.jmlr.org/papers/volume11/vincent10a/vincent10a.pdf).
-## Guillaume Alain, Yoshua Bengio. What Regularized Auto-Encoders Learn from the Data Generating Distribution (https://arxiv.org/pdf/1211.4246.pdf)
-## Hanna Kamyshanska, Roland Memisevic. The Potential Energy of an Autoencoder (https://www.iro.umontreal.ca/~memisevr/pubs/AEenergy.pdf)
-* '''Базовый алгоритм''':
-* '''Решение''': в задаче предлагается обучить векторные представления для фраз (n-грамм) с использованием автокодировщика, с помощью теоремы 2 в работе [2] получить оценку на правдоподобие выборки и, с помощью этой оценки, вывести правдоподобие модели. С помощью полученных оценок можно также рассмотреть процесс сэмплирования.
-* '''Новизна''': получение оценок правдоподобия данных и правдоподобия модели, порождение текстов с помощью полученных оценок.
-* '''Авторы''': Рита Кузнецова (консультант).
-=== Задача 9 (1) ===
+: http://www.wakayama-u.ac.jp/~kawahara/PSSws/k012.pdf
-* '''Название''': Предсказание свойств и типов атомов в молекулярных графах при помощи сверточных сетей.
+:: Kawahara, H., Katayose, H., Cheveigne, A. de and Patterson, R. D. (1999) Fixed point analysis of frequency to instantaneous frequency mapping for
-* '''Задача''': Multilabel classification using convolutional neural networks (CNN) on graphs.
+:: accurate estimation of f0 and periodicity
-Для предсказания взаимодействия молекул друг с другом зачастую необходимо правильно описать составляющие их атомы, поставив им в соответствие некоторые типы. Для маленьких молекул доступно не так много дескрипторов: координаты и химические элементы атомов, длины связей и величины углов между ними. Используя эти признаки, мы успешно предсказываем гибридизации атомов и типы связей. При таком подходе каждый атом рассматривается «по отдельности», информация о соседних атомах, необходимая для определения типа атома, практически не используется, и типы атомов определяются с помощью проверки большого числа условий. В то же время, молекулы представимы в виде трехмерных молекулярных графов, и было бы интересно использовать это для предсказания их типов методами машинного обучения, например, с помощью CNN.
+:: Развитие метода, предложенного в предыдущей статье: среди всех неподвижных точек выбирается точка с наименьшей оценкой Carrier-to-noise ratio. Для оценки C/N ration используется соображние о необходимости выполения основного тригонометрического тождества для первой и второй прозводных выделенного процесса. Также предлагается использовать квадратичное приближение кривых частоты-фазы для устранения размытия в области высоких частот  (непонятная часть)
-Необходимо предсказать типы вершин и рёбер молекулярных графов :
-** тип атома (тип вершины графа, около 150 классов),
-** гибридизацию атома (вспомогательный признак, тип вершины, 4 класса),
-** тип связи (вспомогательный признак, тип ребра, 5 классов).
-Тип атома (вершины графа) основан на информации о его гибридизации и свойствах соседних с ним атомов. Поэтому в случае успешного решения задачи классификации можно провести кластеризацию для поиска других способов определения типов атомов.
+: http://qspace.qu.edu.qa/bitstream/handle/10576/10682/Boashash_1992_Proceedings%20of%20IEEE_tutorial%20on%20IF%20algorithms%20&%20applications.pdf?sequence=1
+:: Boashash, B. (1992b) Estimating and interpreting the instantaneous frequency of a signal–part 2: algorithms and applications
+:: переписывает множество оценок частоты непрерывного сигнала в дискретном случае
-* '''Данные''': Около 15 тысяч молекул, представленных в виде молекулярных графов. Для каждой вершины (атома) известны 3D координаты и химический элемент. Дополнительно посчитаны длины связей, величины углов и двугранных углов между атомами (3D координаты графа), бинарные признаки, отражающие, входит ли атом в цикл и является ли он терминальным. Выборка размечена, однако в размеченных данных может содержаться ~5 % ошибок.
+:: On multiple pattern extraction using singular value decomposition
-Если данных будет недостаточно, возможно увеличение выборки (до 200 тысяч молекул), сопряженное с увеличением неточности в разметке.
+:: Partha Pratim Kanjilal, Sarbani Palit
+:: IEEE transactions on signal processing, Vol. 43, No. 6, pp. 1536-1540. 1995.
-* '''Литература''':
-** [http://proceedings.mlr.press/v48/niepert16.pdf]
+:: Robust method for periodicity detection and characterization of irregular cyclical seriesin terms of embedded periodic components, 1999
-** [https://arxiv.org/pdf/1603.00856.pdf]
+:: P. P. Kanjilal, J. Bhattacharya and G. Saha
-** [https://arxiv.org/pdf/1204.4539.pdf]
+:: Про устойчивость сингулярного разложения: SVD is the most robust null-space detector
-* '''Базовой алгоритм''': Предсказание гибридизаций и порядков связей с помощью мультиклассового нелинейного SVM с небольшим числом дескрипторов. https://hal.inria.fr/hal-01381010/document
+:: of a matrix compared to other eigen decompositions [22]; it is numerically well conditioned and can be computed in a numerically stable way. The efficiency of SVD in noise separation and in estimating embedding dimension is well established [23]
-* '''Решение''': Предлагаемое решение задачи и способы проведения исследования.
-Способы представления и визуализации данных и проведения анализа ошибок, анализа качества алгоритма.
-На первом этапе нужно будет определить операции на графах, необходимые для построения архитектуры сети. Далее нужно будет обучить сеть для мульти-классовой классификации типов вершин (и ребер) входного графа.
-Для оценки качества алгоритма предполагается оценивать точность с помощью кросс-валидации. Для конечной публикации (в профильном журнале) нужно будет сделать специфический тест на качество предсказаний: на основе предсказанных типов связи молекула записывается в виде строки (в формате SMILES) и сравнивается с образцом. В этом случае для каждой молекулы предсказание будет считаться верным, только если типы всех связей в ней были предсказаны без ошибок.
-* '''Новизна''': Предложенные молекулярные графы обладают 3D структурой и внутренней иерархией, что делает их идеальным объектом применения CNN.
-* '''Авторы''': Сергей Грудинин, Мария Кадукова, В. В. Стрижов.
+: http://people.duke.edu/~mk176/publications/KumarEtAl_CRB_JofHydrology.pdf
+:: Выбор главных компонент на основе анализа пространства сингулярные величины главных компонент - соответствующие им частоты
-== Данные, ссылки на коллекции ==
-== Библиографические коллекции ==
-[[:Категория:Статьи]]
-*[[Основные проблемы анализа поведения и классификации движений]]
-*[[Построение суперпозиций движений]]
 *[[Построение ансамблей моделей для порождения простых выборок (Сергей Иванычев – диплом) ]]
@@ Строка 272: / Строка 147: @@
 *[[Сегментация временного ряда (Технологическая - прогнозирование времени отключения акселерометра)]]
+:http://repository.cmu.edu/cgi/viewcontent.cgi?article=1146&context=robotics
+:: Aligned Cluster Analysis for Temporal Segmentation of Human Motion
+:: Feng Zhou, Fernando De la Torre
+:: Используют kernel k-means для клатеризации сегментов. В качестве расстояния между сегментами  берется модификация DTW, Dynamic Time Alignment Kernel (DTAK). Этот вариант расстояния хорош тем, что он является метрикой на временных рядах (удовлетворяет свойству треуголиника, в отличие от DTW). Решается задача оптимизации суммарного расстояния от каждого сегмента до центра кластера методом координатного спуска. Результатом становится разбиение ряда на сегменты и кластеризация сегментов.
+:: Предлагают решать это все динамическим программированием, разбивая сегменты и находя оптимум на подсегментах. Такое представление позволяет контролировать длину сегмента.
+:: Еще тут предлагают уменьшить количество обрабатываемых данных (removing redundancy). Говорят, что человек двигается достаточно  плавно  и все ряды локально линейны, так что какие-то линейные куски можно вообще выбросить. Эта часть мне пока не очень понятна.
+:http://citeseerx.ist.psu.edu/viewdoc/download?rep=rep1&type=pdf&doi=10.1.1.214.2162
+:: Hierarchical Aligned Cluster Analysis for Temporal Clustering of Human Motion
+::Тот же метод (ACA) предлагают использовать иерархически, применяя его снизу вверх: сначала ряд делится на буквы, затем раз из букв на слова и т.д. При этом  расстояние Dynamic Time Alignment Kernel между ::сегментами текущего уровня вычиляетс с учетом его значений на предыдущих уровнях.
+:https://www.ri.cmu.edu/pub_files/pub4/de_la_torre_frade_fernando_2007_1/de_la_torre_frade_fernando_2007_1.pdf
+:: Temporal Segmentation of Facial Behavior
+:: Fernando De la Torre
+:: Тут тоже есть иерархия: сначала выделяют отдельные кластеры с “изображениями” лиц (буквы?), а затем группируют их  в динамические выражения лица (видимо, слова).
+:: Выделение букв делается приблизительно тем же kernel k-means, расстояние - Гауссово + прикручивается матрица, которая отвечает за инвариантность относительно угла обзора.
+:: Затем они хотят выделять  слова - повторяющиеся последовательности букв. Для этого они сначала находят подпоследовательности одинаковых букв и сопоставляют каждой подпоследовательности его букву. Так получается  уменьшенный ряд (это проявление все того же removing redundancy). Затем из полученного ряда берутся длинные куски (8-9 букв)  и вычисляется нормализованная корреляция куска с исходным рядом (видимо, с его уменьшенно-буквенным представлением). Все куски, у которых корреляция порядка единицы, удаляются. Затем смотрим куски меньшей длины, и так пока не рассмотрим все буквы.
+:: Статья написана достаточно мутно
+: http://graphics.cs.cmu.edu/projects/segmentation/segmentation.pdf
+:: Segmenting Motion Capture Data into Distinct Behaviors
+:: Jernej Barbic Alla Safonova Jia-Yu Pan Christos Faloutsos
+:: Утверждают, что сегментируют ряды на более высоком уровне - слова в предложения
+:: Используют вероятностный PCA. Временные ряды в пространстве двух первых главных компонент образуют кластеры, соотвествующие типам движения
+:: Скользящим окном читается расстояние Махаланобиса и по его поведению определяется момент разладки
+: http://web.media.mit.edu/~cynthiab/Readings/Mataric-etal-02.pdf
+:: O. C. Jenkins and M. J. Mataric. Deriving action and behavior primitives from human motion data
+:: Тоже PCA, для разрезов берутся
+:: 1) точки нулевой скорости, так как при изменении движения меняется скорость и ее направления.
+:: 2) минимумы угловой скорости, видимо, из тех же соображений
+: http://machinelearning.wustl.edu/mlpapers/paper_files/icml2004_JenkinsM04.pdf
+:: further extended the work by finding a non-linear embedding that reveals the temporal structure of segmented motion
+: http://www.cs.ubc.ca/~beaudoin/papers/2008-sca-mmg.pdf
+:: P. Beaudoin, S. Coros, M. van de Panne, and P. Poulin, “Motion-motif graphs,” in ACM SIGGRAPH / Eurographics Symposium on Computer Animation, 2008.
+:: Developed a string-based motif-ﬁnding algorithm to decompose actions into action primitives and interpret actions as a composition on the alphabet of these action primitives. The algorithm allows for a user-controlled compromise between motif length and the number of motions in a motif.
+:: 1) уменьшают размерность с помощью PCA
+:: 2) каждому отсчету времени - по букве с помощью k-means кластеризации
+:: 3) повторения одной и той же буквы сокращаются до одного
+:: 4) подпоследовательности букв кластеризуются с использованием матрицы смежности букв (буквы читаются смежными, если соответсвующие им сферические кластеры пересекаются). Наличие пути между словами  подразумевает возможность построить разумное соответствие между ними
+:: Получаем кластеризацию слов. Слова в кластере усредняются, по усредненному слова осуществляется интерпретация?
+:: 5) Для порождающих целей строится направленный  граф с вершинами-словами. Из вершины в вершмну есть ребро, если существует путь от слова к слову.
 : https://doi.org/10.1007/s11063-017-9592-8
 : https://web.stanford.edu/~hallac/GGS.pdf
@@ Строка 303: / Строка 224: @@
 *[[Классификация движений человека. Обзор литературы по проекту “Весёлый строитель”]]
+*[[Работы команды Стрижова по декодированию временных рядов]]
+: Isachenko R.V., Vladimirova M.R., Strijov V.V. Dimensionality reduction for time series decoding and forecasting problems // DEStech Transactions on Computer Science and Engineering, 2018. Article
 *[[Работы команды Стрижова по акселерометрам]]
-: Карасиков М.Е., Стрижов В.В. Классификация временных рядов в пространстве параметров порождающих моделей // Информатика и ее применения, 2016. [URL]
+: Карасиков М.Е., Стрижов В.В. Классификация временных рядов в пространстве параметров порождающих моделей // Информатика и ее применения, 2016.
+: Кузнецов М.П., Ивкин Н.П. Алгоритм классификации временных рядов акселерометра по комбинированному признаковому описанию // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1471 - 1483.
+: Исаченко Р.В., Стрижов В.В. Метрическое обучение в задачах многоклассовой классификации временных рядов // Информатика и ее применения, 2016, 10(2) : 48-57.
-: Кузнецов М.П., Ивкин Н.П. Алгоритм классификации временных рядов акселерометра по комбинированному признаковому описанию // Машинное обучение и анализ данных. 2015. T. 1, № 11. C. 1471 - 1483. [URL]
+: Задаянчук А.И., Попова М.С., Стрижов В.В. Выбор оптимальной модели классификации физической активности по измерениям акселерометра // Информационные технологии, 2016.
-: Исаченко Р.В., Стрижов В.В. Метрическое обучение в задачах многоклассовой классификации временных рядов // Информатика и ее применения, 2016, 10(2) : 48-57. [URL]
+: Аникеев Д.А., Пенкин Г.О., Стрижов В.В. Классификация физической активности человека с помощью локальных аппроксимирующих моделей // Информатика и ее применения, 2018, 18(1) : 144-145.
-: Задаянчук А.И., Попова М.С., Стрижов В.В. Выбор оптимальной модели классификации физической активности по измерениям акселерометра // Информационные технологии, 2016. [URL]
+: Motrenko A.P., Strijov V.V. Extracting fundamental periods to segment human motion time series // Journal of Biomedical and Health Informatics, 2015, PP(99).
-: Motrenko A.P., Strijov V.V. Extracting fundamental periods to segment human motion time series // Journal of Biomedical and Health Informatics, 2015, PP(99). [URL]
+: Ignatov A., Strijov V. Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer // Multimedia Tools and Applications, 2015, 17.05.2015 : 1-14. Прочие работы по этой теме тут www.ccas.ru/strijov
-: Ignatov A., Strijov V. Human activity recognition using quasiperiodic time series collected from a single triaxial accelerometer // Multimedia Tools and Applications, 2015, 17.05.2015 : 1-14. [URL] И прочие работы по этой теме тут www.ccas.ru/strijov
+: Isachenko R.V., Bochkarev А.М., Zharikov I.N., Strijov V.V. Feature Generation for Physical Activity Classification // Artificial Intelligence and Decision Making, 2018, 3 : 20-27. Article