Численные методы обучения по прецедентам (практика, В.В. Стрижов)/Группа 774, осень 2010
Материал из MachineLearning.
- Численные методы обучения по прецедентам (программа курса)
- Автоматизация и стандартизация научных исследований (программа курса)
Задачи
Название задачи | Работу выполняет | Работу рецензируют | Задачу предложил | Результат |
---|---|---|---|---|
Прогнозирование класса третичной структуры белка по первичной (пример) | И.Ю. Торшин | |||
Долгосрочное прогнозирование ежедневных цен на электроэнергию (пример) | М. Хильдман | |||
Краткосрочное прогнозирование почасовых цен на электроэнергию (пример) | Г.-В. Вебер |
Прогнозирование класса третичной структуры белка по первичной (пример)
Требуется предложить алгоритм порождения признаков для восстановления регресии. При выборе признаков класс моделей (RBF, обсуждается) и метод выбора (метод моделей наибольшего правдоподобия) будут фиксированы.
Предлагается использовать базу данных "ASTRAL SCOP Genetic Domain Sequences 1.75"[1], архив PDB SEQRES records: astral-scopdom-seqres-gd-all-1.75.fa[2]
Структура данных
>d1dlya_ a.1.1.1 (A:) Protozoan/bacterial hemoglobin {Green alga (Chlamydomonas eugametos) [TaxId: 3054]} slfaklggreaveaavdkfynkivadptvstyfsntdmkvqrskqfaflayalggasewk gkdmrtahkdlvphlsdvhfqavarhlsdtltelgvppeditdamavvastrtevlnmpq
- d1dlya_ -- идентификатор эксперимента (код файла в PDB),
- a.1.1.1 -- классификатор белка, иерархическая структура разделена точками,
- slfaklggreavea... -- последовательность аминокислот (без пробелов и переносов до символа >).
Экзамен
Пока не назначен