Прогнозирование класса третичной структуры белка по первичной (пример)

Материал из MachineLearning.

Версия от 19:47, 16 июня 2011; MORAL (Обсуждение | вклад)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)

Содержание

1 Аннотация
2 Постановка задачи
3 Данные
4 Пути решения задачи

Аннотация

Рассматривается задача классификации третичной структуры белка по первичной. В качестве признаков предлагается использовать частоты повторения каждой аминокислоты в последовательности первичной структуры белка. Для решения задачи применяется алгоритм "Метод ближайшего соседа". Подбираются и сравниваются параметры алгоритма. Построен график точности алгоритма с доверительными интервалами в зависимости от параметров предложенного алгоритма.

Постановка задачи

$A = \{a, r, d,n, v, h, g, e, q, i, l, k, m, p, s, y, t, w, f, c\}.$

Данные

Предлагается использовать базу данных "ASTRAL SCOP Genetic Domain Sequences 1.75"[1], архив PDB SEQRES records: astral-scopdom-seqres-gd-all-1.75.fa[2]

Структура данных

>d1dlya_ a.1.1.1 (A:) Protozoan/bacterial hemoglobin {Green alga (Chlamydomonas eugametos) [TaxId: 3054]}
slfaklggreaveaavdkfynkivadptvstyfsntdmkvqrskqfaflayalggasewk
gkdmrtahkdlvphlsdvhfqavarhlsdtltelgvppeditdamavvastrtevlnmpq

d1dlya_ -- идентификатор эксперимента (код файла в PDB),
a.1.1.1 -- классификатор белка, иерархическая структура разделена точками,
slfaklggreavea... -- последовательность аминокислот (без пробелов и переносов до символа >).

Пути решения задачи

Предлагается использовать в качестве признаков частоты повторения отдельных аминокислот.

Источник — «http://www.machinelearning.ru/wiki/index.php?title=%D0%9F%D1%80%D0%BE%D0%B3%D0%BD%D0%BE%D0%B7%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D0%BA%D0%BB%D0%B0%D1%81%D1%81%D0%B0_%D1%82%D1%80%D0%B5%D1%82%D0%B8%D1%87%D0%BD%D0%BE%D0%B9_%D1%81%D1%82%D1%80%D1%83%D0%BA%D1%82%D1%83%D1%80%D1%8B_%D0%B1%D0%B5%D0%BB%D0%BA%D0%B0_%D0%BF%D0%BE_%D0%BF%D0%B5%D1%80%D0%B2%D0%B8%D1%87%D0%BD%D0%BE%D0%B9_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29»

Прогнозирование класса третичной структуры белка по первичной (пример)

Материал из MachineLearning.

Содержание

Аннотация

Постановка задачи

Данные

Пути решения задачи

Просмотры

Личные инструменты

Навигация

Поиск

Инструменты