Прогнозирование класса третичной структуры белка по первичной (пример)

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 1: Строка 1:
-
'''Прогнозирование класса третичной структуры белка по первичной'''
 
== Аннотация ==
== Аннотация ==
Рассматривается задача классификации третичной структуры белка по знаниям о первичной.
Рассматривается задача классификации третичной структуры белка по знаниям о первичной.

Версия 13:08, 16 июня 2011

Аннотация

Рассматривается задача классификации третичной структуры белка по знаниям о первичной. Для решения задачи применяется алгоритм "Метод ближайшего соседа". Подбираются и сравниваются параметры алгоритма. Построен график точности алгоритма с доверительными интервалами в зависимости от параметров предложенного алгоритма.



Постановка задачи

Данные

Предлагается использовать базу данных "ASTRAL SCOP Genetic Domain Sequences 1.75"[1], архив PDB SEQRES records: astral-scopdom-seqres-gd-all-1.75.fa[2]

Структура данных

>d1dlya_ a.1.1.1 (A:) Protozoan/bacterial hemoglobin {Green alga (Chlamydomonas eugametos) [TaxId: 3054]}
slfaklggreaveaavdkfynkivadptvstyfsntdmkvqrskqfaflayalggasewk
gkdmrtahkdlvphlsdvhfqavarhlsdtltelgvppeditdamavvastrtevlnmpq
  • d1dlya_ -- идентификатор эксперимента (код файла в PDB),
  • a.1.1.1 -- классификатор белка, иерархическая структура разделена точками,
  • slfaklggreavea... -- последовательность аминокислот (без пробелов и переносов до символа >).
Личные инструменты