Технологии организации данных (курс лекций, С.К.Дулин)/Вопросы

Материал из MachineLearning.

Перейти к: навигация, поиск

Перечень контрольных вопросов для сдачи экзамена в 8-ом семестре студентов 4 курса
специализации «Проектирование и организация систем» кафедры «Интеллектуальные системы» ФУПМ МФТИ

  1. Методы сбора данных.
  2. Определение проблемы информационного моделирования и формулирование целей исследования.
  3. Планирование сбора первичных данных. Преимущества и недостатки использования вторичных данных. Оценка полученных данных.
  4. Интеллектуальный анализ данных (Data Mining). Основные задачи Data Mining, виды моделей. Data Mining и статистический анализ. Data Mining и хранилища данных.
  5. Классификация и кластеризация данных. Функции сходства. Коэффициенты подобия.
  6. Непротиворечивость, устранение рассогласованности данных. Неопределенность данных, виды неопределенности. Теории, релевантные для моделирования неопределенности. Нечеткие данные.
  7. Специфика обработки неструктурированных данных. Системы сбора и хранения текстовых документов.
  8. Метод выделения ключевых слов. Представление документов в виде векторов взвешенных ключевых слов. Метод латентных семантик LSI – метод определения неявных взаимосвязей между терминами в рассматриваемом наборе документов.
  9. Архитектура систем баз данных и знаний. Задача проектирования информационных ресурсов в терминах модели проблемной области – концептуальная модель
  10. Концептуальное, логическое и физическое представления данных на этапах проектирования баз данных и при сопровождении информационной модели. Достижение единого уровня представления программ и данных.
  11. Управление базами данных. Основные виды поддерживаемых структур данных, схема и подсхема, схема схем (метамодель), интеллектуальный интерфейс пользователя.
  12. Взаимодействие пользователя с СУБД, схема функционирования СУБД, система управления передачей данных, распределенная обработка, языковые средства СУБД.
  13. Понятие о формализованном представлении пространственных данных. Классификация по назначению использования и по средствам отображения. Метрическая и семантическая компоненты пространственных данных.
  14. Растровое и векторное представление метрической информации. Топологическое и нетопологическое векторное представление. Обменные и рабочие форматы данных: назначение и взаимосвязь. Проблема стандартизации обменных форматов.
  15. Основные понятия теории геоинформационных баз данных. Типы пространственно-временных данных: точечные объекты, линейные объекты, ареалы, атрибутивные данные. Визуализация базы геоданных. Основные топологические характеристики моделей баз геоданных.
  16. Теоретические основы реляционных систем, разделение данных и связей, реляционная модель, базовые таблицы и представления, домены и кортежи.
  17. Алгебра отношений и исчисление отношений, реляционные операции: выборка, проекция и соединение. Языки QBE и SQL, семейство SQL-подобных СУБД.
  18. Спецификация и детализация SQL, соглашения и терминология. Язык определения данных DDL, язык модификации данных DML (data modification language), язык манипулирования данными DML (data manipulation language), язык управления данными DCL.
  19. Корректное отображение естественно-языковых запросов в язык манипулирования данными. Синтаксис и семантика операции SELECT, определение выборки – предложение WHERE. Использование реляционных и булевых операторов для создания сложных предикатов, элементы мат. логики.
  20. Табличная и операторная модификация данных. Использование подзапросов с командами обновления INSERT, DELETE, UPDATE.
  21. Создание информационных объектов: TABLE, VIEW, INDEX, TRIGGER, SYNONYM, ROLE, ASSERTION. Корректное удаление и обновление информационных ресурсов.
  22. Администрирование. Определение прав доступа к данным, передача привилегий, одновременная работа с множеством пользователей, типы блокировок. Системный каталог, использование представлений для таблиц каталога.
  23. Проектирование и реализация ООСУБД. Объектно-ориентированные модели данных. Языки программирования и запросов ООСУБД. Основные понятия ODL.
  24. SQL ServerExpress 2012. Основные компоненты SQL Server.Сетевая архитектура SQL Server. Каталоги и базы данных. Инструменты. Диспетчер конфигурации SQL ServerExpress.
  25. Среда SQL Server Management Studio SQL Server 2012. Архитектура базы данных пользователя SQL Server. Объекты базы данных.
  26. Инсталляция SQL Server Express. Средства администрирования SQL Server.
  27. Базы данных в Интернете. Технологии Интернета, используемые для обращения к базам данных.
  28. Методы доступа к данным: DAO, ADO, RDO. Ядро баз данных Microsoft Jet. Коллекции объектов DBEngine модели объектов доступа к данным DAO. Доступ к источникам данных ODBC. Объектная модель ADO.
  29. Технология XML. Создание и обработка XML-документов. Объектная модель документа DOM.
  30. XML-база данных (Native XML Database, NXD) и база данных, поддерживающая XML как тип данных (XML Enabled Database, XED). Язык запросов XPath.
  31. RDF - способ представления распределенных данных и. Использование форматов XML и N3 для записи RDF. Отличительные особенности RDF.


См. также

Личные инструменты