Технологии организации данных (курс лекций, С.К.Дулин)/Вопросы
Материал из MachineLearning.
Перечень контрольных вопросов для сдачи экзамена в 8-ом семестре студентов 4 курса
специализации «Проектирование и организация систем» кафедры «Интеллектуальные системы» ФУПМ МФТИ
- Методы сбора данных.
- Определение проблемы информационного моделирования и формулирование целей исследования.
- Планирование сбора первичных данных. Преимущества и недостатки использования вторичных данных. Оценка полученных данных.
- Интеллектуальный анализ данных (Data Mining). Основные задачи Data Mining, виды моделей. Data Mining и статистический анализ. Data Mining и хранилища данных.
- Классификация и кластеризация данных. Функции сходства. Коэффициенты подобия.
- Непротиворечивость, устранение рассогласованности данных. Неопределенность данных, виды неопределенности. Теории, релевантные для моделирования неопределенности. Нечеткие данные.
- Специфика обработки неструктурированных данных. Системы сбора и хранения текстовых документов.
- Метод выделения ключевых слов. Представление документов в виде векторов взвешенных ключевых слов. Метод латентных семантик LSI – метод определения неявных взаимосвязей между терминами в рассматриваемом наборе документов.
- Архитектура систем баз данных и знаний. Задача проектирования информационных ресурсов в терминах модели проблемной области – концептуальная модель
- Концептуальное, логическое и физическое представления данных на этапах проектирования баз данных и при сопровождении информационной модели. Достижение единого уровня представления программ и данных.
- Управление базами данных. Основные виды поддерживаемых структур данных, схема и подсхема, схема схем (метамодель), интеллектуальный интерфейс пользователя.
- Взаимодействие пользователя с СУБД, схема функционирования СУБД, система управления передачей данных, распределенная обработка, языковые средства СУБД.
- Понятие о формализованном представлении пространственных данных. Классификация по назначению использования и по средствам отображения. Метрическая и семантическая компоненты пространственных данных.
- Растровое и векторное представление метрической информации. Топологическое и нетопологическое векторное представление. Обменные и рабочие форматы данных: назначение и взаимосвязь. Проблема стандартизации обменных форматов.
- Основные понятия теории геоинформационных баз данных. Типы пространственно-временных данных: точечные объекты, линейные объекты, ареалы, атрибутивные данные. Визуализация базы геоданных. Основные топологические характеристики моделей баз геоданных.
- Теоретические основы реляционных систем, разделение данных и связей, реляционная модель, базовые таблицы и представления, домены и кортежи.
- Алгебра отношений и исчисление отношений, реляционные операции: выборка, проекция и соединение. Языки QBE и SQL, семейство SQL-подобных СУБД.
- Спецификация и детализация SQL, соглашения и терминология. Язык определения данных DDL, язык модификации данных DML (data modification language), язык манипулирования данными DML (data manipulation language), язык управления данными DCL.
- Корректное отображение естественно-языковых запросов в язык манипулирования данными. Синтаксис и семантика операции SELECT, определение выборки – предложение WHERE. Использование реляционных и булевых операторов для создания сложных предикатов, элементы мат. логики.
- Табличная и операторная модификация данных. Использование подзапросов с командами обновления INSERT, DELETE, UPDATE.
- Создание информационных объектов: TABLE, VIEW, INDEX, TRIGGER, SYNONYM, ROLE, ASSERTION. Корректное удаление и обновление информационных ресурсов.
- Администрирование. Определение прав доступа к данным, передача привилегий, одновременная работа с множеством пользователей, типы блокировок. Системный каталог, использование представлений для таблиц каталога.
- Проектирование и реализация ООСУБД. Объектно-ориентированные модели данных. Языки программирования и запросов ООСУБД. Основные понятия ODL.
- SQL ServerExpress 2012. Основные компоненты SQL Server.Сетевая архитектура SQL Server. Каталоги и базы данных. Инструменты. Диспетчер конфигурации SQL ServerExpress.
- Среда SQL Server Management Studio SQL Server 2012. Архитектура базы данных пользователя SQL Server. Объекты базы данных.
- Инсталляция SQL Server Express. Средства администрирования SQL Server.
- Базы данных в Интернете. Технологии Интернета, используемые для обращения к базам данных.
- Методы доступа к данным: DAO, ADO, RDO. Ядро баз данных Microsoft Jet. Коллекции объектов DBEngine модели объектов доступа к данным DAO. Доступ к источникам данных ODBC. Объектная модель ADO.
- Технология XML. Создание и обработка XML-документов. Объектная модель документа DOM.
- XML-база данных (Native XML Database, NXD) и база данных, поддерживающая XML как тип данных (XML Enabled Database, XED). Язык запросов XPath.
- RDF - способ представления распределенных данных и. Использование форматов XML и N3 для записи RDF. Отличительные особенности RDF.
См. также