Современные методы распознавания и синтеза речи (курс лекций)/2018
Материал из MachineLearning.
(лекция 1) |
|||
Строка 17: | Строка 17: | ||
!Дата !! № занятия !! Тема !! Материалы | !Дата !! № занятия !! Тема !! Материалы | ||
|- | |- | ||
- | |14.02.2018 || Лекция 1 || < | + | |14.02.2018 || Лекция 1 || <h5>Дискретные сигналы. Преобразование Фурье.</h5> |
+ | <p>Введение в курс. Терминология. Гильбертово пространство. <br >Неравенство Бесселя и тождество Парсеваля. Тригонометрический базис. <br> Дискретное преобразование Фурье (DFT, DFS, DTFT). Связь между преобразованиями. Свойства. </p> | ||
+ | || Ch. 1 — Ch. 4, [2] | ||
|- | |- | ||
|21.02.2018 || Лекция 2 || | |21.02.2018 || Лекция 2 || | ||
Строка 64: | Строка 66: | ||
При пересчете баллов итоговая оценка ставится по следующей шкале: | При пересчете баллов итоговая оценка ставится по следующей шкале: | ||
- | * [0, 40) — | + | * [0, 40) — “неуд” |
* [40, 60) — “удовл” | * [40, 60) — “удовл” | ||
* [60, 80) — “хор” | * [60, 80) — “хор” | ||
- | * [80, 100] — “отл” | + | * [80, 100] — “отл” |
== Литература == | == Литература == | ||
+ | |||
+ | [1] [https://www.amazon.com/Digital-Signal-Processing-Handbook-Second/dp/1420046047 The Digital Signal Processing Handbook, Vijay Madiestti] | ||
+ | |||
+ | [2] [http://www.sp4comm.org/getit.html Signal Processing For Communications, Paolo Prandoni & Martin Vettarli] | ||
+ | |||
+ | [3] [https://web.stanford.edu/~jurafsky/slp3/ Speech and Language Processing. Dan Jurafsky and James H. Martin] | ||
[[Категория:Учебные курсы]] | [[Категория:Учебные курсы]] |
Версия 18:06, 10 февраля 2018
Лекторы: Воропаев А., Соловьев Д., Полыковский Д.
Содержание |
Аннотация
Обработка речи начинает применяться в большом числе приложений — голосовых помощниках, автомобилях, картах и играх. Данный курс посвящен актуальным задачам и направлениям в этой области. Первые лекции будут посвящены классическим методам анализа цифровых сигналов, а также их применению в обработке речи. Во второй части будут рассмотрены современные нейросетевые подходы синтеза и распознавания речи, а также — голосовая идентификация пользователя и детекция ключевой фразы. На курсе студенты смогут самостоятельно реализовать рассматриваемые методы как на модельных примерах, так и в реальном командном проекте.
Учебный план
- Лекции проходят по средам в с 10:30 до 12:05 в ауд. 524
- Чат в Telegram: ссылка
- Инвайт в Anytask: lWVASKX
- [0, 40) — “неуд”
- [40, 60) — “удовл”
- [60, 80) — “хор”
- [80, 100] — “отл”
Практические задания
Тема | Макс. балл | Дата выдачи | Срок сдачи | Крайний срок |
---|---|---|---|---|
Преобразование Фурье | 15 | 21.02.2018 | 07.03.2018 | 21.03.2018 |
Распознавание команд | 25 | 21.03.2018 | 04.04.2018 | 18.04.2018 |
Синтез звука | 25 | 18.04.2018 | 02.05.2018 | 16.05.2018 |
Итоговый проект | 35 | 07.03.2018 | Досрочная защита | Экзамен |
Система выставления оценок по курсу
В курсе предусмотрено 3 практических задания и итоговый проект. Практические задания выдаются на 2 недели, после которых начисляется штраф 0.2 балла за каждый день просрочки. Через 2 недели после срока сдачи практическое задание не принимается. Защита итогового проекта проходит в день экзамена. Суммарно за практические задания и итоговый проект можно получить до 100 баллов.
При пересчете баллов итоговая оценка ставится по следующей шкале:
Литература
[1] The Digital Signal Processing Handbook, Vijay Madiestti
[2] Signal Processing For Communications, Paolo Prandoni & Martin Vettarli
[3] Speech and Language Processing. Dan Jurafsky and James H. Martin