Опрацювання звукової інформації засобами штучного інтелекту (126 Інформаційні системи та технології)

Тип: На вибір студента

Кафедра: оптоелектроніки та інформаційних технологій

Опис навчальної дисципліни

Мета викладання предмету

Даний курс має на меті ознайомити студентів з теоретичними основами опрацювання звукової інформації засобами штучного інтелекту та надати їм необхідні практичні навички, включно з програмною реалізацією базових алгоритмів. У курсі даються уявлення про історію розвитку та сучасний стан предмету. Розглядаються основні поняття про звук і його фізичні параметри та особливості суб’єктивного сприйняття звукових сигналів людиною. Студенти ознайомляться з основними характеристиками цифрового звуку (дескрипторами), які застосовуються як вхідні дані для подальшого аналізу засобами штучного інтелекту, та з алгоритмами отримання дескрипторів із початкового сигналу. Розглядаються системи аналізу звукової інформації на основі штучних нейронних мереж, які застосовуються для розпізнавання та класифікації голосових та музичних сигналів.

Завдання викладання предмету

Після вивчення цієї дисципліни студент повинен

знати:

  • основні фізичні параметри звуку та особливості сприйняття звуку людиною;
  • основи цифрового представлення звукових сигналів;
  • методи аналізу цифрового звуку з метою отримання характеристичних ознак сигналу;
  • методи розрахунку спектральних, часових, амплітудних та комбінованих параметрів звукових сигналів різної природи;
  • методи штучного інтелекту, які використовуються для опрацювання звукової інформації;
  • основи побудови штучних нейронних мереж для обробки параметрів звукових сигналів та розпізнавання голосової та музичної інформації;

вміти:

  • аналізувати особливості звукових сигналів від різних джерел;
  • реєструвати звукові сигнали, здійснювати їхню дискретизацію і квантування;
  • здійснювати попередню обробку сигналів, зокрема для підвищення їхньої якості та пониження шумів;
  • аналізувати звукові сигнали і видобувати з них характеристичні параметри, необхідні для подальшої ефективного опрацювання методами штучного інтелекту;
  • створювати програмні засоби для розрахунку спектральних, часових, амплітудних та комбінованих параметрів звукових сигналів;
  • реалізовувати алгоритми обробки отриманих дескрипторів звукових сигналів за допомогою штучних нейронних мереж різного типу;
  • здійснювати розпізнавання голосових команд, ідентифікацію джерел звуку.

 

Для вивчення дисципліни необхідні знання з таких дисциплін: «Цифрова обробка інформації», «Цифрова обробка сигналів», «Математична статистика і теорія ймовірності».

Рекомендована література

Основна:

  1. Цифрова обробка аудіо- та відеоінформації у мультимедійних системах: Навчальний посібник / О.В. Дробик, В.В. Кідалов, В.В. Коваль, Б.Я. Костік, В.С. Лазебний, Г.М. Розорінов, Г.О. Сукач. – К.: Наукова думка, 2008. – 144 с.
  2. А.Й. Наконечний, Р.А. Наконечний, В.А. Павлиш. Цифрова обробка сигналів. Львів, В-во Львівської політехніки, 2010, 308с.
  3. В.Бондарев, Г.Трэстер, В.Чернега. Цифровая обработка сигналов: методы и средства. Учебное пособие для вузов. Севастополь, СевГТУ,1999, 398с.
  4. Хайкин, С. Нейронные сети: полный курс / С. Хайкин 2-е издание. : Пер.с англ. – М.: Издательский дом «Вильямс», 2006. – 1104 с.
  5. Фролов А. В. Синтез и распознавание речи. Современные решения. [Електронний ресурс] / А. В. Фролов, Г. В. Фролов. – 2003. – Режим доступу до ресурсу: http://www.frolov-lib.ru/books/hi/index.html.

Додаткова:

  1. Злобін Г., Мочульський Ю. Цифрова обробка інформації. Навч.-метод. посібник. Вид. центр ЛНУ імені Івана Франка, Львів, 2013.
  2. Лайонс Р. Цифровая обработка сигналов. – М: ООО ”Бином-пресс”, 2006.
  3. Dong Yu, Li Deng, “Automatic Speech Recognition. A Deep Learning Approach”, Springer-Verlag, London. 2015, 321 p.
  4. Jurafsky D., Martin J.H. (2008) Speech and language processing, 2nd edition. Prentice Hall.
  5. Hinton G., Deng L., Yu D., Dahl G., Mohamed A., Jaitly N., Senior A., Vanhoucke V., Nguyen P., Sainath T., Kingsbury B., “Deep neural networks for acoustic modeling in speech recognition: The shared views of four research groups”, IEEE Signal Process. Mag., Vol. 29, No. 6, Nov. 2012, pp. 82–97.

Силабус:

Завантажити силабус