Аналіз текстової інформації (122 Комп’ютерні науки)

Тип: На вибір студента

Кафедра: оптоелектроніки та інформаційних технологій

Навчальний план

СеместрКредитиЗвітність
85Залік

Лекції

СеместрК-сть годинЛекторГрупа(и)
832професор Кушнір О. С.ФеІ-43

Лабораторні

СеместрК-сть годинГрупаВикладач(і)
848ФеІ-43

Опис навчальної дисципліни

Навчальна дисципліна запроваджується до викладання згідно навчального плану 2022-2023 року. Навчальну дисципліну розроблено для одержання студентами теоре­тичних знань з опрацювання природної мови та аналізу текстової інформації, а також для формування в них навичок ефективного застосо­вування засвоєних знань і методів у розв’язанні прикладних задач такого аналізу. Представлено теоретичні основи комп’ю­терної лінг­вістики та опрацювання природної мови, класифікація та огляд особливостей відомих продуктів у цій галузі, а також відповідні алгоритми і засо­би опрацювання даних.

Метою вивчення дисципліни «Аналіз текстової інформації» є ознайом­лення студентів з теоретичними основами опрацювання природної мови, а цілями – формування в студентів практичних навичок, які б дали змогу ефективно застосовувати засвоєні знання, алгоритми, методи та при­к­ладні програми

Після завершення цього курсу студент буде:

знати основні методи аналізу текстової інформації та опрацювання природної мови, основні теорії, моделі та алгоритми галузі і опису лінгвіс­тич­них систем, інформаційного по­шу­ку та інтелектуального аналізу текстових даних;

вміти аналізувати моделі опрацювання природної мови, працювати з відповідними програмними продуктами, застосовувати комп’ю­тер­ну техніку для вирішення лінгвістичних задач, розробляти та ре­а­лі­зувати відповідні алгоритми, писати прик­ладні програми та корис­туватися ними.

Рекомендована література

Основна література:

  1. Кушнір О. С. Основи комп’ютерної лінгвістики (конспект лекцій) / О. С. Кушнір. – Львів: Видавн. Львів. ун-ту, 2023. – 292 с.
  2. Волошин В. Г. Комп’ютерна лінгвістика / В. Г. Волошин. – Суми : Університетська книга, 2004. – 382 с.
  3. Bird S. Natural language processing with Python / S. Bird, E. Klein, E. Loper. – Sebastopol : O’Reilly. – 2009. – 504 p.
  4. Bolshakov I. Computational linguistics. Models, resources, applications / I. Bolshakov, A. Gelbukh. – Mexico : Ciencia de la Computacion, 2004. – 198 p.
  5. Clark The handbook of computational linguistics and natural language proc­ess­ing / A. Clark, C. Fox, S. Lappin. – Chichester : John Wiley & Sons, 2010. – 801 p.
  6. Kracht M. Introduction to probability theory and statistics for linguistics / M. Kracht. – Oakland : UCLA, 2005. – 137 p.
  7. Математична лінґвістика. Книга 1. Квантитативна лінгвістика / В. В. Пасіч­ник, Ю. М. Щербина, В. А. Висоцька, Т. В. Шестакевич. – Львів : Новий світ – 2000, 2012. – 359 с.
  8. https://www.gutenberg.org/

Додаткова література:

  1. Pilgrim C. Bias in Zipf’s law estimators / C. Pilgrim, T. T. Hills // Sci. Rep. – 2021. – Vol. 11. – 17309 (12 pp.).
  2. Zanette D. H. Statistical patterns in written language / Zanette D. H. – Centro Atomico Bariloche, 2012, 87 http://fisica.cab.cnea.gov.ar/ estadistica/2te/
  3. Espitia D. Universal and non-universal text statistics: Clustering coeffic­ient for language identification / D. Espitia, H. L. Ridaura // Physica A. – 2020. – Vol. 553. – 123905 (25 рр.).

Силабус: з навчальної дисципліни "Аналіз текстової інформації" для ОПП “Комп’ютерні науки”

Завантажити силабус