Аналіз текстової інформації (122 Комп’ютерні науки)
Тип: На вибір студента
Кафедра: оптоелектроніки та інформаційних технологій
Навчальний план
Семестр | Кредити | Звітність |
8 | 5 | Залік |
Лекції
Семестр | К-сть годин | Лектор | Група(и) |
8 | 32 | професор Кушнір О. С. | ФеІ-43 |
Лабораторні
Семестр | К-сть годин | Група | Викладач(і) |
8 | 48 | ФеІ-43 |
Опис навчальної дисципліни
Навчальна дисципліна запроваджується до викладання згідно навчального плану 2022-2023 року. Навчальну дисципліну розроблено для одержання студентами теоретичних знань з опрацювання природної мови та аналізу текстової інформації, а також для формування в них навичок ефективного застосовування засвоєних знань і методів у розв’язанні прикладних задач такого аналізу. Представлено теоретичні основи комп’ютерної лінгвістики та опрацювання природної мови, класифікація та огляд особливостей відомих продуктів у цій галузі, а також відповідні алгоритми і засоби опрацювання даних.
Метою вивчення дисципліни «Аналіз текстової інформації» є ознайомлення студентів з теоретичними основами опрацювання природної мови, а цілями – формування в студентів практичних навичок, які б дали змогу ефективно застосовувати засвоєні знання, алгоритми, методи та прикладні програми
Після завершення цього курсу студент буде:
знати основні методи аналізу текстової інформації та опрацювання природної мови, основні теорії, моделі та алгоритми галузі і опису лінгвістичних систем, інформаційного пошуку та інтелектуального аналізу текстових даних;
вміти аналізувати моделі опрацювання природної мови, працювати з відповідними програмними продуктами, застосовувати комп’ютерну техніку для вирішення лінгвістичних задач, розробляти та реалізувати відповідні алгоритми, писати прикладні програми та користуватися ними.
Рекомендована література
Основна література:
- Кушнір О. С. Основи комп’ютерної лінгвістики (конспект лекцій) / О. С. Кушнір. – Львів: Видавн. Львів. ун-ту, 2023. – 292 с.
- Волошин В. Г. Комп’ютерна лінгвістика / В. Г. Волошин. – Суми : Університетська книга, 2004. – 382 с.
- Bird S. Natural language processing with Python / S. Bird, E. Klein, E. Loper. – Sebastopol : O’Reilly. – 2009. – 504 p.
- Bolshakov I. Computational linguistics. Models, resources, applications / I. Bolshakov, A. Gelbukh. – Mexico : Ciencia de la Computacion, 2004. – 198 p.
- Clark The handbook of computational linguistics and natural language processing / A. Clark, C. Fox, S. Lappin. – Chichester : John Wiley & Sons, 2010. – 801 p.
- Kracht M. Introduction to probability theory and statistics for linguistics / M. Kracht. – Oakland : UCLA, 2005. – 137 p.
- Математична лінґвістика. Книга 1. Квантитативна лінгвістика / В. В. Пасічник, Ю. М. Щербина, В. А. Висоцька, Т. В. Шестакевич. – Львів : Новий світ – 2000, 2012. – 359 с.
- https://www.gutenberg.org/
Додаткова література:
- Pilgrim C. Bias in Zipf’s law estimators / C. Pilgrim, T. T. Hills // Sci. Rep. – 2021. – Vol. 11. – 17309 (12 pp.).
- Zanette D. H. Statistical patterns in written language / Zanette D. H. – Centro Atomico Bariloche, 2012, 87 http://fisica.cab.cnea.gov.ar/ estadistica/2te/
- Espitia D. Universal and non-universal text statistics: Clustering coefficient for language identification / D. Espitia, H. L. Ridaura // Physica A. – 2020. – Vol. 553. – 123905 (25 рр.).