Методи та технології опрацювання даних (ВПК)
Тип: Нормативний
Кафедра: системного проектування
Навчальний план
Семестр | Кредити | Звітність |
5 | 3.5 | Залік |
Лекції
Семестр | К-сть годин | Лектор | Група(и) |
5 | 32 | доцент Ляшкевич В. Я. |
Лабораторні
Семестр | К-сть годин | Група | Викладач(і) |
5 | 32 |
Опис навчальної дисципліни
Навчальну дисципліну розроблено таким чином, щоб надати учасникам необхідні знання, щоб оволодіти базовими поняттями, пов’язаними з алгоритмами, методами та засобами опрацювання даних, побудові конвеєрів даних, використання метрик та засобів оцінки даних, архітектури даних та інтерпретація стурктурованих і неструктурованих даних. Саме тому у дисципліні подано огляд базових понять та інструментів для опрацювання даних, так і засобів, які потрібні для вирішення типових завдань при побудові конвеєрів даних, аналізу та візуалізації даних.
Рекомендована література
- Paul Crickard. Data Engineering with Python – Birmingham: Packt Publishing, 2020. – 337 p. – ISBN 978-1-83921-418-9.
- Wes McKinney. Python for Data Analysis – Sebastopol: O’Reilly Media, 2018. – 522 p. – ISBN 978-1-491-95766-0.
- Joakim Sundnes. Introduction to Scientific Programming with Python – Lysaker: Simula SpringerBriefs, 2020, Volume 6. – ISBN: 978-3-030-50355-0. (eBook)
- Michael T. Goodrich, Roberto Tamassia, Michael H. Goldwasser. Data Structures & Algorithms in Python. Wiley: Courier Westford, 2013. – 748 p. (eBook)
- Numpy community. Numpy User Guide. Release 1.18.4: May 24, 2020. – 166 p.
- Dr. Ossama Embarak. Data Analysis and Visualization Using Python – Abu Dhabi: Apress Media LLC, 2018. – 374 p. – ISBN-13 (pbk): 978-1-4842-4108-0.
- Massimo di Pierro. Annotated Algorithms in Python – Chicago: Experts4Solutions, 2017. – 227 p. – ISBN: 978-0-9911604-0-2.
- Allen B. Downey. Think Stats. Exploratory Data Analysis in Python – Needham: Green Tea Press, 2014. – 244 p.
- Jake VanderPlas. Python Data Science Handbook – Sebastopol: O`Reilly Media, 2017. – 517 p. – ISBN: 978-1-491-91205-8.
- The Ultimate Guide to Basic Data Cleaning: Atlan, 2014. – 66 p.
- Jiawei Han, Micheline Kamber, Jian Pei. Data Mining: concepts and techniques – Waltham: Elsevier, 2012. – 703 p.
- Peter Bruce, Andrew Bruce, Peter Gedeck. Practical Statistics for Data Scientists. – Sebastopol: O`Reilly, 2020. – 329 p. – ISBN: 978-1-492-07294-2.
- Brian Godsey. Think Like a Data Scientist. – Shelter Island: Manning Publications, 2017. – 299 p. – ISBN: 9781633430273.
- Meher Krishna Patel. Pandas Guide. – May, 2020. – 62 p.
- Aurelien Geron. Hands-on Machine Learning with Scikit-Learn, Keras & TensorFlow. – Sebastopol: O`Reilly, 2019. – 482 p. – ISBN: 978-1-492-03264-9.
- Lewandowska, A.; Joachimiak-Lechman, K.; Kurczewski, P. A Dataset Quality Assessment—An Insight and Discussion on Selected Elements of Environmental Footprints Methodology. Energies 2021, 14, 5004. https://doi.org/10.3390/en14165004
- Leo L. Pipino, Yang W. Lee, and Richard Y. Wang. Data Quality Assessment / Communications of the ACM, Volume 45, Issue 4, April 2002 pp. 211–218. – https://doi.org/10.1145/505248.506010
- J. Bicevskis, Z. Bicevska, A. Nikiforova and I. Oditis, “An Approach to Data Quality Evaluation,” 2018 Fifth International Conference on Social Networks Analysis, Management and Security (SNAMS), 2018, pp. 196-201, doi: 10.1109/SNAMS.2018.8554915.
- Mats Bergdahl, Manfred Ehling, Eva Elvers and others. Handbook on Data Quality Assessment Methods and Tools. – Wiesbaden, 2007. – 139 p.
- Mark Richards. Software Architecture Patterns. – Sebastopol: O`Reilly Media, 2015. – 45 p. – ISBN: 978-1-491-92424-2.
- Dimensionality reduction [Режим доступу]: http://bioconductor.org/books/3.15/OSCA.basic/dimensionality-reduction.html
- Data exploration with alluvial plots [Режим доступу]: https://www.datisticsblog.com/2018/10/intro_easyalluvial/#features
- Khaled El Emam, Lucy Mosquera, Richard Hoptroff. Practical Synthetic Data Generation: Balancing Privacy and the Broad Availability of Data: O`Reilly, 2020
- Amazon. Lambda Architecture for Batch and Stream Processing. – AWS, 2018. – 12 p.
- Tomcy John, Pankaj Misra. Data Lake for Enterprises. – Packt Publishing, 2017. – 855p.