Методи та технології опрацювання даних (ВПК)
Тип: Нормативний
Кафедра: системного проектування
Навчальний план
Семестр | Кредити | Звітність |
5 | 3.5 | Залік |
Лекції
Семестр | К-сть годин | Лектор | Група(и) |
5 | 32 | доцент Павлишенко Б. М. | ФеП-33 |
Лабораторні
Семестр | К-сть годин | Група | Викладач(і) |
5 | 32 | ФеП-33 | доцент Ляшкевич В. Я., доцент Ляшкевич В. Я. |
Опис навчальної дисципліни
Метою вивчення нормативної дисципліни “Методи та технології опрацювання даних” є оволодіння базовими поняттями, теоретичними знаннями та практичними навичками опрацювання даних, візуалізації даних, побудови конвеєрів для аналізу і перетворення даних з подальшим використанням в
різних галузях людської діяльності з метою вирішення різного роду задач і бізнес проблем.
Рекомендована література
- 1. Paul Crickard. Data Engineering with Python – Birmingham: Packt Publishing, 2020. – 337 p. – ISBN 978-1-83921-418-9.
- 2. Wes McKinney. Python for Data Analysis – Sebastopol: O’Reilly Media, 2018. – 522 p. – ISBN 978-1-491-95766-0.
- 3. Joakim Sundnes. Introduction to Scientific Programming with Python – Lysaker: Simula SpringerBriefs, 2020, Volume 6. – ISBN: 978-3-030-50355-0. (eBook)
- 4. Michael T. Goodrich, Roberto Tamassia, Michael H. Goldwasser. Data Structures & Algorithms in Python. Wiley: Courier Westford, 2013. – 748 p. (eBook)
- 5. Numpy community. Numpy User Guide. Release 1.18.4: May 24, 2020. – 166 p.
- 6. Dr. Ossama Embarak. Data Analysis and Visualization Using Python – Abu Dhabi: Apress Media LLC, 2018. – 374 p. – ISBN-13 (pbk): 978-1-4842-4108-0.
- 7. Massimo di Pierro. Annotated Algorithms in Python – Chicago: Experts4Solutions, 2017. – 227 p. – ISBN: 978-0-9911604-0-2.
- 8. Allen B. Downey. Think Stats. Exploratory Data Analysis in Python – Needham: Green Tea Press, 2014. – 244 p.
- 9. Jake VanderPlas. Python Data Science Handbook – Sebastopol: O`Reilly Media, 2017. – 517 p. – ISBN: 978-1-491-91205-8.
- 10. The Ultimate Guide to Basic Data Clearning: Atlan, 2014. – 66 p.
- 11. Jiawei Han, Micheline Kamber, Jian Pei. Data Mining : concepts and techniques – Waltham: Elsevier, 2012. – 703 p.
- 12. Peter Bruce, Andrew Bruce, Peter Gedeck. Practical Statistics for Data Scientists. – Sebastopol: O`Reilly, 2020. – 329 p. – ISBN: 978-1-492-07294-2.
- 13. Brian Godsey. Think Like a Data Scientist. – Shelter Island: Manning Publications, 2017. – 299 p. – ISBN: 9781633430273.
- 14. Meher Krishna Patel. Pandas Guide. – May, 2020. – 62 p.
- 15. Aurelien Geron. Hands-on Machine Learning with Scikit-Learn, Keras & TensorFlow. – Sebastopol: O`Reilly, 2019. – 482 p. – ISBN: 978-1-492-03264-9.
- 16. Lewandowska, A.; Joachimiak-Lechman, K.; Kurczewski, P. A Dataset Quality Assessment—An Insight and Discussion on Selected Elements of Environmental Footprints Methodology. Energies 2021, 14, 5004. https://doi.org/10.3390/en14165004
- 17. Leo L. Pipino, Yang W. Lee, and Richard Y. Wang. Data Quality Assessment / Communications of the ACM, Volume 45, Issue 4, April 2002 pp. 211–218. – https://doi.org/10.1145/505248.506010
- 18. J. Bicevskis, Z. Bicevska, A. Nikiforova and I. Oditis, “An Approach to Data Quality Evaluation,” 2018 Fifth International Conference on Social Networks Analysis, Management and Security (SNAMS), 2018, pp. 196-201, doi: 10.1109/SNAMS.2018.8554915.
- 19. Mats Bergdahl, Manfred Ehling, Eva Elvers and others. Handbook on Data Quality Assessment Methods and Tools. – Wiesbaden, 2007. – 139 p.
- 20. Mark Richards. Software Architecture Patterns . – Sebastopol: O`Reilly Media, 2015. – 45 p. – ISBN: 978-1-491-92424-2.
- 21. Dimensionality reduction [Режим доступу]: http://bioconductor.org/books/3.15/OSCA.basic/dimensionality-reduction.html
- 22. Data exploration with alluvial plots [Режим доступу]: https://www.datisticsblog.com/2018/10/intro_easyalluvial/#features
- 23. Khaled El Emam, Lucy Mosquera, Richard Hoptroff. Practical Synthetic Data Generation: Balancing Privacy and the Broad Availability of Data: O`Reilly, 2020
- 24. Amazon. Lambda Architecture for Batch and Stream Processing. – AWS, 2018. – 12 p.
- 25. Tomcy John, Pankaj Misra. Data Lake for Enterprises. – Packt Publishing, 2017. – 855p.