Аналіз та обробка великих даних

Інформація про програму

Галузь знань – 12 Інформаційні технології

Спеціальність – 122 Комп’ютерні науки

Спеціалізація – Аналіз та обробка великих даних

Кваліфікація – Магістр комп’ютерних наук та інформаційних технологій

Тривалість навчання – 1,5 роки

Тижневе навантаження – 18 годин

Семестрове навантаження – 30 кредитів

Ціль програми – надати теоретичні знання та практичні уміння і навички, достатні для успішного виконання професійних обов’язків в галузі інформаційних технологій та підготувати студентів для подальшого працевлаштування в області видобутку й інтелектуального аналізу великих даних різної природи в розподілених інформаційних системах

Профіль програми

Магістерська програма спрямована на вивчення і набуття уміння в сфері інженерії даних та знань в технологічних процесах розроблення і підтримки комп’ютерних систем, які базуються на інтелектуальному аналізі великих даних.

В процесі навчання студенти набувають системних практичних навиків як в технологічній області, так і в області виробничо-дослідницької діяльності.

В результаті навчання студенти отримують сучасні знання, які необхідні для провадження інженерної та наукової діяльності в області видобутку знань у наборах великих даних, їх інтелектуальної обробки і створення прикладних інформаційних продуктів.

Навчальна програма


Цикл Назва дисципліни Кредити

І Семестр

ПП Управління даними 4
ПП Методи пошуку закономірностей 4
ПП Регресійні моделі 5
ДС Аналітика 4
ДС Візуалізація даних 5
ЗП Правознавство 4
ЗП Управління інноваціями 4

ІІ Семестр

ПП Розробка інформаційних продуктів 5
ПП Предиктивний аналіз 5
ДС Стохастичні графові моделі 5
ДС Машинне навчання 5
ДС Інструментальні засоби аналізу великих даних і процесів 5
ЗП Менеджмент та лідерство/Підприємництво і запуск стартапів 5

ІІІ Семестр

ПП Дослідницька практика за темою магістерської роботи 9
ПП Виконання і захист магістерської кваліфікаційної роботи 21

ПП – дисципліни циклу професійного підготовки
ЗП – дисципліни циклу загальної підготовки
ДС – дисципліни самостійного вибору студента

Інструментальні засоби та технології


В процесі навчання студенти вивчають і застосовують на практиці різноманітні інструментальні засоби та технології, серед яких:

  • Поглиблене вивчення прикладних інструментальних засобів – MATLAB, R, SciPy.
  • Візуалізації даних – Advizor Analyst, R (ggplot2), Weave, Visalix, Databionic ESOM Tools, KNIME, Lattice Miner.
  • Фрейморк організації розподілених обчислень – Hadoop MapReduce, Hadoop, Spark, CLUTO.
  • Фрейморки для виявлення аномалій, відхилень або фальсифікацій в даних – ELKI, Anodot, Delta Miner, Machine Analytics.
  • Фрейморки для web-аналітики – Google Analytics, AMI Enterprise Intelligence, Automation Anywhere, iWebScraping, Web Data Extraction Services.
  • Пакети для створенні інформаційних продуктів та інтерактивних графіків – Shiny, R.
  • Хмарні технології Microsoft Azure – Storage – Distributed cloud computing (Hadoop), Amazon Elastic MapReduce (EMR), Google Cloud Platform
  • Засоби візуалізації – ggplot (R), Weka.
  • Прикладні пакети для вирішення практичних задач на основі глибокого машинного навчання – R та Caffe.

Результати навчання


У результаті навчання випускник набуде таких умінь:

  1. Здатність до професійної роботи з даними: видобуток (у тому числі повторний), фільтрація, інтеграція, зберігання, перевірка актуальності, валідація і репрезентивність.
  2. Здатність видобувати знання шляхом інтеграції та аналізу великих даних, отриманих з різноманітних та різнорідних джерела інформації.
  3. Здатність розробляти і використовувати інструментальні засоби інтеграції різнотипових даних у наборах різної розмірності.
  4. Здатність проектувати сховища великих даних, для видобутку даних і знань.
  5. Здатність проектувати та розробляти прикладні інформаційні продукти для видобутку корисних знань і вироблення оптимальних стратегій прийняття рішень.
  6. Здатність аналізувати науково-технічну інформацію при проведенні науково-дослідних робіт.
  7. Здатність проведення наукових досліджень на відповідному рівні.

Працевлаштування


Випускник магістерської програми займатиме робочі місця у сфері розробки систем інтелектуального аналізу даних, зокрема такі посади:

  • розробник програмного забезпечення для розподіленої обробки великих даних;
  • розробник систем інтелектуального аналізу великих різнотипових даних;
  • інженер інтелектуалізованих систем;
  • науковий співробітник;
  • аналітик великих даних;
  • Інженер відділу R&D/