Моделювання великих даних

Інформація про програму

Галузь знань – 12 Інформаційні технології

Спеціальність – 122 Комп’ютерні науки та інформаційні технології

Спеціалізація – Моделювання великих даних

Кваліфікація – Магістр комп’ютерних наук та інформаційних технологій

Тривалість навчання – 1,5 роки

Тижневе навантаження – 18 годин

Семестрове навантаження – 30 кредитів

Ціль програми – надати теоретичні знання та практичні уміння і навички, достатні для успішного виконання професійних обов’язків в галузі інформаційних технологій та підготувати студентів для подальшого працевлаштування в області аналізу великих даних і видобутку нових знань у масивах великих даних в інформаційних та інформаційно-управляючих системах.

Профіль програми

Магістерська програма спрямована на вивчення і набуття уміння в сфері інженерії даних та знань в технологічних процесах розроблення і підтримки інтелектуальних інформаційних систем, які базуються на моделюванні великих даних.

В процесі навчання студенти набувають системних практичних навиків як в технологічній області, так і в області виробничо-дослідницької діяльності.

В результаті навчання студенти отримують сучасні знання, які необхідні для провадження інженерної та наукової діяльності в області інтелектуального аналізу великих даних, видобутку нових знань у наборах даних великої розмірності і створення прикладних інформаційних продуктів.

Навчальна програма


Цикл Назва дисципліни Кредити

І Семестр

ПП Управління даними 4
ПП Методи пошуку закономірностей 4
ПП Регресійні моделі 5
ДС Статистика 4
ДС Візуалізація у великих даних і видобуток закономірностей 5
ЗП Правознавство 4
ЗП Управління інноваціями 4

ІІ Семестр

ПП Розробка інформаційних продуктів 5
ПП Предиктивний аналіз 5
ДС Аналіз великих даних на графах 5
ДС Глибоке машинне навчання 5
ДС Засоби роботи з великим даними 5
ЗП Менеджмент та лідерство/Підприємництво і запуск стартапів 5

ІІІ Семестр

ПП Дослідницька практика за темою магістерської роботи 9
ПП Виконання і захист магістерської кваліфікаційної роботи 21

ПП – дисципліни циклу професійного підготовки
ЗП – дисципліни циклу загальної підготовки
ДС – дисципліни самостійного вибору студента


В процесі навчання студенти вивчають і застосовують на практиці різноманітні інструментальні засоби та технології, серед яких:

  • Інструментальні засоби для аналізу великих даних – R, GitHub, Python, SciPy, Pandas, Ipython.
  • Візуалізації даних – Advizor Analyst, R (ggplot2), Weave, Visalix, Databionic ESOM Tools, KNIME, Lattice Miner.
  • Фрейморк організації розподілених обчислень – Hadoop MapReduce, Hadoop, Spark, CLUTO.
  • Фрейморки для виявлення аномалій, відхилень або фальсифікацій в даних – ELKI, Anodot, Delta Miner, Machine Analytics.
  • Пакети для створенні інформаційних продуктів та інтерактивних графіків – Shiny, R.
  • Хмарні технології – Microsoft Azure – Storage – Distributed cloud computing (Hadoop), Amazon Elastic MapReduce (EMR), Google Cloud Platform.
  • Прикладні пакети для вирішення практичних задач на основі глибокого машинного навчання – R та Caffe.

Результати навчання


У результаті навчання випускник набуде таких умінь:

  1. Здатність до професійної роботи з даними: видобуток (у тому числі повторний), фільтрація, інтеграція, зберігання, перевірка актуальності, валідація і репрезентивність.
  2. Здатність здійснювати інтелектуальний аналіз великих даних та їх оперативну обробку, уміння видобувати у них раніше невідомі знань, необхідних для прийняття рішень в процесах професійної діяльності.
  3. Здатність до моделювання високорівневих абстракцій в у великих наборах наборах різної природи.
  4. Здатність до аналізу великих даних в процесах комп’ютерного моделювання з метою пошуку оптимального результату.
  5. Здатність проектувати сховища великих даних, для видобутку даних і знань.
  6. Здатність проектувати та розробляти прикладні інформаційні продукти для видобутку корисних знань і вироблення оптимальних стратегій прийняття рішень.
  7. Здатність аналізувати науково-технічну інформацію при проведенні науково-дослідних робіт.
  8. Здатність проведення наукових досліджень на відповідному рівні.

Працевлаштування


Випускник магістерської програми займатиме робочі місця у сфері розробки систем інтелектуального аналізу даних, зокрема такі посади:

  • розробник програмного забезпечення для розподіленого аналізу великих даних;
  • інженер з моделювання бізнес процесів на великих даних;
  • інженер з видобутку знань у наборах великих даних;
  • науковий співробітник;
  • аналітик великих даних;
  • інженер-дослідник відділу R&D.