Враження від попередньої сесії:
Цей видався одним з найкорисніших, які я проходила. Основний акцент вcіх завдань - використання на практиці для обробки великих об'ємів даних. Більшість завдань виявились досить складними, ось їх перелік:
- Аналіз настроїв у Twitter-повідомленнях на Python.
- Аналіз бази даних (включно з множенням матриць та обрахуванням коефіцієнта подібності між елементами) (база даних SQLite)
- MapReduce на Python.
- MapReduce з використанням JSMapReduce (http://www.jsmapreduce.com/)
- NoSQL проект аналізу 0,5 ТВ графа використовуючи Amazon Web Services та Apache Pig.
- Участь у змаганні (можна було обрати довільне) на Kaggle.
- Візуальна аналітика та створення дешборда у Tableau.
- Участь у реальному проекті.
Теми лекцій:
- Реляційні бази та реляційна алгебра.
- MapReduce
- NoSQL
- Статистичний аналіз
- Machine Learning
- Візуалізація
- Аналіз графів
Немає коментарів:
Дописати коментар