понеділок, 9 червня 2014 р.

Introduction to Data Science повертається.

З 30 червня буде повтор курсу Introduction to Data Science на Coursera. Вже можна переглянути лекції. Не пропустіть :)
Враження від попередньої сесії:



Цей видався одним з найкорисніших, які я проходила. Основний акцент вcіх завдань - використання на практиці для обробки великих об'ємів даних. Більшість завдань виявились досить складними, ось їх перелік:

  1. Аналіз настроїв у Twitter-повідомленнях на Python.
  2. Аналіз бази даних (включно з множенням матриць та обрахуванням коефіцієнта подібності між елементами) (база даних SQLite)
  3. MapReduce на Python.
  4. MapReduce з використанням JSMapReduce (http://www.jsmapreduce.com/)
  5. NoSQL проект аналізу 0,5 ТВ  графа використовуючи Amazon Web Services та Apache Pig. 
  6. Участь у змаганні (можна було обрати довільне) на Kaggle.
  7. Візуальна аналітика та створення дешборда  у Tableau.
  8. Участь у реальному проекті. 
Теми лекцій:
  1. Реляційні бази та реляційна алгебра.
  2. MapReduce
  3. NoSQL
  4. Статистичний аналіз
  5. Machine Learning
  6. Візуалізація
  7. Аналіз графів

Немає коментарів:

Дописати коментар