середа, 16 липня 2014 р.

Practical Machine Learning та Developing Data Products.

Я вже писала, що Coursera має спеціалізацію Data Science. В рамках цієї спеціалізації пропонується 9 курсів + фінальний проект. Оскільки почакові курси багато в чому дублюють Computing for Data Analysis та Data Analysis, як і я вже проходила то проходила два фінальні - Practical Machine Learning та Developing Data Products.
Всі курси спеціалізації мають ще багато відкритих сесій до кінця року. Термін проходження одного курсу - 4 тижні.

Короткий огляд:
Practical Machine Learning - основний акцент на процесі побудови ML моделей. Бібліотека caret для полегшення рутинних процесів - поділ на тренувальний, перевірочний та тестовий набори, тренування моделі, оцінка моделі. В рамках курсу потрібно було побудувати модель для розпізнавання активності людини (http://groupware.les.inf.puc-rio.br/har).
Обов'язкова умова - результати дослідження у вигляді звіту (з використанням knitr для автоматичної побудови звіту з коду) на GitHub. Окрім того, результат має бути відтворюваним.

Developing Data Products  - як зробити прототип продукту та презентувати його.
Теми:

  • побудова R графіків з використанням java-script бібліотек
  • Shiny - створення веб-додатків на R та варіанти розміщення цих додатків
  • Slidify - бібліотека для створення презентацій на R. Окрім стандартних елементів презентацій можна додати інтерактивні запитання (напр. для самотестування) та java-script графіки.
  • Yhat - має досить широку функціональність (більше на сайті), в рамках курсу розглянуто можливість розгорнути предиктивну модель та отримати REST API для комунікації з додатком (послати дані для входу та отримати результат) через json. 
Практичне завдання - розробити веб-додаток в Shiny, розгорнути його та підготувати презентацію цього додатку в Slidify.

Мій додаток:
https://energyfirefox.shinyapps.io/DataProducts/

І сертифікати:

1 коментар: