![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjzMUqOJjq0KcBoudamt6e4Rlz05mFMpvGFyFzoQjZ_Sg4_iGTo9Zl0ZFBpKn_OFk46f_PpNS4C2oheXuLBrwoXEpXVTjOfu3cmLEOEoFh-bP3_gcCfdclNBI2ofDvO-OrYSODocHShyphenhyphen1_R/s1600/bigdatateam.png)
В якості прикладу використано модель побудови додатку для аналізу електронної пошти в межах Agile підходу. Спочатку створюються базовий додаток з такими кроками:
- отримати вміст власної Gmail скриньки
- серіалізація на Avro
- аналіз на Pig Latin
- збереження даних в Mongo DB
- використання Elastic Search
- завертання результатів аналізу у веб-додаток використовуючи Python/Flask
Загалом цікаво.
Плюси:
- практичні рецепти побудови, описане середовище можна використовувати для розгортання власних додатків у майбутньому
- приклад Data Science моделі повного циклу (від ідеї до сервісу)
- гарне пояснення як адаптувати класичний Waterfall процес Data Science до Agile методології
- Нових знань з Data Science ви тут не отримаєте, це швидше Data Engineering
- Не всі приклади працюють, як описано в книжці
Немає коментарів:
Дописати коментар