понеділок, 19 січня 2015 р.

Process Mining: Data Science in Action від Coursera

Назва курсу досить інтригуюча, насправді все достатньо просто:
Є лог подій - з нього будуємо модель поведінки (враховуючи overfitting та underfitting, тобто модель повинна пояснювати більшість кейсів, які відбулись але й бути достатньо гнучкою, щоб майбутні кейси теж нею описувались).
Використовуємо інструменти(Disco, ProM), які дозволяють візуалізувати цю модель. На основі візуалізації робимо аналіз логу. Також результати можна конвертувати в різні нотації (наприклад BPMN).
В залежності від мети, дослідження процесів може включати:
Організаційний аспект:
  • Типову поведінка (користувачів, працівників, ...);
  • Час, який витрачається на кожному етапів;
  • Можливі "вузькі місця" (bottlenecks).
Соціальний аспект:
  • Хто з ким взаємодіє в процесі виконання завдань;
  • Скільки часу кожен учасник тратить на виконання завдань;
  • Також на основі цих даних можна зробити висновки, про типові наступні кроки та зробити прогноз часу виконання тих чи інших завдань.

Презентації лектора до цього курсу:
http://www.slideshare.net/wvdaalst

Повторна сесія: квітень-травень 2015




Приклади результатів Disco:




 Приклади  результатів ProM:



Недоліки:
  • курс занадто академічний;
  • багато часу приділено побудові моделей в різних нотаціях;
  • під конкретну задачу неважко зробити свою версію візуалізації/калькуляції;
  • для використання цих інтрументів лог подій повинен вміщатись в пам"ять.

1 коментар: