понеділок, 31 січня 2011 р.

Візуалізація. Зміна інструментів

Близько року займаюсь візуалізацією статистики роботи техпідтримки.   Спочатку це був Google Docs - результати sql-скриптів копіювались туди, далі - побудова графіків і т. д. Багато доводилось робити вручну. Перейшла на Excel - pivot tables - чудова річ ( http://www.youtube.com/watch?v=7zHLnUCtfUk), яка дозволяє робити обробку даних безпосередньо в Excel, дані з бази імпортуються майже автоматично.  Але в Excel, як і в Google Docs та інших їхніх аналогах обмежений набір графіків. Наразі статистику перенесла в R. Це надпотужний інструмент зацікавив тим, що дозволяє робити як статистичний аналіз даних, так і data mining. Крім того, має величезні можливості візуалізації, а також інтеграцію з базами даних.

 З R багато речей можна зробити досить швидко та красиво. Наприклад, статистика за один з років по зареєстрованих зверненнях клієнтів, згрупована по днях тижня:
Графік - коробчаста діаграма.  По осі Х - дні тижня, починаючи з неділі. З даного графіка можемо зробити висновки:

  1. у вихідні дні звернень реєструється менше;
  2. у будні дні середня кількість звернень практично однакова
  3. велика кількість аномальних даних  у вівторок, четвер та п'ятницю - можливо в ці дні аварійні ситуації  виникають частіше;

1 коментар:

  1. Здравствуйте, Анастасия! Мне нравится ваш пример и заинтересованность в R. С удовольствием бы почитал с вами и поговорил, но по-русски :). На украинском не бачу.

    ВідповістиВидалити