test adsense

Пʼятниця, 1 червня 2012 р.

Model thinking: Моделі агрегації


Агрегація - об'єднання елементів у єдину систему. Зазвичай, результат об'єднання набуває властивостей, якими не володіють компоненти.
Скот Пейдж розповідає про агрегацію дій, правил, сімейств правил та вподобань. Застосування цих простих моделей може дати відповідь на такі питання: "Чому на літак, де є 380 посадкових місць варто продати 400 квитків?", "Як можна маніпулювати на виборах?"

Четвер, 19 квітня 2012 р.

"Контакт-центры - лучшие практики" 2012

Гарна стаття на основі цьогорічної конференції ВАКЦ(Всеураїнської Асоціації Контактних Центрів) "Контакт-центры - лучшие практики" http://ko.com.ua/rynok_kontakt-centrov_v_ukraine_rezultaty_tendencii_perspektivy_62757.
Ознайомитись з презентаціями доповідачів можна тут http://conference.cca.org.ua/speakers
А це опис моїх вражень від минулорічної конференції - http://energyfirefox.blogspot.com/2011/02/blog-post.html.


Середа, 28 березня 2012 р.

Понеділок, 12 березня 2012 р.

Model thinking: Моделі розподілу

Модель розподілу Шеллінга, модель Грановеттера,  модель Аплодування Стоячи (Standing Ovations)

Пʼятниця, 9 березня 2012 р.

Освіта в Stanford University. Model Thinking

Восени 2011 розпочато проект безкоштовних онлайн-курсів від Stanford University. Перші три курси: Machine learning, Artificial intelligence, Introduction to Database. Наразі перелік курсів суттєво розширився https://www.coursera.org/landing/hub.php. До ініціативи приєдналися University of Michigan та University of California, Berkeley.  Проект зараз має назву Coursera.
Я записалась на Model Thinking клас.  
Коротко про курс:
Лектор Scott E Page.  
Навчання англійською мовою.
Тривалість 10 тижнів.
Структура:  відеолекції тривалістю  8-15 хвилин (одна тема 5-8 лекцій, 2 теми на тиждень) та матеріал для читання.  Раз на 2 тижні перевірочні тести (судячи з першого, для успішної здачі достатньо лише лекцій).  Тим, хто успішно здасть екзамен в кінці курсу та перевірочні тести протягом навчання, буде видано сертифікат про завершення курсу. 
Також можна вести обговорення цікавих тем на форумі курсу (наприклад, моделі в реальному житті).
В блозі буду публікувати нотатки/конспекти/зауваження по курсу.

Теми лекцій:
Моделі розподілу (Segregation and Peer effects)
Моделі агрегації (Aggrefation)
Desicion Models
Thinking Electrons: Modeling People
Categorical and Linear Models
Tipping Points
Economic Growth
Diversity and Innovation
Markov Processes
Lyapunov Functions
Coordination and Culture
Path Dependence
Networks
Randomness and Random Walks
Colonel Blotto
Prisoners' Dilemma and Collective Action
Mechanism   Design
Learning Models: Replicator Dynamics
Prediction and The Many Model Thinker




Пʼятниця, 2 березня 2012 р.

Географія послідовників в Twitter.


Сьогодні, з допомогою R, покажемо географічне положення послідовників та тих, за ким слідкую я, в twitter.  
Для цього використаємо пакети twitteR (для отримання даних),  dismo та XML для отримання географічних координат місцезнаходження та maps і geosphere для побудови карти.
Отримуємо список послідовників та тих, за ким я слідую:

tmp <- getUser("fire_fox")
followers <- tmp$getFollowers(n = NULL)
following = tmp$getFriends(n = NULL)
Знаходимо координати місцезнаходження кожного користувача з отриманих списків. Для кожного місця отримуємо широту та довготу(де це можливо). Для отримання широти/довготи використана функція geocode(), яка є обгорткою веб-сервісу геокодінгу Google:

userlocation <- geocode(tmp$location)
userLL <- userlocation[ , c("lon", "lat")]

followersLocation <- sapply(followers,function(x){location(x)})
followersLocation <- as.data.frame(do.call(rbind, followersLocation))
gcodesfollowers <- geocode(followersLocation$V1)
gcodesfollowers <- gcodesfollowers[!is.na(gcodesfollowers$lon), ]
unigcodesfollowers <- unique.data.frame(gcodesfollowers)
unigcodesfollowers <- unigcodesfollowers[, c("lon", "lat")]

followingLocation = sapply(following,function(x){location(x)})
followingLocation <- as.data.frame(do.call(rbind, followingLocation))
gcodesfollowing <- geocode(followingLocation$V1)
gcodesfollowing <- gcodesfollowing[!is.na(gcodesfollowing$lon), ]
unigcodesfollowing <- unique.data.frame(gcodesfollowing)
unigcodesfollowing <- unigcodesfollowing[, c("lon", "lat")]
Зображаємо на карті послідовників та тих, за ким слідую я:

par(mfrow=c(2,1),mar=rep(0,4))

map("world", col="#191919", fill=TRUE, bg="#000000", mar=rep(0,4))
mtext("@fire_fox Followers Map",col="white")

for (i in 1:nFollowers){
  inter <- gcIntermediate(userLL, c(unigcodesfollowers$lon[i], unigcodesfollowers$lat[i]), n=100, addStartEnd=TRUE)
  lines(inter, col = "white", lwd = 0.8)
}     

map("world", col="#191919", fill=TRUE, bg="#000000", mar=rep(0,4))
mtext("@fire_fox Following Map",col="white")

for (i in 1:nFollowing){
  inter <- gcIntermediate(userLL, c(unigcodesfollowing$lon[i], unigcodesfollowing$lat[i]), n=100, addStartEnd=TRUE)
  lines(inter, col = "white", lwd = 0.8)
}

mtext("created by @fire_fox",col="white", side = 1)
Ось і результат, де з'єднувальні лінії - найкоротші відстані між мною та користувачем. :

 Ще один із способів описаний у статті http://simplystatistics.tumblr.com/post/14568185310/an-r-function-to-map-your-twitter-followers.  Але,  при використанні описаної в статті функції,  відкидаються користувачі, у яких в полі "location" дані введені кирилицею.  У випадку мого екаунта це близько половини фолловерів. Тому вибір зроблено на користь пакета dismo, де є можливість використати геокодінг Google.

Пʼятниця, 24 лютого 2012 р.

Boxplot (коробчаста діаграма, ящик з вусами) та її застосування.

Boxplot або ж box-and-whiskers plot в перекладі на українську "коробчаста діаграма" або"ящик з вусами".
Візуалізує статистичні характеристики вибірки.
"Коробка" включає значення, які входять  в інтерквартильний розмах (ІКР -  це різниця між третім і першим квартилем).  "Вуса" -  значення,  які лежать, відповідно, нижче та вище першого та третього квартиля. "Викиди" - значення, які знаходяться поза межами інтервалу  1.5 х ІКР. Вони не завжди є нетиповими.

Використовується для експрес-оцінки набору даних  та/або порівняння кількох наборів.
Приклад застосування boxplot для аналізу даних  "Чому закривають серіал Доктор Хаус?"