пʼятницю, 1 червня 2012 р.

Model thinking: Моделі агрегації


Агрегація - об'єднання елементів у єдину систему. Зазвичай, результат об'єднання набуває властивостей, якими не володіють компоненти.
Скот Пейдж розповідає про агрегацію дій, правил, сімейств правил та вподобань. Застосування цих простих моделей може дати відповідь на такі питання: "Чому на літак, де є 380 посадкових місць варто продати 400 квитків?", "Як можна маніпулювати на виборах?"



Агрегація дій. Дає можливість розуміння даних та  передбачення значень в точках.

Якщо точніше - агрегація результатів дій. Як приклад - підкидання монети. Результатом може бути "орел" або ж "решка". Для всіх подій,  де результат є незалежним від попередніх та існує скінченна кількість варіантів  працює центральна гранична теорема.  68% значень лежать в межах 1 стандартного відхилення, 95% у межах 2 стандартних відхилень, 99.75% у межах 3 стандартних відхилень від середнього значення. 
Якщо маємо n незалежних випробувань, в кожному з яких можливо 2 результати (як варіант "успіх" та "невдача"), ймовірність настання "успіху" p, результат попереднього випробування не впливає на наступне,  має місце біноміальний розподіл
Приклад застосування.
Боїнг 747 має 380 місць. Ймовірність приходу пасажира, який придбав квиток - 90%. На цей літак можна продавати 400 квитків. 
Обґрунтування: маємо біноміальний розподіл, N = 400, p = 0.9. Середнє значення nP = 360, стандартне відхилення sqrt(n*p*(1-p)) = sqrt(400*0.9*0.1) = 6. Потрійне середнє відхилення 18. Маємо, що з ймовірністю 99.75%  число пасажирів, які прийшли на посадку не перевищуватиме 378. 
З граничної теореми та властивостей стандартного відхилення бере свій початок методологія управління якістю "Шість сигма".

Агрегація правил - "Гра життя".

"Гра життя" відбувається на площині. Клітина може бути "живою" або "мертвою". Якщо клітина "мертва", вона оживає, якщо "живі" три сусідні. "Жива" клітина залишається "живою",  якщо "живі" дві або три сусідні. Незважаючи на надзвичайну простоту правила воно породжує значну різноманітність результатів. Спробувати моделювати можна з допомогою Netlogo.  Переглянути готові варіанти тут :)
"Гра життя" - один із варіантів клітинного автомату.

Агрегація сімейств правил - "Клітинний автомат". Дає розуміння результатів.

Клітинний автомат запропонований Джоном фон Нейманом. Детальніше можна прочитати в роботі Stephen Wolfram "A new kind of science" (тут можна читати онлайн у вільному доступі).
Одновимірний клітинний автомат.  Ряд клітинок, кожна з яких може бути в стані "off" або "on". Кожна клітинка має двох сусідів.

 Вниз можемо відкладати зміну в наступний період часу.
Всіх комбінацій з клітинок у стані "вимкнена" або "ввімкнена"є 8.


Для кожної з клітинок можемо задати правило, за якою вона перетворюється в наступний період часу, залежно від того, якими є її сусіди.

  Так як клітинки в правому стовпці можуть мати стан "ввімкнуто" або "вимкнуто" таких правил є 256. Якщо клітинки в цьому стовпці пронумерувати від 0 до 7, то кожне правило матиме свій унікальний номер від 0 до 255, який буде сумою двійки в степені номера кожної увімкненої клітинки. У нас зображено правило 241 (1+16+32+64+128). Поекспериментувати та переглянути результати виконання деяких правил можна в netlogo. Застосування правил дає чотири класи поведінки: пустота, періодичність, випадковість та комплексність:

Чому так відбувається? Складні речі, які ми бачимо навколо можуть бути результатом простих бінарних взаємодій. Відомий фізик John Wheeler сказав: "It from bit", тобто будь-яке явище чи подія може бути представлене у сукупності відповідей "Так"/"Ні".
Christopher Langton, який досліджував одновимірні клітинні автомати ввів "лямбду Ленгтона". Лямбда - кількість клітинок у стані "ввімкнено". У нашому випадку це 5, або ж 5/8. Тобто це відсоток правил, які "ввімкнені". Якщо лямбда становить 0/8 або 8/8 - всі клітинки в наступні періоди часу будуть "вимкнуті" або "ввімкнуті" відповідно. В таблиці наведено кількість різних правил, які формують різні значення лямбда та кількість результатів класу ІІІ - випадковість та класу IV - комплексність.
Бачимо, що складні результати (комплексність та випадковість) дають ті правила, де кількість "ввімкнених"/"вимкнених" клітинок майже рівна.
Як приклад, Пейдж наводить комплексність при біржових торгах, така ситуація трапляється тому, що кожен учасник продає чи купує залежно  від дій інших учасників ринку.


Агрегація вподобань.

Вподобання - інші струкутри ніж числа та правила.Наприклад, яблука вам можуть подобатись більше, ніж банани. Зображати вподобання можна таким чином: a>b, b>c (a подобається більше, ніж b, b подобається більше, ніж с). Всі вподобання можна впорядкувати за рейтингом. Якщо вибір раціональний, то працюють транзитивні відношення - якщо a>b і b>c, то a>c. Кожні три предмети можна розмістити за рейтингом шістьма різними способами (перший можна визначити трьома способами, другий - двома, третій - одним).
Агрегація вподобань цікава з точки зору соціології та політології.
Припустимо, що є група людей. І є група кандидатів a, b та с, за яких голосують. Кожен виборець обирає раціонально.  Яким буде результат виборів? Якщо вподобання кожного однакові (a>b>c) - просто, інший спосіб (у випадку a>b>c, a>c>b, a>b>c) - кожен кандидат здобуває голос, можна ранжувати по кількості голосів.
Але у ситуації, де a>b>c, b>c>a, c>a>b отримаємо c>a>b>c.  Кожна дія раціональна, результат - ірраціональний. Цей випадок відомий як Парадокс Кондорсе, де результат виборів може залежати від порядку голосування, що дає можливість маніпулювати вибором більшості.

Наступна лекція: Моделі прийняття рішень (Decision Models).

Попередня: Моделі розподілу (Segregation and Peer effects).


Немає коментарів:

Дописати коментар