Теорія ігор — це наука, яка розташована на перетині математики, економіки, досліджень поведінки людей, комп'ютерних наук та навіть біології. Що ж об'єднує всі ці різнорідні галузі? Спільним в них є наявність осіб-агентів (людей, компаній, програм), які ухвалюють рішення і намагаються отримати кращий для себе результат. Принциповим моментом, який, власне, формує гру є взаємозв'язаність учасників, коли дії одних гравців впливають на виграші інших. Ці взаємодії відбуваються навколо нас щодня і ми, свідомо чи несвідомо, беремо в них участь.
Спільне знання — це одна з ключових концепцій теорії ігор. Ідея спільного знання полягає у тому, що всі учасники знають певний факт, але також вони знають, що інші знають цей факт, і також — що інші знають, що всі знають цей факт. І так до нескінченності. Виглядає дещо штучно? Але в певній кількості рівнів знання є цілком практичний сенс. Розглянемо такий відомий приклад. Офіціант невдало оступився і пролив підливу на білу сукню дами, яка, звісно, обурено на нього подивилась. У відповідь офіціант сказав «вибачте, це моя провина». Звісно, офіціант знав, що це його провина. Також і дама знала, що це його провина. Але офіціант хотів, щоб дама знала, що він знає (і усвідомлює), що це його провина. Таким чином він навіть задекларував перехід на наступний рівень знання — тепер він знає, що вона знає, що це його провина і що він знає, що вона знає, що це його провина. Звісно, що потім стало з офіціантом ми не знаємо.
Ще одним прикладом спільного знання є наступна ситуація. Професор затримався і розіслав кожному студенті е-мейл з повідомленням, що він запізнюється на лекцію. Студенти зібрались перед аудиторієї. Кожен з них знає інформацію, що професор запізнюється, але це не спільне знання. Аж тут один з студентів виголошує: «Професор затримується». Тепер всі знають цю інформацію, і всі знають, що всі знають.
Спільне знання, як і раціональність, дозволяють будувати змістовну теорію, хоча, звісно, на практиці люди не відслідковують рівні знань в своїх розмовах. Спільне знання дозволяє іноді отримувати інформацію, яку гравці не знали. Відомий приклад, який наводить Р. Ауман в одній зі своїх публікацій має умовну назву «зрадливі дружини». Уявімо селище, де живуть 10 чоловіків з дружинами. У чоловіків є певний ритуал, вони збираються ввечері біля вогнища і, якщо вважають свою дружину вірною, то вихваляються, а якщо ні — то плачуть. Кожен чоловік вважає свою дружину вірною. Але правда в тому, що кожна дружина насправі зрадлива, і інші (крім її чоловіка) це знають. Хоча всі чоловіки знають про дружин інших, кожен з них вважає свою дружину вірною, тому вони збираються ввечері і вихваляються. Це стабільна ситуація, оскільки в них не принято говорити між собою про таке. Одного разу в селище приходить подорожній, він спостерігає за ситуацією і одного вечора виголошує біля вогнища: «Тут є принаймі одна зрадлива дружина». Далі 9 вечорів всі чоловіки збираються і вихваляються, а на 10 вечір всі плачуть. Чому, адже подорожній не повідомив їм нічого нового? Кожен і так знав, що тут є 9 зрадливих дружин і чому вони чекали 9 вечорів?
Щоб зрозуміти цей пазл потрібно спочатку уявити, що в нас є двоє чоловіків. Кожен знає, що дружина іншого зрадлива, але ось подорожній виголошує інформацію для всіх. Тепер кожен з них думає: ага, якщо інший не плаче, то він вважає, що його дружина — вірна. Але ми тепер знаємо, що принаймі одна — зрадлива. Я то знаю, що моя — вірна а його зрадлива, але він, очевидно, думає так само. Тобто він знає, що його дружина вірна, а моя — зрадлива. Тому на другий вечір вони обоє будуть плакати. Аналогічні міркування вірні і для будь-якої кількості, зокрема для 10. Саме наявність спільного знання (інформації виголошеної для всіх) дала їм можливість дізнатись таку правду про стан речей.
Спільне знання це не тільки розуміння що розуміють інші. Це також спосіб розв'язання життєвих ситуацій. Наприклад, якщо ви загубились в супермаркеті (уявімо час до мобільних телефонів, або, більш реалістично, розряжений телефон), то як знайтись? Один з загальних рецептів — повернутись туди, де ви були разом останній раз. Можливо також чекати біля «особливої точки», місця, яке однозначно відрізняється від інших. Т.Шелінг назвав такі точки координаційними. Ось приклад з його книги Стратегія конфлікту.
Ви з другом розминулись і не знаєте де зустрітись. У вас і у нього є карта місцевості. Куди б ви пішли?
Спільне знання (і раціональність) дозволяє вирішувати різні переговорні ситуації. Переговори, як вважає Шелінг, це адекватна модель навіть для нашої війни. Шелінг використовував переговори для розуміння процесів навколо холодної війни і ядерного стримування. Основний його аргумент полягає в тому, що практично будь-яка війна не є грою з нульовою сумою. Переговори, обміни полоненими, стратегічні ходи, торгівля — все це є надбудовою над безпосередно військовими діями. Власне те, що війна це продовження політики іншими засобами було сказано давно. Зараз я хочу розказати про деякі моделі переговорів, відомі в теорії ігор, які, можливо, є корисними для розуміння поточної ситуації. Отже, уявімо двох гравців, які намагаються поділити певний ресурс ($100 для спрощення), і для досягнення угоди потрібна згода кожного гравця. Припустимо спочатку, що перший гравець робить пропозицію як поділити, а інший має погодитись або ні. Якщо другий гравець не погоджується, то вся сума втрачається. Ця гра відома під назвою Ультиматум і вона має досить незвичні властивості. Справа в тому, що якщо гравці раціональні і бажають отримати якомога більше, то рівноважна стратегія відома — перший гравець пропонує розподіл $99 собі і $1 іншому. Другий гравець опиняється перед вибором — отримати 0 або 1. Один долар все же краще ніж нічого, тому раціональний гравець має погодитись? Чи ні?
Експерименти показують, що люди починають частіше відмовлятися якщо їм пропонують менше 30% від суми. Одне з перших серйозних досліджень (1991 року) було проведене в Америці, Словенії, Японії та Ізраїлі. Результати Америки і Словенії були досить близькими — учасники пропонували близькі до половини розподіли; пропозиції, які були менше 20%, були відхилені. У Японії пропонували менші десь на 10% суми, в Ізраїлі — ще менші. Важливо, що відсоток відмов скрізь був приблизно однаковим, тобто зменшення суми пропозиції в останніх двох країнах не було спричинено жадібністю чи агресією, а просто відображало прийняту у суспільстві норму для такого роду угод.
Однак усі ці країни все таки досить схожі, тому дослідники пішли далі.
У 2000 році дослідили плем'я мачугенга у Перу ( https://en.wikipedia.org/wiki/Machiguenga ). І тут результати сильно відрізнялись: середня пропозиція була 26%! І всі пропозиції, крім однієї, були прийняті. Таким чином, були знайдені люди, які вели себе найбільш узгоджено з результатами теорії ігор, і це виявилося просте фермерське плем'я. З огляду на те, що теорія ігор створювалася як спроба пояснити світову економіку і поведінку людей — дуже смішний результат.
Після цього експериментатори почали вишукувати віддалені народності і знущатися з них, змушуючи грати в ультиматум (цікаво, що собі думали ці мешканці, коли до них приходили дивні бородані в окулярах та пропонували поділити гроші).
Експерименти були проведені в селі китобоїв Ламалера, в Монголії, серед народів Папуа Нової Гвінеї, в Африці і Південній Америці (повний перелік можна знайти в книзі Камерера). В основному, пропозиції розподілу були менше, ніж у країнах першого експерименту, відсоток відмов теж.
Виділялися дві культури: мисливці за головами Аче з Парагваю та китобої з Ламалери. По-перше, вони в середньому пропонували більше половини! А Ламалера ще і відхиляли ці щедрі пропозиції у 20% випадків (частіше, ніж маленькі пропозиції)! Зовсім несподіваний результат — навіщо пропонувати більше половини?
Одне з можливих пояснень наступне: в їх культурі полювання є ключовою частиною життя і пропонування іншому більшої частини «здобичі» накладає на нього зобов'язання перед тим, хто пропонує. Пропонування більшої частини, таким чином, є образою і певним способом показати, хто краще.
Але повернемось до Ультиматуму. Очевидно, що перший гравець має значну перевагу — це пов'язано з несиметричністю гри. Що як зробити її двораундовою? Якщо другий гравець не погоджується, то він пропонує свій розподіл натомість і тепер перший має погодитись або відмовитись. В разі його відмови гроші «згорають». Тепер другому гравцю немає сенсу погоджуватись, адже в наступному раунді він буде головним. Тому він може відхиляти всі пропозиції, які дають йому менше $99. Можливість зробити останню пропозицію є визначальним у багатораундовому Ультиматумі.
Результати експериментів гри Ультиматум викликали справедливі нарікання. Справедливості заради — це далеко не єдина стратегічна ситуація де поведінка людей і теоретичні конструкції настільки розходяться. Але ж і ситуація видумана — люди ділять якісь гроші, один раунд або декілька раундів (в рамках моделі насправді це все одно що один раунд, оскільки той, хто робить останню пропозицію має суперздатність забрати майже все). І тоді було запропонована ідея дисконтування. В реальності ми розуміємо, що з часом гроші втрачають цінність. 1000 грн зараз і 1000 грн через рік це не одне й те саме. Очевидно, що через рік ці гроші матимуть меншу цінність, до того ж має місце втрачена вигода — ми могли б зараз покласти ці гроші на депозит, або вкласти у бізнес і отримати додаткову вигоду. Тому ми маємо зменшувати майбутні виграші. Є різні способи як це зробити — найпростіший, це кожен раунд множити на певне число дельта, яке має бути більше за нуль і менше одиниці. Тепер, якщо у нас є переговори за схемою пропозиція — згода або ні — контрпропозиція і т.д., але загальний «пиріг» при цьому зменшується з кожним кроком. Що це змінить? Писати формули тут не вийде, тому давайте розглянемо класичний приклад з двома дітками, які мають поділити 10 печивок. За умовами кожен по черзі робить пропозицію і якщо вона не приймається, то 2 печивка забирає мама (вона робить це, щоб навчити їх домовлятись). Інтуїтивно рішення зрозуміле, але давайте доведемо. Припустимо лишився останній раунд і усього два печивка. Той, хто пропонує має вибрати з трьох (теоретично можливих) пропозицій: (0, 2) (1, 1) (2, 0). Знов таки для визначеності будемо вважати, що діти капосні і у випадку, коли він отримує однакову кількості вибере той варіант, при якому у іншого печивка зникають. Тоді пропонувати іношому треба те, що більше за 0. Інший гравець (його виграші на другом місці припустимо) в цьому випадку прийме пропозиції (0,2) і (1,1) і відхилить (2,0). В останньому випадку обоє отримають 0. Тому першому гравцю є сенс пропонувати (1,1) і обоє отримують по печивку. Повернемось на раунд раніше, коли в нас є 4 печивка. Тепер другий гравець пропонує розподіл, і, якщо він пропонує менше 2, то перший гравець відхилить пропозицію, бо це те саме, що він отримає на наступному кроці. З іншого боку, пропонувати більше за 2 теж нераціонально, адже на 2 інший гравеуь має погодитись. Тому для 4 печивок розподіл (2,2) і обоє погоджуються. Аналогічно для 6, 8 і 10 розподіл — поділити навпіл. Таким чином виникає цікава ситуація — наявність дисконтування спонукає гравців (розрахувавши ситуацію наперед) погоджуватись на першому раунді на справедливий рівний розподіл. Це вже досить реалістично. Для нескінченної процедури з дисконтом дельта рішенням є поділити навпіл (це називається переговорне рішення Рубінштейна). А якщо у учасників різні дельти, тоді поділ має бути пропорційним до цих значень. Різні дельти можливі, якщо гравці мають, наприклад, різну «вартість» грошей. Для одного виграш тут і зараз не надто принциповий, оскільки в нього є запас, а от для іншого угоди треба досягти саме зараз (у нього дельта близьке до нуля). В цьому випадку другий має отримати менше. Це таке теоретичне ілюстрування прислів'я «Поки товстий схудне, то худий здохне».
Висновок, який мені здається цікавим — для досягнення угоди важливо врахувати дисконтування мабутніх виграшів. Якщо гравці адекватно оцінюють свої дельти, то їх переговорна позиція має бути пропорційна зменшенню виграшів на наступних періодах. Звісно, якщо один з гравців вважає, що його дельта дорівнює одиниці, а насправді виграші швидко тануть, то його здатність до переговорів дуже сумнівна.
Як ми тепер розуміємо маючи такі переважаючі сили на 24 число можна було отримати досить вигідну угоду не перевіряючи дельти на практиці (власне всі оцінювали нашу дельту як близьку до 0, а їх дельту як близьку до одиниці). Але з часом стало зрозуміло, що оцінки не зовсім вірні, плюс почалась системна робота над збільшенням нашої дельти і зменшенням дельти росіян. Але вірно також, що якщо гравці невірно оцінюють характеристики гри (“не перебувають в реальності"), то досягти угоди відповідно до рішення Рубінштейна на жаль неможливо. Тому працюємо над дельтами.
Тут хочу порекомендувати глянути на сцену з чудового фільму Гравець (Gambler), який є гарною ілюстрацією переговорів. Там дуже багато стратегічних ситуацій: блефу, погроз, обіцянок, комітментів і іншого. Підозрюю, що сценаристів хтось консультував з моделей переговорів. Конкретно в цій сцені герой намагається продати годинник. Але при цьому він всіма силами сігналізує про те, що його дельта дуже низька — він нервує, ставить ультиматуми, вимагає здійснення угоди тут і зараз. Відповідно покупець, хоча і бажає угоди (вона йому вигідна) не може не спробувати отримати краще. Ну бо він мислить в рамках однієї моделі, а покупець — іншої. Так вони і не змогли досягти порозуміння. Але сцена чудово зіграна, ну і взагалі фільм класний.
Однак іноді дисконтувати майбутні виграші неможливо. Це характерно для ситуацій, де на кону життя. Інший можливий варіант — нескінченні переговори без дисконту. Хоча такі стратегічні ситуації виглядають дивними, вони, або схожі конструкції можуть зустрітись в житті. Зараз я хочу показати вам два епізоди з двох чудових фільмів (NB будуть спойлери), які використовують стратегічні моделі. І їх дуже цікаво порівнювати, спробуйте їх спочатку переглянути (посилання в коментах, даю оригінальний варіант, без перекладу).
Ситуація з фільму Принцеса-наречена наступна: пірат Робертс (який насправді головний хороший герой) намагається врятувати принцесу, яку викрали троє негідників. Двох з них — іспанця і велетня він вже переміг, тепер черга їх лідера — хитрого сицілійця. Сицилієць не може битись, тому він погрожує вбити принцесу. Але Робертс пропонує йому змагання у хитрощах. Він кладе отруту в один з бокалів, ставить їх, один перед собою, інший перед опонентом і пропонує сицилійцю вибрати один з бокалів, обіцяючи випити з іншого. Сицилієць каже, що це дуже просто — він має зрозуміти, що за тип перед ним: той, хто покладе отруту в свій бокал, чи той, хто покладе отруту в бокал іншого. І це в точності ситуація з рівнями знань. Перший рівень — інстинктивно людина не буде пити з бокала, який йому пропонує ворог, тому отрута має бути в бокалі, який пірат лишив собі. Тому сицилієць має вибрати бокал перед собою. Але, якщо пірат знає, що сицилієць це знає, то він покладе отруту в бокал, який він дав. Тому сицилієць має вибрати бокал, який перед ним. Але якщо пірат … і так до нескінченності. Як ви бачите проблема не має розв'язку — на кожен рівень знання існує більш глибокий. Коли сицилієць розуміє, що рішення тут немає, він вдається до надзвичайно цікавого трюка. Гляньте відео і подумайте — а чому він був таким задоволеним?
.
.
.
Розгадка така: він підмінив бокали і тепер він вибрав один з них. Він знає, що бокали поміняні, але пірат же цього не знає! Тобто пірат думає, що він п'є з бокалу, який насправді в руках сицилійця. Тому він уважно дивився на рекцію пірата — адже він не буде пити отруту абсолютно спокійно — в цьому нема ніякого сенсу. І оскільки пірат пив спокійно, то він теє спокійно випив свій бокал.
Але реальність виявилась набагато жорстокіше — в обох бокалах була отрута, а пірат мав імунітет, сюрприз :)))
Через майже 40 років після написання цього роману аналогічний сюжет був використаний в серіалі Шерлок (з Бенедиктом Камбербетчем). В першій серії Шерлок зустрічається з водієм маньяком, який вбиває пасажирів, пропонуючи їм гру — вибрати одну з двох пігулок. Одна з пігулок з отрутою, інша — ні. Водій приймає ту, яка лишиться. Як бачите — все те саме, лишень тепер гру пропонує поганець.
Шерлок потрапляє в ту ж пастку, що і сицілієць (очевидно він не читав роману Princess Bride 1973 року), він не може визнати, що раціонального рішення немає і обирає одну з пігулок. Далі його рятує доктор Ватсон, але штука в тому, що, швидше за все, обидві пігулки були отруєні. Це могло бути рішенням водія, який просто вмів чудово дурити інших (і діставати в потрібний момент пігулки з складок светру), або він дійсно міг розгадувати більш простих людей, просто Моріарті, який спрямовував це все, підмінив для останньої гри пігулки — ну щоб гарантовано прибрати Холмса.
P.S. Готуючи цей матеріал мені не давала спокою одна схожість, яку я бачив у ворожій пропаганді. Це не зовсім теорія ігор, але має відношення до процесу нескінченного розмірковування. Тобто до ситуації, коли ми начебто намагаємось запустити процес вирішення, а насправді — лише піднімаємось у нескінченному колодязі. Якщо ми можемо трактувати певну подію так чи інакше, то можливо запустити такий процес. Наприклад, візьмемо нещодавне звільнення Ізюму і обвалення фронту.
Перший рівень — ЗСУ потужно вдарили, росіяни розвалились і змушені були тікати.
Другий рівень — це був хитрий план і росіяни насправді відійшли, пожертвувавши непотрібною технікою і тепер їм легше оборонятись.
Третій рівень — це був хитрий план, але не росіян а американців + агенти в керівництві. План був поступово розміняти Харківську область на Південь. Просто українці надто швидко пішли вперед, а росіяни запанікували. Але побачите — тепер Південь так і лишиться окупованим.
Четвертий рівень — Просто путін шукає способи для мобілізації і підняття моралі і вважає, що невелика поразка буде каталізатором змін. Тому він наказав розробити і здійснити план з попереднього рівня.
П'ятий рівень — Думку для четвертого рівня в голову путіна вклали (радники, рептилоїди, всесвітній уряд) для того, щоб він думав, що він зараз підніме мораль і свої шанси, а насправді просто імітація бурхливої діяльності перед розвалом.
Варіанти першого-третього рівня читав в пабліках. Решту вже придумав. Завдання — придумати 5–6 рівнів для кримського мосту :)
Яка причина виникнення таких міркувань? Це ж досить типова штука — конспірологія, розмивання сприйняття реальності. Це основа російської пропаганди — інформаційні канали забиваються псевдоаналітикою, пошук фактів підміняється "загальними принципами" та емоційними маніпуляціями. Перекручення і жонглювання інформацією розмиває границі правда-неправда і формує апатію і загальне відчуття — вони там розумні наверху, хай вони і вирішують.