През 50-те години теорията на игрите е дисциплина, към която проявяват интерес не само математици и икономисти, но и военните. Основите на теорията на игрите са положени в издадената през 1944 г. в Принстън монография "Теория на игрите и икономическото поведение" на американските математици Джон фон Нойман и Оскар Маргенщерн (първият има унгарски произход, а вторият - австрийски). И двамата са работили в Принстънския университтет. Затова е разбираемо и увлечението на Наш още от студентските му години. Теорията на игрите е математическа дисциплина, която изучава математическите модели за вземане на оптимални решения в условията на конфликти. Наличието на конфликти означава, че имаме множество М1 от участници, наречени коалиции на действието, множество М2 от техни стратегии, множество М3 от ситуации, множество М4 от коалиции на интересите и множество М5 от отношения. Системата { М1 , М2 , М3 , М4 , М5 } се нарича игра, а елементите на М1 и М4 - играчи. В теорията на игрите се изяснява понятието решение и съществуването на оптимално решение.
Дисертацията на Наш - "Некооперативни игри" не е голяма по обем - всичко 27 машинописни страници. Но тя съдържа няколко важни постижения, две от които са:
Дисертацията на Наш - "Некооперативни игри" не е голяма по обем - всичко 27 машинописни страници. Но тя съдържа няколко важни постижения, две от които са:
1. Въвеждане на понятието некооперативии игри. В теорията на игрите преди Наш такова понятие няма - играчите могат да извършват принудителни съглашения, изцяло да се обвързват с определени стратегии. Това липсва при некооперативните игри.
2. Въвеждане на понятието равновесна точка или равновесие, наричано днес равновесие на Наш. Нека в играта всеки играч има множество от стратегии и множество от съответни функции на възнагражденията. Стратегиите са в равновесие (играта има равновесна точка на Наш), когато стратегиите на кой да е играч максимизират неговата платежна функция, ако стратегиите на останалите играчи са фиксирани. Наш извежда редица свойства на равновесието и доказва, че всяка игра с краен брой играчи и непрекъсната платежна функция, притежава поне една равновесна точка. За да стане по-ясно ще приведем съдържанието на една от работите на Наш: "Проста игра на покер с три лица", съвместна с друг математик, публикувана в Годишника на Принстънския университет по математика 1950 г. Разглежда се постановка, при която на всеки играч се раздава по една карта от колода, съдържаща карти от два вида - високи и ниски, и всичките 8 случая са равно възможни. Предварително е направен облог а и е фиксиран размерът b на залаганията. При допълнителни ограничения авторите доказват, че при а game theory. За разлика от физиката и химията ,които имат ясно разграничени области за проучване ,теорията на игрите е добре приложима на много места. От всекидневните социални взаимоотношения и спорта до бизнеса и икономиката,политиката ,правото, дипломацията и войната.Някои биолози дори намират връзка между теорията на игрите и теорията за еволюцията на Дарвин в борбата за оцеляване. Теорията на игрите започва с работата на Джон фон Нойман през 20-те години и кулминира в съвместната му книга с Оскар Маргенщерн издадена през 1944г. Те обаче изучават тъй наречените “игри, чиято сума е нула”, където участват само двама играчи с напълно противоположни интереси(например спортни игри или игри подобни на шах).Този вид игри е важен за икономиката, особено ,ако двама души се опитват доброволно да сключат сделка. Наш обаче се занимава с по нормалния и вероятен случай т.е. когато имаме смесица от интереси и различен брой играчи.
“Равновесието на Наш” в една от горе описаните игри се достига, когато действията на един играч пораждат реакцията на всички други играчи, а техните реакции пък водят отново до неговите встъпителни действия.
Теорията на игрите може грубо да се раздели на две области: “не-кооперативни” (или стратегически) игри и “кооперативни” (или коалиционни) игри (,които впрочем ще разгледаме накрая с примера за затворниците).
В Теорията на игрите , Равновесието на Наш е един вид оптимална стратегия за игра, включваща двама или повече играчи, чрез изходът на която(игра) играчите постигат взаимна полза. Ако за една игра има определена серия/група от стратегии и печалба, която никой играч не може да спечели, ако си промени собствената стратегия ,а другите играчи не си променят своите стратегии, тогава дадената серия/група от стратегии и съответната печалба образуват/съставят равновесието на Наш.Една игра може да има (или да достига) много или нито едно равновесие на Наш. Наш доказва това->Ако в игра позволим смесени стратегии (играчите си избират произволно стратегии в съответствие с определените вероятности), тогава всяка игра с n на брой играчи, в която всеки играч може да избира от много ,но ограничен брой стратегии, достига поне едно равновесие на Наш(на смесени стратегии). Ако игра има уникално равновесие на Наш и е изиграна между напълно рационални и разумни играчи ,то играчите ще подберат (несъзнателно) такива стратегии , че да се достигне това равновесие. Общо взето Джон Наш открива начин ,по който може да се предвиди изходът на почти всеки вид стратегическо взаимодействие.
Равновесието на Наш е хубава теория, но дали работи в действителност? И да, и не.Предпоставката за “напълно рационални” играчи е не винаги изпълнена,а и много пъти има липсваща информация. В други случаи пък просто ситуацията е твърде сложна за анализиране.
Нека да дообясним с примери.
(Важно е да се отбележи и фактът ,че при неочаквано вдигане на залозите ,при играчите настъпва голяма промяна в поведението.)
Пр.1: Мария и Ана трябва да си изберат сума между 180 и 300 стотинки. И на двете ще бъде платена по-малката избрана сума(т.е. и двете ще получат стотинки). Едната от двете, която е избрала по-голямата сума, отделно пък ще трябва да плати наказание в размер на Х стотинки на другата. При равенство в избраните суми няма наказание! Така, ако Мария избере 280 ,а Ана избере 300, печалбата на Мария е 280+Х стотинки, а печалбата на Ана е 280-Х стотинки.(Ако Х>280, то Ана няма да получи нищо, а само ще плати.) Ако Ана мисли ,че Мария ще каже 280, тогава Ана ще иска да обяви 279. Но ,ако Мария мисли ,че Ана ще обяви 279, тогава Мария ще иска да каже 278.И т.н. Единствената съвместима двойка от мисли(,така да се каже,) е ,когато и двете вярват, че другата ще каже 180.
Опитите с хора са забележителни. Ако Х=180(или дори по-голямо число), почти 80% от хората избират числото/сумата 180, което пък е предвидено от Наш. Ако Х=5, тогава пък почти 80% избират числото 300.
(Опитите с хора са довели до създаването на поведенческа теория на игрите. В нея се работи с реални хора, а не с онези митични “напълно разумни/рационални” хора ;)
Пр.2: (по-известен като “Затворническата дилема”)
· За двама бъдещи-затворници се знае ,че са виновни.Но полицията няма достатъчно доказателства ,за да осъди и двамата без самопризнание.
· Полицията ги разделя двамата в различни стаи, без каквато и да била връзка помежду им. И двамата трябва да решат какво да правят едновременно .
· Между затворниците няма никакво (или поне дълго) приятелство, никакво доверие и никакви предварителни уговорки.
· Как да се сдобият полицаите със самопризнанията на двамата?(това е въпросът)
· Следните възможности са предоставени на затворниците да избират(поотделно разбира се) -> Ако и двамата се признаят за виновни , то и двамата получават присъди от по 5 години затвор. Ако единият се признае за виновен,а другия –не;тогава този,който си е признал излиза свободен, а другият,който си е замълчал остава в затвора за 20 години. Ако обаче и двамата не си признаят и си замълчат, то тогава и двамата получават само по 1 година затвор.
· Анализът на това, какво може да се случи, ако двамата затворници се държат “рационално”, следвайки своите лични интереси, е прост пример на Теорията на игрите (Game Theory).
През 1994г. Джон Ф. Наш, Джон К. Харсанай и Реинхард Селтън получават заедно нобеловата награда за икономика за техните постижения в теорията на игрите. Теорията на игрите, както отбелязва кралската академия на науките в Швеция, “произхожда от изучаването на игри като покера и шаха”, в които “играчите трябва да мислят стъпки напред и да развиват стратегия, основаваща се на очакванията от контра-действията на другите играчи. Подобни стратегически взаимоотношения се наблюдават и в много икономически ситуации, затова теорията на игрите показва ,че е полезна и в икономическия анализ.”
“Равновесието на Наш” в една от горе описаните игри се достига, когато действията на един играч пораждат реакцията на всички други играчи, а техните реакции пък водят отново до неговите встъпителни действия.
Теорията на игрите може грубо да се раздели на две области: “не-кооперативни” (или стратегически) игри и “кооперативни” (или коалиционни) игри (,които впрочем ще разгледаме накрая с примера за затворниците).
В Теорията на игрите , Равновесието на Наш е един вид оптимална стратегия за игра, включваща двама или повече играчи, чрез изходът на която(игра) играчите постигат взаимна полза. Ако за една игра има определена серия/група от стратегии и печалба, която никой играч не може да спечели, ако си промени собствената стратегия ,а другите играчи не си променят своите стратегии, тогава дадената серия/група от стратегии и съответната печалба образуват/съставят равновесието на Наш.Една игра може да има (или да достига) много или нито едно равновесие на Наш. Наш доказва това->Ако в игра позволим смесени стратегии (играчите си избират произволно стратегии в съответствие с определените вероятности), тогава всяка игра с n на брой играчи, в която всеки играч може да избира от много ,но ограничен брой стратегии, достига поне едно равновесие на Наш(на смесени стратегии). Ако игра има уникално равновесие на Наш и е изиграна между напълно рационални и разумни играчи ,то играчите ще подберат (несъзнателно) такива стратегии , че да се достигне това равновесие. Общо взето Джон Наш открива начин ,по който може да се предвиди изходът на почти всеки вид стратегическо взаимодействие.
Равновесието на Наш е хубава теория, но дали работи в действителност? И да, и не.Предпоставката за “напълно рационални” играчи е не винаги изпълнена,а и много пъти има липсваща информация. В други случаи пък просто ситуацията е твърде сложна за анализиране.
Нека да дообясним с примери.
(Важно е да се отбележи и фактът ,че при неочаквано вдигане на залозите ,при играчите настъпва голяма промяна в поведението.)
Пр.1: Мария и Ана трябва да си изберат сума между 180 и 300 стотинки. И на двете ще бъде платена по-малката избрана сума(т.е. и двете ще получат стотинки). Едната от двете, която е избрала по-голямата сума, отделно пък ще трябва да плати наказание в размер на Х стотинки на другата. При равенство в избраните суми няма наказание! Така, ако Мария избере 280 ,а Ана избере 300, печалбата на Мария е 280+Х стотинки, а печалбата на Ана е 280-Х стотинки.(Ако Х>280, то Ана няма да получи нищо, а само ще плати.) Ако Ана мисли ,че Мария ще каже 280, тогава Ана ще иска да обяви 279. Но ,ако Мария мисли ,че Ана ще обяви 279, тогава Мария ще иска да каже 278.И т.н. Единствената съвместима двойка от мисли(,така да се каже,) е ,когато и двете вярват, че другата ще каже 180.
Опитите с хора са забележителни. Ако Х=180(или дори по-голямо число), почти 80% от хората избират числото/сумата 180, което пък е предвидено от Наш. Ако Х=5, тогава пък почти 80% избират числото 300.
(Опитите с хора са довели до създаването на поведенческа теория на игрите. В нея се работи с реални хора, а не с онези митични “напълно разумни/рационални” хора ;)
Пр.2: (по-известен като “Затворническата дилема”)
· За двама бъдещи-затворници се знае ,че са виновни.Но полицията няма достатъчно доказателства ,за да осъди и двамата без самопризнание.
· Полицията ги разделя двамата в различни стаи, без каквато и да била връзка помежду им. И двамата трябва да решат какво да правят едновременно .
· Между затворниците няма никакво (или поне дълго) приятелство, никакво доверие и никакви предварителни уговорки.
· Как да се сдобият полицаите със самопризнанията на двамата?(това е въпросът)
· Следните възможности са предоставени на затворниците да избират(поотделно разбира се) -> Ако и двамата се признаят за виновни , то и двамата получават присъди от по 5 години затвор. Ако единият се признае за виновен,а другия –не;тогава този,който си е признал излиза свободен, а другият,който си е замълчал остава в затвора за 20 години. Ако обаче и двамата не си признаят и си замълчат, то тогава и двамата получават само по 1 година затвор.
· Анализът на това, какво може да се случи, ако двамата затворници се държат “рационално”, следвайки своите лични интереси, е прост пример на Теорията на игрите (Game Theory).
През 1994г. Джон Ф. Наш, Джон К. Харсанай и Реинхард Селтън получават заедно нобеловата награда за икономика за техните постижения в теорията на игрите. Теорията на игрите, както отбелязва кралската академия на науките в Швеция, “произхожда от изучаването на игри като покера и шаха”, в които “играчите трябва да мислят стъпки напред и да развиват стратегия, основаваща се на очакванията от контра-действията на другите играчи. Подобни стратегически взаимоотношения се наблюдават и в много икономически ситуации, затова теорията на игрите показва ,че е полезна и в икономическия анализ.”
Коментари