مدل های تئوری بازی ها از جمله مدل های تجربی هستند. نظریه بازی ها در اقتصاد و سایر حوزه های فعالیت انسانی

با اینکه از دانشکده فیزیک و فناوری فارغ التحصیل شدم، اما در دانشگاه برایم تئوری بازی نخواندند. اما از آنجایی که در دوران دانشجویی زیاد بازی می‌کردم، ابتدا ترجیحاً و سپس بریج، به تئوری بازی‌ها علاقه داشتم و به یک کتاب درسی کوچک تسلط داشتم. و اخیراً یکی از خوانندگان سایت میخائیل یک مشکل تئوری بازی را حل کرد. با درک اینکه این وظیفه بلافاصله به من داده نشده است، تصمیم گرفتم دانش خود را از تئوری بازی ها در حافظه خود تجدید کنم. من یک کتاب کوچک را به شما پیشنهاد می کنم - ارائه محبوب عناصر تئوری بازی ها و برخی روش ها برای حل بازی های ماتریسی. این تقریباً هیچ مدرکی ندارد و مفاد اصلی نظریه را با مثال هایی نشان می دهد. این کتاب توسط ریاضیدان و متداول کننده علم النا سرگیونا ونتزل نوشته شده است. چندین نسل از مهندسان شوروی از کتاب درسی او "نظریه احتمال" مطالعه کردند. النا سرگیونا همچنین چندین اثر ادبی با نام مستعار I. Grekova نوشت.

النا ونتزل. عناصر تئوری بازی ها – م.: فیزمتگیز، 1961. – 68 ص.

دانلود چکیده کوتاه با فرمت یا

§ 1. موضوع نظریه بازی. مفاهیم اساسی

هنگام حل تعدادی از مشکلات عملی (در زمینه اقتصاد، امور نظامی و غیره)، باید شرایطی را تجزیه و تحلیل کرد که در آن دو (یا چند) طرف متخاصم در حال تعقیب اهداف متضاد هستند و نتیجه هر اقدام یکی از آنها احزاب بستگی به این دارد که طرف مقابل کدام روش را انتخاب کند. ما چنین موقعیت هایی را "موقعیت های درگیری" می نامیم.

نمونه های متعددی از موقعیت های تعارض در زمینه های مختلف عملی قابل ذکر است. هر وضعیتی که در جریان خصومت‌ها به وجود می‌آید، متعلق به موقعیت‌های درگیری است: هر یک از متخاصمان تمام اقداماتی را که در اختیار دارد برای جلوگیری از موفقیت دشمن انجام می‌دهد. موقعیت‌های درگیری همچنین شامل موقعیت‌هایی است که هنگام انتخاب یک سیستم تسلیحاتی، روش‌های استفاده از آن و به طور کلی هنگام برنامه‌ریزی عملیات نظامی ایجاد می‌شود: هر یک از تصمیم‌گیری‌ها در این زمینه باید بر اساس اقدامات دشمن اتخاذ شود که کمترین سود را برای ما داشته باشد. . تعدادی از موقعیت ها در عرصه اقتصاد (به ویژه در شرایط رقابت آزاد) به موقعیت های تعارض تعلق دارند. شرکت های تجاری، شرکت های صنعتی و غیره به عنوان متخاصم عمل می کنند.

نیاز به تجزیه و تحلیل چنین موقعیت هایی یک دستگاه ریاضی خاص را زنده کرد. نظریه بازی ها اساسا چیزی بیش از یک نظریه ریاضی در مورد موقعیت های تعارض نیست. هدف این تئوری ارائه توصیه هایی در مورد روند منطقی عمل هر یک از مخالفان در جریان یک موقعیت درگیری است. هر موقعیت درگیری که مستقیماً از عمل گرفته شده است بسیار پیچیده است و تجزیه و تحلیل آن با وجود عوامل تصادفی متعدد پیچیده است. برای امکان پذیر ساختن تحلیل ریاضی موقعیت، لازم است از عوامل ثانویه و اتفاقی انتزاع شده و مدلی ساده و رسمی از موقعیت ساخته شود. ما چنین مدلی را "بازی" می نامیم.

این بازی با یک موقعیت درگیری واقعی تفاوت دارد زیرا بر اساس قوانین کاملاً تعریف شده انجام می شود. بشر مدت‌هاست که از چنین مدل‌های رسمی‌شده موقعیت‌های درگیری استفاده می‌کند که در معنای واقعی کلمه بازی هستند. به عنوان مثال می توان به شطرنج، چکرز، بازی با ورق و غیره اشاره کرد. همه این بازی ها در ماهیت یک رقابت هستند که طبق قوانین شناخته شده پیش می روند و با "پیروزی" (برنده شدن) یک یا آن بازیکن به پایان می رسند.

چنین بازی هایی که به طور رسمی تنظیم شده و به طور مصنوعی سازماندهی شده اند، مناسب ترین ماده برای تصویرسازی و تسلط بر مفاهیم اساسی نظریه بازی ها هستند. اصطلاحات وام گرفته شده از تمرین چنین بازی هایی در تجزیه و تحلیل سایر موقعیت های درگیری نیز استفاده می شود: طرف های درگیر در آنها معمولاً به عنوان "بازیکن" نامیده می شوند و نتیجه برخورد "برد" یکی از بازی ها نامیده می شود. مهمانی.

در یک بازی، منافع دو یا چند حریف ممکن است با هم برخورد کند. در مورد اول، بازی "دو" نامیده می شود، در مورد دوم - "چندین". شرکت کنندگان در یک بازی چندگانه می توانند در طول دوره آن ائتلاف هایی تشکیل دهند - دائمی یا موقت. در حضور دو ائتلاف دائمی، بازی چندگانه به یک بازی جفت تبدیل می شود. بازی های زوجی از بیشترین اهمیت عملی برخوردارند. در اینجا ما خود را به در نظر گرفتن چنین بازی هایی محدود می کنیم.

بیایید ارائه نظریه بازی های ابتدایی را با تدوین چند مفهوم اساسی شروع کنیم. ما یک بازی جفتی را در نظر خواهیم گرفت که در آن دو بازیکن A و B با علایق مخالف شرکت می کنند. منظور ما از "بازی" رویدادی متشکل از مجموعه ای از اقدامات طرفین A و B است. برای اینکه یک بازی در معرض تجزیه و تحلیل ریاضی قرار گیرد، قوانین بازی باید دقیقاً تدوین شوند. تحت "قوانین بازی" به معنای سیستمی از شرایط است که گزینه های احتمالی برای اقدامات هر دو طرف را تنظیم می کند، میزان اطلاعاتی که هر طرف در مورد رفتار طرف مقابل دارد، ترتیب تناوب "حرکات" (تصمیمات فردی). ساخته شده در طول بازی)، و همچنین نتیجه یا نتیجه بازی، که منجر به این مجموعه از حرکات می شود. این نتیجه (برد یا باخت) همیشه کمیت نمی شود، اما معمولاً می توان با تنظیم مقیاس اندازه گیری، آن را با یک عدد مشخص بیان کرد. به عنوان مثال، در یک بازی شطرنج، یک برد می تواند به صورت مشروط یک مقدار +1، یک باخت -1، یک تساوی 0 اختصاص داده شود.

اگر یک بازیکن برنده چیزی باشد که دیگری از دست می‌دهد، یک بازی مجموع صفر نامیده می‌شود. مجموع سود هر دو طرف صفر است. در یک بازی با مجموع صفر، منافع بازیکنان دقیقاً مخالف است. در اینجا ما فقط چنین بازی هایی را در نظر خواهیم گرفت.

از آنجایی که در یک بازی با مجموع صفر، سود یکی از بازیکنان برابر است با بازده دیگری با علامت مخالف، بدیهی است که در تحلیل چنین بازی‌ای می‌توان تنها بازده یکی از بازیکنان را در نظر گرفت. به عنوان مثال، بازیکن A باشد. در آینده، برای راحتی، ما به صورت مشروط طرف A را "ما" و طرف B - "رقیب" می نامیم.

در این حالت، طرف A (ما) همیشه به عنوان «برنده» و طرف B («رقیب») به عنوان «بازنده» در نظر گرفته می شود. این شرط رسمی بدیهی است که به معنای هیچ مزیت واقعی برای بازیکن اول نیست. به راحتی می توان فهمید که اگر علامت بازده معکوس شود، با مخالف خود جایگزین می شود.

ما توسعه بازی را در زمان خود به صورت متشکل از یک سری مراحل یا "حرکات" متوالی نشان خواهیم داد. حرکت در نظریه بازی، انتخاب یکی از گزینه های ارائه شده توسط قواعد بازی است. حرکات به دو دسته شخصی و تصادفی تقسیم می شوند. حرکت شخصی، انتخاب آگاهانه یکی از بازیکنان یکی از حرکات ممکن در یک موقعیت خاص و اجرای آن است. نمونه ای از حرکت شخصی هر یک از حرکات در بازی شطرنج است. با انجام حرکت بعدی، بازیکن آگاهانه یکی از گزینه های ممکن را برای چیدمان مشخصی از قطعات روی تخته انتخاب می کند. مجموعه گزینه های ممکن برای هر حرکت شخصی با قوانین بازی تنظیم می شود و به کلیت حرکت های قبلی هر دو طرف بستگی دارد.

یک حرکت تصادفی انتخابی از چند احتمال است که نه با تصمیم بازیکن، بلکه با مکانیسمی از انتخاب تصادفی (پرتاب کردن سکه، تاس، به هم زدن و پخش کردن کارت و غیره) انجام می شود. به عنوان مثال، دادن کارت اول به یکی از بازیکنان ترجیحی یک حرکت تصادفی با 32 گزینه به همان اندازه ممکن است. برای اینکه یک بازی به صورت ریاضی تعریف شود، قوانین بازی باید برای هر حرکت تصادفی، توزیع احتمال نتایج ممکن را مشخص کند.

برخی از بازی ها ممکن است فقط از حرکات تصادفی (به اصطلاح بازی های شانس خالص) یا فقط از حرکات شخصی (شطرنج، چکرز) تشکیل شوند. بیشتر بازی‌های کارتی متعلق به بازی‌های ترکیبی هستند، یعنی. شامل حرکات تصادفی و شخصی است.

بازی ها نه تنها بر اساس ماهیت حرکات (شخصی، تصادفی)، بلکه بر اساس ماهیت و میزان اطلاعاتی که در دسترس هر بازیکن در مورد اعمال بازیکن دیگر است، طبقه بندی می شوند. دسته خاصی از بازی ها به اصطلاح «بازی با اطلاعات کامل» هستند. بازی با اطلاعات کامل بازی ای است که در آن هر بازیکن از نتایج تمام حرکات قبلی اعم از شخصی و تصادفی در هر حرکت شخصی مطلع است. نمونه هایی از بازی های با اطلاعات کامل عبارتند از: شطرنج، چکرز و بازی معروف تیک تاک.

اکثر بازی‌های دارای اهمیت عملی به کلاس بازی‌هایی با اطلاعات کامل تعلق ندارند، زیرا ناشناخته بودن اقدامات حریف معمولاً عنصر ضروری موقعیت‌های درگیری است.

یکی از مفاهیم اساسی تئوری بازی ها، مفهوم «استراتژی» است. استراتژی بازیکن مجموعه ای از قوانین است که بسته به موقعیتی که در طول بازی ایجاد شده است، بدون ابهام انتخاب هر حرکت شخصی یک بازیکن معین را تعیین می کند. معمولاً تصمیم (انتخاب) برای هر حرکت شخصی توسط خود بازیکن در طول بازی بسته به شرایط خاص فعلی انجام می شود. با این حال، از نظر تئوری، اگر تصور کنیم که همه این تصمیمات توسط بازیکن از قبل گرفته می شود، موضوع تغییر نمی کند. برای انجام این کار، بازیکن باید لیستی از تمام موقعیت های ممکن در طول بازی از قبل تهیه کند و راه حل خود را برای هر یک از آنها ارائه دهد. در اصل (اگر نه به صورت عملی) این برای هر بازی امکان پذیر است. اگر چنین سیستم تصمیم گیری اتخاذ شود، به این معنی است که بازیکن استراتژی خاصی را انتخاب کرده است.

بازیکنی که استراتژی را انتخاب کرده است، اکنون نمی تواند شخصاً در بازی شرکت کند، اما شرکت خود را با لیستی از قوانین جایگزین می کند که شخص بی علاقه (داور) برای او اعمال می کند. استراتژی را نیز می توان در قالب یک برنامه خاص به خودکار داد. در حال حاضر شطرنج کامپیوتری به این صورت است. برای اینکه مفهوم «استراتژی» معنا پیدا کند، باید حرکات شخصی در بازی وجود داشته باشد. در بازی هایی که به تنهایی از حرکات تصادفی تشکیل شده اند، هیچ استراتژی وجود ندارد.

بسته به تعداد استراتژی‌های ممکن، بازی‌ها به «متناهی» و «بی نهایت» تقسیم می‌شوند. اگر هر بازیکن فقط تعداد محدودی استراتژی داشته باشد، به یک بازی محدود گفته می شود. بازی نهایی که بازیکن A در آن حضور دارد متراستراتژی ها و بازیکن B nاستراتژی ها را بازی mxn می نامند.

یک بازی mxn از دو بازیکن A و B ("ما" و "رقیب") را در نظر بگیرید. ما استراتژی های خود را A 1 , A 2 , …, A m استراتژی های دشمن B 1 , B 2 , …, B n نشان خواهیم داد. اجازه دهید هر طرف یک استراتژی خاص را انتخاب کند. برای ما A i و برای حریف B j خواهد بود. اگر بازی فقط از حرکات شخصی تشکیل شده باشد، پس انتخاب استراتژی های A i، B j به طور منحصر به فرد نتیجه بازی - سود ما را تعیین می کند. بیایید آن را با ij نشان دهیم. اگر بازی علاوه بر حرکات تصادفی شخصی، شامل یک جفت استراتژی A i، B j است که به نتایج تمام حرکات تصادفی بستگی دارد. در این مورد، برآورد طبیعی بازده مورد انتظار، مقدار متوسط ​​آن (انتظار ریاضی) است. ما با همان علامت، هم خود سود (در یک بازی بدون حرکات تصادفی) و هم مقدار میانگین آن (در یک بازی با حرکات تصادفی) را نشان خواهیم داد.

مقادیر a ij سود (یا میانگین بازده) را برای هر جفت استراتژی به ما اطلاع دهید. مقادیر را می توان در قالب یک جدول مستطیلی (ماتریس) نوشت که ردیف های آن با استراتژی های ما (A i) و ستون ها با استراتژی های حریف (B j) مطابقت دارند. چنین جدولی ماتریس پرداخت یا به سادگی ماتریس بازی نامیده می شود. ماتریس بازی mxn در شکل نشان داده شده است. یکی

برنج. 1. ماتریس mxn

ماتریس بازی را به صورت اختصاری ‖a ij‖ نشان می دهیم. چند نمونه ابتدایی از بازی ها را در نظر بگیرید.

مثال 1دو بازیکن A و B، بدون اینکه به یکدیگر نگاه کنند، یک سکه رو به بالا یا دمشان را به دلخواه روی میز قرار می دهند. اگر بازیکنان یک طرف را انتخاب کرده باشند (هر دو دارای نشان بازو یا هر دو دارای دم هستند)، بازیکن A هر دو سکه را می گیرد. در غیر این صورت، آنها توسط بازیکن B گرفته می شوند. لازم است بازی را تجزیه و تحلیل کرده و ماتریس آن را بسازید. راه حل. بازی فقط از دو حرکت تشکیل شده است: نوبت ما و نوبت حریف، هر دو شخصی. این بازی به بازی های دارای اطلاعات کامل تعلق ندارد، زیرا در لحظه حرکت بازیکنی که آن را اجرا می کند نمی داند دیگری چه کرده است. از آنجایی که هر یک از بازیکنان فقط یک حرکت شخصی دارد، استراتژی بازیکن یک انتخاب در این حرکت شخصی است.

ما دو استراتژی داریم: A 1 - انتخاب نشان ملی و A 2 - انتخاب دم. حریف دو استراتژی مشابه دارد: B 1 - نشان سلاح و B 2 - دم. بنابراین، این بازی یک بازی 2×2 است. ما برنده شدن سکه را 1+ در نظر می گیریم. ماتریس بازی:

با مثال این بازی، هر چند ابتدایی باشد، می توان برخی از ایده های اساسی نظریه بازی ها را روشن کرد. ابتدا فرض کنید بازی داده شده فقط یک بار اجرا شود. سپس، بدیهی است که صحبت در مورد "استراتژی" بازیکنان معقول تر از دیگران بی معنی است. هر کدام از بازیکنان با همان دلیل می توانند هر تصمیمی بگیرند. با این حال، زمانی که بازی تکرار می شود، شرایط تغییر می کند.

در واقع، فرض کنید که ما (بازیکن A) برای خود یک استراتژی انتخاب کرده ایم (مثلاً A 1) و به آن پایبند هستیم. سپس بر اساس نتایج چند حرکت اول، حریف استراتژی ما را حدس می‌زند و به کمترین حالت مطلوب برای ما پاسخ می‌دهد، یعنی. دم ها را انتخاب کنید به وضوح برای ما بی سود است که همیشه از یک استراتژی استفاده کنیم. برای اینکه بازنده نباشیم، گاهی باید نشان انتخاب کنیم، گاهی دم. با این حال، اگر ما در یک توالی مشخص (مثلاً از طریق یکی) نشان‌ها و دم‌ها را به طور متناوب تغییر دهیم، دشمن نیز می‌تواند این موضوع را حدس بزند و به این استراتژی به بدترین شکل برای ما پاسخ دهد. بدیهی است که یک راه مطمئن برای اطمینان از اینکه دشمن استراتژی ما را نمی داند، سازماندهی انتخاب در هر حرکت است، زمانی که خودمان از قبل آن را نمی دانیم (مثلاً با پرتاب سکه می توان این کار را تضمین کرد). بنابراین، با استفاده از استدلال شهودی، به یکی از مفاهیم اساسی نظریه بازی ها نزدیک می شویم - مفهوم "استراتژی مختلط"، یعنی. به گونه‌ای که استراتژی‌های «خالص» - در این مورد A 1 و A 2 - به طور تصادفی با فرکانس‌های خاصی متناوب می‌شوند. در این مثال، به دلایل تقارن، از قبل مشخص است که استراتژی های A 1 و A 2 باید با فرکانس یکسان متناوب باشند. در بازی های پیچیده تر، راه حل ممکن است به دور از اهمیت باشد.

مثال 2بازیکنان A و B به طور همزمان و مستقل از یکدیگر یکی از سه عدد را یادداشت می کنند: 1، 2 یا 3. اگر مجموع اعداد نوشته شده زوج باشد، B این مبلغ را به روبل A می پردازد. اگر فرد باشد، برعکس، A این مقدار را به B می پردازد. آنالیز بازی و ساخت ماتریس آن الزامی است.

راه حل. بازی از دو حرکت تشکیل شده است. هر دو شخصی هستند ما (A) سه استراتژی داریم: A 1 - نوشتن 1; و 2 - نوشتن 2; A 3 - نوشتن 3. حریف (B) همان سه استراتژی را دارد. این بازی یک بازی 3×3 است:

بدیهی است که مانند مورد قبل، دشمن می تواند به هر استراتژی که انتخاب کنیم به بدترین شکل برای ما پاسخ دهد. در واقع، اگر برای مثال استراتژی A 1 را انتخاب کنیم، دشمن همیشه با استراتژی B2 به آن پاسخ خواهد داد. در استراتژی A 2 - استراتژی B 3; در استراتژی A 3 - استراتژی B 2 ; بنابراین، هر گونه انتخاب یک استراتژی معین، ناگزیر ما را به ضرر می رساند (اما، نباید فراموش کنیم که دشمن در همان مضایقه است). راه حل این بازی (یعنی مجموعه ای از سودآورترین استراتژی ها برای هر دو بازیکن) در § 5 آورده شده است.

مثال 3ما سه نوع سلاح در اختیار داریم: A 1، A 2، A 3. دشمن سه نوع هواپیما دارد: B 1، B 2، B 3. وظیفه ما ضربه زدن به هواپیما است. وظیفه دشمن این است که او را شکست ناپذیر نگه دارد. هنگامی که از سلاح های A 1 استفاده می شود، هواپیماهای B 1، B 2، B 3 به ترتیب با احتمالات 0.9، 0.4 و 0.2 مورد اصابت قرار می گیرند. هنگام مسلح شدن به A 2 - با احتمالات 0.3، 0.6 و 0.8. هنگام مسلح شدن به A 3 - با احتمالات 0.5، 0.7 و 0.2. لازم است شرایط را از نظر تئوری بازی ها فرموله کنیم.

راه حل. این وضعیت را می توان به عنوان یک بازی 3x3 با دو حرکت شخصی و یک حرکت تصادفی مشاهده کرد. حرکت شخصی ما انتخاب نوع سلاح است. حرکت شخصی دشمن - انتخاب هواپیما برای شرکت در نبرد. حرکت تصادفی - استفاده از سلاح. این حرکت ممکن است با شکست یا عدم شکست هواپیما خاتمه یابد. بازده ما در صورت اصابت به هواپیما یک و در غیر این صورت صفر است. استراتژی های ما سه گزینه اسلحه هستند. استراتژی های دشمن - سه گزینه هواپیما. میانگین ارزش بازده برای هر جفت استراتژی چیزی نیست جز احتمال اصابت یک هواپیمای معین با یک سلاح معین. ماتریس بازی:

هدف تئوری بازی ها ایجاد توصیه هایی برای رفتار معقول بازیکنان در موقعیت های درگیری است. تعیین "استراتژی بهینه" هر یک از آنها. در تئوری بازی، استراتژی بهینه یک بازیکن به گونه‌ای است که وقتی بازی به دفعات تکرار می‌شود، حداکثر میانگین سود ممکن (یا حداقل میانگین ضرر ممکن) را برای بازیکن معین فراهم می‌کند. در انتخاب این استراتژی، مبنای استدلال این فرض است که دشمن حداقل به اندازه خودمان باهوش است و هر کاری می کند تا ما را از رسیدن به هدف باز دارد.

در تئوری بازی ها، همه توصیه ها بر اساس این اصول تدوین می شوند. بنابراین، عوامل خطر که به طور اجتناب ناپذیر در هر استراتژی واقعی وجود دارد و همچنین محاسبات اشتباه و اشتباهات احتمالی هر یک از بازیکنان را در نظر نمی گیرد. نظریه بازی ها، مانند هر مدل ریاضی از یک پدیده پیچیده، دارای محدودیت هایی است. مهمترین آنها این است که برنده ها به طور مصنوعی به یک عدد کاهش می یابد. در اکثر موقعیت های درگیری عملی، هنگام توسعه یک استراتژی معقول، باید نه یک، بلکه چندین پارامتر عددی - معیارهای موفقیت یک رویداد را در نظر گرفت. استراتژی که بر اساس یک معیار بهینه است، لزوماً بر اساس معیارهای دیگر بهینه نیست. با این حال، با شناخت این محدودیت‌ها و در نتیجه عدم پایبندی کورکورانه به توصیه‌های به‌دست‌آمده از روش‌های بازی، همچنان می‌توان به طور منطقی از دستگاه ریاضی نظریه بازی برای توسعه، اگر نه دقیقاً «بهینه»، پس در هر صورت، «قابل قبول» استفاده کرد. استراتژی

§ 2. قیمت پایین تر و بالاتر از بازی. اصل "مینیمکس".

مانند شکل، بازی mxn را با یک ماتریس در نظر بگیرید. 1. تعداد استراتژی خود را با حرف i نشان می دهیم. حرف j تعداد استراتژی حریف است. ما وظیفه تعیین استراتژی بهینه خود را بر عهده داریم. بیایید هر یک از استراتژی های خود را به صورت متوالی تجزیه و تحلیل کنیم و با A 1 شروع کنیم.

هنگام انتخاب یک استراتژی A i، همیشه باید انتظار داشته باشیم که حریف با یکی از استراتژی های B j که سود ما a ij حداقل است، به آن پاسخ دهد. اجازه دهید این ارزش بازده را تعریف کنیم، یعنی. کوچکترین اعداد a ij در من-خط. به α i نشان دهید:

در اینجا علامت min (حداقل در j) حداقل مقادیر این پارامتر را برای همه j های ممکن نشان می دهد. بیایید اعداد α i را یادداشت کنیم. در کنار ماتریس سمت راست به عنوان یک ستون اضافی:

با انتخاب هر استراتژی A i، باید روی این واقعیت حساب کنیم که در نتیجه اقدامات معقول حریف، بیش از α i نخواهیم برد. طبیعتاً، با بیشترین دقت عمل و حساب کردن روی معقول ترین حریف (یعنی اجتناب از هرگونه خطر)، باید در استراتژی که عدد α i حداکثر است، توقف کنیم. این مقدار حداکثر را با α نشان می دهیم:

یا با در نظر گرفتن فرمول (2.1)

مقدار α قیمت پایین‌تر بازی نامیده می‌شود، در غیر این صورت - حداکثر بازده یا صرفاً حداکثر. عدد α در یک ردیف معین از ماتریس قرار دارد. استراتژی بازیکن A که با این خط مطابقت دارد، استراتژی حداکثر نامیده می شود. بدیهی است که اگر به استراتژی حداکثری پایبند باشیم، برای هر رفتار حریف، حداقل کمتر از α، بازدهی تضمین شده است. بنابراین، مقدار α را «قیمت پایین‌تر بازی» می‌نامند. این حداقل تضمینی است که می توانیم محتاطانه ترین استراتژی ("بیمه اتکایی") را برای خود فراهم کنیم.

بدیهی است که استدلال مشابهی را می توان برای حریف B نیز انجام داد. از آنجایی که حریف علاقه مند به به حداقل رساندن بازده ما است، باید هر یک از استراتژی های خود را از نقطه نظر حداکثر بازده برای این استراتژی بررسی کند. بنابراین، در پایین ماتریس، حداکثر مقادیر را برای هر ستون می نویسیم:

و حداقل β j را پیدا کنید:

مقدار β را قیمت بالای بازی می نامند، در غیر این صورت - "مینیمکس". استراتژی حریف منطبق بر بازده حداقل حداکثر، «استراتژی حداقل» نامیده می شود. حریف با رعایت محتاطانه ترین استراتژی حداقلی خود، موارد زیر را برای خود تضمین می کند: مهم نیست که چه کاری علیه او انجام دهیم، او در هر صورت مقداری را که بیشتر از β نباشد از دست خواهد داد. اصل احتیاط که انتخاب استراتژی های مناسب (حداکثر و حداقل) را به بازیکنان دیکته می کند، اغلب در تئوری بازی ها و کاربردهای آن «اصل کمینه» نامیده می شود. محتاطانه ترین استراتژی های ماکسیمین و مینی ماکس بازیکنان گاهی اوقات با اصطلاح کلی "استراتژی های حداقل" نامیده می شود.

به عنوان مثال، قیمت‌های پایین‌تر و بالاتر بازی و استراتژی‌های مینی‌مکس را برای مثال‌های 1، 2 و 3 از بخش 1 تعریف می‌کنیم.

مثال 1در مثال 1 از بند 1، یک بازی با ماتریس زیر ارائه شده است:

از آنجایی که مقادیر α i و β j به ترتیب ثابت و برابر با 1- و +1 هستند، قیمت پایین و بالای بازی نیز برابر با 1- و +1 است: α = -1، β = +1. . هر استراتژی بازیکن A حداکثر است و هر استراتژی بازیکن B استراتژی حداقلی اوست. نتیجه گیری بی اهمیت است: با پایبندی به هر یک از استراتژی های خود، بازیکن A می تواند تضمین کند که بیش از 1 از دست نخواهد داد. همان را می توان توسط بازیکن B تضمین کرد.

مثال 2در مثال 2 از § 1، یک بازی با ماتریس داده شده است:

قیمت پایین تر بازی α = –3; هزینه بالای بازی β = 4 است. استراتژی حداکثری ما A 1 است. با اعمال سیستماتیک آن، می توانیم با اطمینان انتظار داشته باشیم که حداقل 3- برنده شویم (حداکثر 3 باخت). استراتژی حداقلی حریف هر یک از استراتژی های B 1 و B 2 است. با اعمال سیستماتیک آنها، در هر صورت، او می تواند تضمین کند که بیش از 4 را از دست نخواهد داد. اگر ما از استراتژی حداکثری خود منحرف شویم (مثلاً استراتژی A 2 را انتخاب کنید)، دشمن می تواند با اعمال استراتژی B ما را برای این کار "تنبیه" کند. 3 و کاهش سود ما به -5. به همین ترتیب، عقب نشینی حریف از استراتژی مینیمکس خود می تواند باخت او را به 6 برساند.

مثال 3در مثال 3 از § 1، یک بازی با ماتریس آورده شده است:

قیمت پایین تر بازی α = 0.3; بازی قدردانی بالا β = 0.7. محتاطانه ترین (حداکثر) استراتژی ما A 2 است. با استفاده از سلاح های A 2، ما تضمین می کنیم که به طور متوسط ​​در کمتر از 0.3 از همه موارد به هواپیما ضربه خواهیم زد. محتاطانه ترین (مینیممکس) استراتژی حریف B 2 است. با استفاده از این هواپیما، دشمن می تواند مطمئن باشد که در همه موارد بیش از 0.7 مورد ضربه قرار نخواهد گرفت.

با استفاده از آخرین مثال، نشان دادن یکی از ویژگی های مهم استراتژی های مینیمکس آسان است - بی ثباتی آنها. اجازه دهید محتاطانه ترین (حداکثر) استراتژی A 2 و حریف محتاطانه ترین (حداکثر) استراتژی B 2 را اعمال کنیم. تا زمانی که هر دو حریف به این استراتژی ها پایبند باشند، میانگین بازده 0.6 است. از قیمت پایین تر اما کمتر از قیمت بالایی بازی است. حال فرض کنید که دشمن متوجه شده است که ما از استراتژی A 2 استفاده می کنیم. او بلافاصله با استراتژی B 1 به آن پاسخ می دهد و بازده را به 0.3 کاهش می دهد. به نوبه خود، ما پاسخ خوبی به استراتژی B 1 داریم: استراتژی A 1، که به ما بازدهی 0.9 و غیره می دهد.

بنابراین، وضعیتی که در آن هر دو بازیکن از استراتژی های حداقل خود استفاده می کنند، ناپایدار است و می تواند توسط اطلاعات دریافتی در مورد استراتژی طرف مقابل نقض شود. با این حال، برخی از بازی‌ها وجود دارند که استراتژی‌های مینی‌مکس برای آنها پایدار است. اینها بازی‌هایی هستند که قیمت پایین‌تر آن‌ها برابر با بالاتر است: α = β. اگر قیمت پایین بازی برابر با بالاتر باشد، ارزش مشترک آنها را قیمت خالص بازی می نامند (گاهی اوقات فقط قیمت بازی)، آن را با حرف ν نشان می دهیم.

یک مثال را در نظر بگیرید. اجازه دهید بازی 4×4 توسط ماتریس داده شود:

بیایید قیمت پایین‌تر بازی را پیدا کنیم: α = 0.6. بیایید قیمت بالای بازی را پیدا کنیم: β = 0.6. معلوم شد که آنها یکسان هستند، بنابراین، بازی دارای هزینه خالص برابر با α = β = ν = 0.6 است. عنصر 0.6 که در ماتریس پرداخت مشخص شده است، هم حداقل در ردیف و هم حداکثر در ستون آن است. در هندسه، نقطه‌ای روی سطحی که دارای خاصیت مشابه (حداقل همزمان در امتداد یک مختصات و حداکثر در امتداد مختصات دیگر) باشد، نقطه زینی نامیده می‌شود؛ بر اساس قیاس، این اصطلاح در تئوری بازی‌ها نیز به کار می‌رود. عنصری از یک ماتریس که این ویژگی را دارد، نقطه زینی ماتریس نامیده می شود و بازی دارای یک نقطه زینی است.

نقطه زین مربوط به یک جفت استراتژی حداقلی است (در این مثال، A 3 و B 2). به این استراتژی ها بهینه می گویند و ترکیب آنها راه حل بازی است. راه حل بازی دارای ویژگی قابل توجه زیر است. اگر یکی از بازیکنان (مثلاً الف) به استراتژی بهینه خود پایبند باشد و بازیکن دیگر (ب) به هر نحوی از استراتژی بهینه خود منحرف شود، برای بازیکنی که انحراف را انجام داده است، این هرگز نمی تواند سودآور باشد. انحراف بازیکن B در بهترین حالت می تواند سود را بدون تغییر باقی بگذارد و در بدترین حالت آن را افزایش دهد. برعکس، اگر B به استراتژی بهینه خود پایبند باشد و A از استراتژی خود منحرف شود، این به هیچ وجه نمی تواند برای A مفید باشد.

بررسی این ادعا در مثال بازی مورد بررسی با یک نقطه زینی آسان است. می‌بینیم که در بازی با نقطه زین، استراتژی‌های مینی‌مکس نوعی «ثبات» دارند: اگر یک طرف به استراتژی مینی‌مکس خود پایبند باشد، آن‌گاه تنها می‌تواند برای دیگری منحرف شود که از استراتژی خود منحرف شود. توجه داشته باشید که در این حالت، این واقعیت که هر بازیکنی اطلاعاتی دارد که حریف استراتژی بهینه خود را انتخاب کرده است، نمی تواند رفتار خود بازیکن را تغییر دهد: اگر او نمی خواهد برخلاف منافع خود عمل کند، باید به استراتژی بهینه خود پایبند باشد. یک جفت استراتژی بهینه در یک بازی با نقطه زین، همانطور که بود، یک "موقعیت تعادل" است: هر انحراف از استراتژی بهینه، بازیکن منحرف را به عواقب نامطلوب سوق می دهد و او را مجبور می کند به موقعیت اصلی خود بازگردد.

بنابراین، برای هر بازی با یک نقطه زین، راه حلی وجود دارد که یک جفت استراتژی بهینه را برای هر دو طرف تعیین می کند که در ویژگی های زیر متفاوت است.

1) اگر هر دو طرف به استراتژی های بهینه خود پایبند باشند، میانگین بازده برابر با قیمت خالص بازی ν است که هم قیمت پایین و هم قیمت بالاتر آن است.

2) اگر یکی از طرفین به استراتژی بهینه خود پایبند باشد، در حالی که دیگری از استراتژی خود منحرف شود، طرف منحرف فقط می تواند از این امر ضرر کند و به هیچ وجه نمی تواند سود خود را افزایش دهد.

کلاس بازی های با نقطه زینی هم از نظر تئوری و هم از نظر عملی بسیار مورد توجه است. در تئوری بازی ها ثابت شده است که به ویژه هر بازی با اطلاعات کامل دارای یک نقطه زینتی است و در نتیجه هر بازی دارای یک راه حل است. یک جفت استراتژی بهینه برای هر دو طرف وجود دارد که بازدهی متوسط ​​برابر با قیمت بازی را ارائه می دهد. اگر یک بازی با اطلاعات کامل فقط از حرکات شخصی تشکیل شده باشد، در آن صورت، وقتی هر طرف استراتژی بهینه خود را اعمال می کند، باید همیشه به یک نتیجه کاملاً مشخص ختم شود، یعنی بازدهی دقیقاً برابر با قیمت بازی.

به عنوان نمونه ای از یک بازی با اطلاعات کامل، بیایید بازی معروف قرار دادن سکه روی میز گرد را در نظر بگیریم. دو بازیکن به طور متناوب سکه های یکسان را روی میز گرد قرار می دهند و هر بار موقعیت دلخواه مرکز سکه را انتخاب می کنند. پوشش متقابل سکه مجاز نیست. بازیکنی که آخرین سکه را بگذارد برنده است (زمانی که جایی برای دیگران باقی نماند). بدیهی است که نتیجه این بازی همیشه از پیش تعیین شده است و یک استراتژی کاملاً تعریف شده وجود دارد که یک برد قابل اعتماد را برای بازیکنی که سکه را در اولویت قرار می دهد تضمین می کند. یعنی ابتدا باید یک سکه در مرکز میز بگذارد و سپس به هر حرکت حریف با یک حرکت متقارن پاسخ دهد. در این حالت، بازیکن دوم می تواند بدون تغییر در نتیجه از پیش تعیین شده بازی، همانطور که دوست دارد رفتار کند. بنابراین، این بازی فقط برای بازیکنانی معنا دارد که استراتژی بهینه را نمی دانند. وضعیت در مورد شطرنج و بازی های دیگر با اطلاعات کامل مشابه است. هر یک از این بازی ها دارای یک نقطه زینتی و راه حلی است که به هر یک از بازیکنان استراتژی بهینه خود را نشان می دهد. راه حل بازی شطرنج تنها به این دلیل یافت نمی شود که تعداد ترکیب حرکات ممکن در شطرنج بسیار زیاد است تا بتوان یک ماتریس بازدهی ساخت و نقطه زینی در آن پیدا کرد.

§ 3. استراتژی های ناب و ترکیبی. حل یک بازی با استراتژی های ترکیبی

در میان بازی‌های محدود با اهمیت عملی، بازی‌های با نقطه زین نسبتاً نادر هستند. معمول‌تر زمانی است که قیمت‌های پایین‌تر و بالاتر بازی متفاوت باشد. با تجزیه و تحلیل ماتریس های چنین بازی هایی، به این نتیجه رسیدیم که اگر به هر بازیکن یک استراتژی واحد داده شود، پس بر اساس یک حریف منطقی عمل می کند، این انتخاب باید با اصل حداقلی تعیین شود. با رعایت استراتژی حداکثری خود، مطمئناً برای هر رفتار حریف، سودی برابر با قیمت پایین‌تر بازی α به خودمان تضمین می‌کنیم. یک سوال طبیعی مطرح می‌شود: آیا اگر نه تنها یک استراتژی خالص، بلکه چندین استراتژی را به‌طور تصادفی جایگزین کنید، می‌توانید بازدهی متوسطی بیشتر از α را برای خود تضمین کنید؟ چنین استراتژی‌های ترکیبی، شامل کاربرد چندین استراتژی خالص، متناوب بر اساس یک قانون تصادفی با نسبت معینی از فرکانس‌ها، در تئوری بازی، استراتژی‌های ترکیبی نامیده می‌شوند.

بدیهی است که هر استراتژی خالص یک مورد خاص از یک مختلط است که در آن همه استراتژی ها به جز یک مورد با فرکانس صفر و این استراتژی با فرکانس 1 اعمال می شود. معلوم می شود که با استفاده از نه تنها خالص بلکه استراتژی های ترکیبی را نیز می توانیم برای هر بازی محدود به دست آوریم، یعنی. یک جفت استراتژی (به طور کلی مختلط) به طوری که وقتی هر دو بازیکن آنها را به کار می گیرند، بازده برابر با قیمت بازی خواهد بود و در صورت انحراف یک طرفه از استراتژی بهینه، بازده فقط می تواند در جهت تغییر کند. برای بازیکن منحرف نامطلوب است.

بیانیه بیان شده محتوای به اصطلاح قضیه اصلی نظریه بازی است. این قضیه برای اولین بار توسط فون نویمان در سال 1928 اثبات شد. بنابراین، ما فقط فرمول آن را ارائه می دهیم.

هر بازی محدود حداقل یک راه حل دارد (شاید در حوزه استراتژی های ترکیبی).

سود حاصل از این تصمیم، قیمت بازی نامیده می شود. از قضیه اصلی بر می آید که هر بازی متناهی قیمتی دارد. بدیهی است که مقدار بازی ν همیشه بین مقدار پایین‌تر بازی α و مقدار بالای بازی β قرار دارد:

(3.1) α ≤ ν ≤ β

در واقع، α حداکثر بازده تضمین شده ای است که می توانیم تنها با استفاده از استراتژی های خالص خود، برای خود تضمین کنیم. از آنجایی که راهبردهای مختلط، به عنوان یک مورد خاص، همه راهبردهای محض را شامل می شود، با اجازه دادن، علاوه بر راهبردهای ناب، راهبردهای مختلط نیز، در هر حال، امکانات خود را بدتر نمی کنیم. از این رو ν ≥ α. به طور مشابه، با توجه به قابلیت های حریف، نشان می دهیم که ν≤ β، که دلالت بر نابرابری مورد نیاز دارد (3.1).

اجازه دهید یک نماد ویژه برای استراتژی های ترکیبی معرفی کنیم. به عنوان مثال، اگر استراتژی مختلط ما شامل استفاده از استراتژی های A 1، A 2، A 3 با فرکانس های p 1، p 2، p 3 و p 1 + p 2 + p 3 = 1 باشد، این استراتژی را نشان می دهیم.

به طور مشابه، استراتژی مختلط دشمن با موارد زیر مشخص می شود:

که در آن q 1 , q 2 , q 3 - فرکانس هایی که در آن استراتژی های B 1 , B 2 , B 3 مخلوط می شوند. q 1 + q 2 + q 3 = 1.

فرض کنید راه حلی برای بازی پیدا کرده ایم که شامل دو استراتژی ترکیبی بهینه S A *، S B * است. در حالت کلی، همه استراتژی‌های خالصی که برای یک بازیکن در دسترس است، در استراتژی ترکیبی بهینه او گنجانده نمی‌شوند، بلکه فقط برخی از آنها گنجانده می‌شوند. ما استراتژی های موجود در استراتژی ترکیبی بهینه بازیکن را استراتژی های "مفید" او می نامیم. به نظر می رسد که راه حل بازی دارای یک ویژگی قابل توجه دیگر است: اگر یکی از بازیکنان به استراتژی ترکیبی بهینه خود S A * (S B *) پایبند باشد، پس بازده یکسان و برابر با قیمت بازی ν باقی می ماند، مهم نیست. کاری که بازیکن دیگر انجام می دهد، مگر اینکه از استراتژی های "مفید" آن فراتر رود. به عنوان مثال، او می تواند از هر یک از استراتژی های "مفید" خود به شکل خالص استفاده کند و همچنین می تواند آنها را به هر نسبتی با هم مخلوط کند.

§ 4. روش های ابتدایی برای حل بازی. بازی 2ایکس2 و 2ایکسn

اگر بازی mxn نقطه زینی نداشته باشد، یافتن راه حل به طور کلی کار نسبتاً دشواری است، به خصوص برای m و n بزرگ. گاهی اوقات می توان این کار را با کاهش تعداد استراتژی ها با حذف برخی از استراتژی های اضافی ساده کرد. استراتژی های بیش از حد الف) تکراری و ب) آشکارا بی سود هستند. به عنوان مثال، بازی ماتریس را در نظر بگیرید:

به راحتی می توان دید که استراتژی A 3 دقیقاً استراتژی A 1 را تکرار می کند ("دو برابر" می کند، بنابراین هر یک از این دو استراتژی را می توان خط زد. علاوه بر این، با مقایسه رشته های A 1 و A 2، می بینیم که هر عنصر از رشته A 2 کمتر از (یا مساوی) عنصر مربوط به رشته A 1 است. بدیهی است که هرگز نباید از استراتژی A2 استفاده کنیم، بدیهی است که سودآور نیست. با خط زدن A 3 و A 2، ماتریس را به شکل ساده تری می آوریم. علاوه بر این، ما متذکر می شویم که استراتژی B 3 آشکارا برای دشمن نامطلوب است. با حذف آن، ماتریس را به شکل نهایی می آوریم:

بنابراین، بازی 4x4 با حذف استراتژی های تکراری و آشکارا زیان آور به یک بازی 2x3 کاهش می یابد.

روال حذف استراتژی های تکراری و آشکارا زیان آور همیشه باید مقدم بر حل بازی باشد. ساده ترین موارد بازی های متناهی که همیشه با روش های ابتدایی قابل حل هستند، بازی های 2x2 و 2xn هستند.

یک بازی 2×2 با ماتریس را در نظر بگیرید:

دو مورد ممکن است در اینجا رخ دهد: 1) بازی دارای یک نقطه زینتی است. 2) بازی نقطه زینی ندارد. در مورد اول، راه حل واضح است: این یک جفت استراتژی است که در یک نقطه تلاقی می کنند. اتفاقاً متذکر می شویم که در یک بازی 2×2 وجود یک نقطه زین همیشه با وجود استراتژی های عمدی زیانبار مطابقت دارد که باید در تحلیل اولیه حذف شوند.

اجازه دهید نقطه زین وجود نداشته باشد و بنابراین، قیمت پایین بازی با قیمت بالایی برابر نیست: α ≠ β. برای یافتن استراتژی ترکیبی بهینه بازیکن A لازم است:

با این ویژگی متمایز می شود که، هر اقدامی که حریف انجام دهد (مگر اینکه از استراتژی های "مفید" خود فراتر رود)، بازده برابر با ارزش بازی ν خواهد بود. در یک بازی 2x2، هر دو استراتژی حریف "مفید" هستند، در غیر این صورت بازی راه حلی در حوزه استراتژی خالص (نقطه زین) خواهد داشت. این بدان معنی است که اگر به استراتژی بهینه خود (4.1) پایبند باشیم، حریف می‌تواند از هر یک از استراتژی‌های خالص خود B 1 , B 2 بدون تغییر میانگین سود ν استفاده کند. از اینجا دو معادله داریم:

که با در نظر گرفتن اینکه p 1 + p 2 = 1 ، به دست می آوریم:

با جایگزین کردن مقادیر p 1 , p 2 در هر یک از معادلات (4.2) مقدار بازی ν را پیدا می کنیم.

اگر قیمت بازی مشخص است، پس برای تعیین استراتژی بهینه حریف

یک معادله کافی است، برای مثال:

از این رو، با توجه به اینکه q 1 + q 2 = 1، داریم:

مثال 1بیایید یک راه حل برای بازی 2×2 در نظر گرفته شده در مثال 1 از § 1 با ماتریس پیدا کنیم:

بازی نقطه زینی ندارد (α = -1؛ β = +1)، و بنابراین، راه حل باید در حوزه استراتژی های ترکیبی باشد:

باید p 1 , p 2 , q 1 و q 2 را پیدا کنید. برای p 1 معادله را داریم

1*p 1 + (–1)(1 – p 1) = (–1)p 1 + 1 (1 – p 1)

از آنجا p 1 = 1/2، p 2 = 1/2.

به طور مشابه، ما پیدا می کنیم: q 1 = 1/2، q 2 = 1/2، ν = 0.

بنابراین، استراتژی بهینه برای هر یک از بازیکنان این است که به طور تصادفی بین دو استراتژی خالص خود، با استفاده از هر یک از آنها به طور مساوی، به طور تصادفی جایگزین شوند. در این حالت میانگین بهره برابر با صفر خواهد بود.

نتیجه به دست آمده از قبل به اندازه کافی روشن بود. در مثال زیر بازی پیچیده تری را در نظر خواهیم گرفت که راه حل آن چندان واضح نیست. مثال، نمونه ابتدایی بازی هایی است که به بازی های «تقلب» یا «فریب» معروف هستند. در عمل، در موقعیت های درگیری، اغلب از روش های مختلف برای گمراه کردن دشمن استفاده می شود (اطلاعات غلط، تعیین اهداف نادرست و ...). مثال با وجود سادگی، کاملاً آموزنده است.

مثال 2بازی به شرح زیر است. دو کارت وجود دارد: ACE و Deuce. بازیکن A یکی از آنها را به طور تصادفی می کشد. ب نمی بیند کدام کارت را کشیده است. اگر A یک آس بکشد، اعلام می کند: "من یک آس دارم" و 1 روبل از حریف طلب می کند. اگر A یک دوس بکشد، می تواند A 1) بگوید "من یک آس دارم" و 1 روبل از حریف مطالبه کند، یا A 2) بپذیرد که دوس دارد و 1 روبل به حریف بپردازد.

دشمن، اگر داوطلبانه 1 روبل به او پرداخت شود، فقط می تواند آن را بپذیرد. اگر آنها 1 روبل از او مطالبه کنند، او می تواند B 1) بازیکن A را باور کند که یک آس دارد و 1 روبل به او بدهد، یا B 2) برای اطمینان از صحت گزاره A یک چک بخواهد. اگر در نتیجه بررسی کنید، معلوم می شود که A واقعا یک آس دارد، B باید به A 2 روبل بپردازد. اگر معلوم شود که A تقلب می کند و او دوس دارد، بازیکن A به بازیکن B 2 روبل می پردازد. آنالیز بازی و یافتن استراتژی بهینه برای هر یک از بازیکنان الزامی است.

راه حل.بازی ساختار نسبتا پیچیده ای دارد. این شامل یک حرکت تصادفی اجباری - انتخاب بازیکن A از یکی از دو کارت - و دو حرکت شخصی است که البته لزوما انجام نمی شود. در واقع، اگر A یک آس رسم کرده باشد، هیچ حرکت شخصی انجام نمی دهد: فقط یک فرصت به او داده می شود - درخواست 1 روبل، که او انجام می دهد. در این حالت، یک حرکت شخصی - باور کردن یا باور نکردن (یعنی پرداخت یا عدم پرداخت 1 روبل) - به بازیکن B منتقل می شود. اگر A در نتیجه اولین حرکت تصادفی یک دوس دریافت کرده باشد، به او یک پول شخصی داده می شود. حرکت: 1 روبل بپردازید یا سعی کنید حریف را فریب دهید و 1 روبل مطالبه کنید (به طور خلاصه: "فریب نده" یا "فریب"). اگر A مورد اول را انتخاب کند، B فقط باید 1 روبل را بپذیرد. اگر A مورد دوم را انتخاب کند، به بازیکن B یک حرکت شخصی داده می شود: باور کردن یا عدم باور A (یعنی پرداخت یک روبل یا درخواست تأیید).

استراتژی های هر بازیکن قوانینی هستند که به بازیکن می گویند در صورت انجام یک حرکت شخصی چه کاری انجام دهد. بدیهی است که A فقط دو استراتژی دارد: A 1 - تقلب کردن، A 2 - تقلب نکردن. ب نیز دو راهبرد دارد: ب 1 - باور کن، ب 2 - باور نکن. بیایید ماتریس بازی را بسازیم. برای انجام این کار، ما میانگین سود را برای هر ترکیبی از استراتژی ها محاسبه می کنیم.

1. A 1 B 1 (الف فریب می دهد، ب معتقد است). اگر A یک آس دریافت کرد (احتمال این ½ است، پس حرکت شخصی به او داده نمی شود؛ او 1 روبل می خواهد، و بازیکن B او را باور می کند؛ بازده A بر حسب روبل 1 است. اگر A یک دوس گرفته است (احتمال این نیز است. ½)، او طبق استراتژی خود تقلب می کند و 1 روبل طلب می کند؛ به او ایمان دارد و می پردازد؛ بازده A نیز برابر با 1 است. میانگین بازده: a 11 = ½ * 1 + ½ * 1 = 1.

2. A 1 B 2 (الف فریب می دهد، ب باور نمی کند). اگر A یک آس داشته باشد، هیچ حرکت شخصی ندارد. او 1 روبل می خواهد. طبق استراتژی خود، او به B اعتقاد ندارد و در نتیجه چک 2 روبل می پردازد (بازده A +2 است). اگر A یک دوس دریافت کرد، طبق استراتژی خود، به 1 روبل نیاز دارد. ب، به گفته او، معتقد نیست; در نتیجه، A 2 روبل می پردازد (سود A 2- است). میانگین برد: a 12 = ½*(+2) + ½*(–2) = 0.

3. A 2 B 1 (الف فریب نمی دهد، ب معتقد است). اگر A یک آس بکشد، 1 روبل طلب می کند. ب با توجه به استراتژی خود پرداخت; بازده A +1 است. اگر A یک دوس بکشد، طبق استراتژی خود 1 روبل می پردازد. فقط برای B باقی می ماند که بپذیرد (بازده A -1 است). میانگین برد عبارت است از: و 21 = ½*(+1) + ½*(–1) = 0.

4. A 2 B 2 (الف فریب نمی دهد، ب باور نمی کند). اگر A یک آس بکشد، 1 روبل طلب می کند. B چک می کند و در نتیجه چک 2 روبل می پردازد (بازده +2 است). اگر A یک دوس برداشت، 1 روبل می پردازد. در آن باقی می ماند تنها به پذیرش (بازده 1 است). میانگین برد عبارت است از: و 22 = ½*(+2) + ½*(–1) = ½.

ماتریس بازی را می سازیم:

ماتریس نقطه زینی ندارد. قیمت پایین تر بازی α = 0، قیمت بالای بازی β = ½. اجازه دهید راه حلی برای بازی در حوزه استراتژی های ترکیبی پیدا کنیم. با استفاده از فرمول (4.3)، به دست می آوریم:

آن ها بازیکن A باید اولین استراتژی خود (تقلب) را در یک سوم موارد و دومین استراتژی خود (تقلب نکن) را در دو سوم موارد استفاده کند. در همان زمان، او به طور متوسط ​​قیمت بازی ν = 1/3 برنده خواهد شد.

مقدار ν = 1/3 نشان می دهد که تحت این شرایط بازی برای A سودآور و برای B ضرر دارد. توجه داشته باشید که اگر A از محتاطانه ترین (حداکثر) استراتژی خود استفاده کند (در این مورد، هر دو استراتژی A 1 و A 2 حداکثر هستند)، میانگین بازدهی برابر با صفر خواهد داشت. بنابراین، استفاده از یک استراتژی ترکیبی به A این فرصت را می دهد تا به مزیت خود نسبت به B که تحت این قوانین بازی ناشی می شود، پی ببرد.

ما استراتژی بهینه B را تعریف می کنیم: q 1 *1 + q 2 *0 = 1/3، q 1 = 1/3، q 2 = 2/3. جایی که

یعنی بازیکن B باید در یک سوم موارد A را باور کند و بدون چک کردن 1 روبل به او بپردازد و در دو سوم موارد - چک. سپس او به طور میانگین برای هر بازی 1/3 از دست خواهد داد. اگر او از حداقل استراتژی خالص خود B 2 استفاده می کرد (باور نکنید)، به طور متوسط ​​1/2 در هر بازی بازنده می شد.

راه حل بازی 2×2 را می توان یک تفسیر هندسی ساده ارائه داد. اجازه دهید یک بازی 2×2 با ماتریس وجود داشته باشد

بیایید بخشی از محور x را با طول 1 در نظر بگیریم (شکل 4.1). انتهای سمت چپ بخش (نقطه با ابسیسا x = 0) استراتژی A 1 را نشان می دهد. انتهای سمت راست بخش (x = 1) - استراتژی A 2 . اجازه دهید از طریق نقاط A 1 و A 2 دو عمود بر محور x رسم کنیم: محور من-منو محور II–II. روی محور من-منما پرداخت ها را تحت استراتژی A 1 به تعویق می اندازیم. روی محور II–II-برنده شدن با استراتژی A 2 . استراتژی حریف B 1 را در نظر بگیرید. دو نقطه روی محورها می دهد من-منو II–IIبا دستورات به ترتیب 11 و 21 . بیایید یک خط مستقیم B 1 B 1 را از میان این نقاط رسم کنیم. بدیهی است که اگر از استراتژی ترکیبی برای استراتژی B 1 حریف استفاده کنیم

سپس میانگین بهره ما، که در این مورد برابر با 11 p 1 + a 21 p 2 است، با نقطه M روی خط مستقیم B 1 B 1 نمایش داده می شود. ابسیسا این نقطه p 2 است. خط مستقیم B 1 B 1 که نتیجه را با استراتژی B 1 به تصویر می کشد، به طور مشروط "استراتژی B 1" نامیده می شود.

بدیهی است که استراتژی B 2 می تواند دقیقاً به همین روش ساخته شود (شکل 4.2).

ما باید استراتژی بهینه S A * را پیدا کنیم، به عنوان مثال، استراتژی که حداقل بازده برای آن (برای هر رفتار B) به حداکثر تبدیل شود. برای انجام این کار، برای استراتژی های B 1، B 2، یک کران پایینی برای بازده ایجاد می کنیم. خط شکسته B 1 NB 2 مشخص شده در شکل. 4.2 با خط پررنگ. این کران پایین حداقل بازده بازیکن A را برای هر یک از استراتژی های ترکیبی خود بیان می کند. نقطه N که در آن این حداقل بازده به حداکثر می رسد، راه حل و قیمت بازی را تعیین می کند. به راحتی می توان فهمید که ترتیب نقطه N قیمت بازی ν است و آبسیس آن p 2 است - فراوانی اعمال استراتژی A 2 در استراتژی ترکیبی بهینه S A *.

در مورد ما، راه حل بازی با نقطه تقاطع استراتژی ها مشخص شد. با این حال، همیشه اینطور نخواهد بود. در شکل شکل 4.3 حالتی را نشان می دهد که، علی رغم وجود تلاقی استراتژی ها، راه حل استراتژی های خالصی را برای هر دو بازیکن ارائه می دهد (A 2 و B 2)، و قیمت بازی ν = a 22 است. در این مورد، ماتریس دارای یک نقطه زینتی است و استراتژی A 1 بدیهی است که سودآور نیست، زیرا برای هر استراتژی خالص حریف، بازدهی کمتری نسبت به A 2 دارد.

در مواردی که دشمن یک استراتژی عمدا نامطلوب دارد، تفسیر هندسی شکل نشان داده شده در شکل 1 را دارد. 4.4.

در این مورد، حد پایین بازده با استراتژی B1 مصادف است، استراتژی B2 بدیهی است که برای حریف بی‌سود است.

تفسیر هندسی امکان تجسم قیمت های پایین تر و بالای بازی را نیز ممکن می سازد (شکل 4.5).

برای نشان دادن، اجازه دهید تفاسیر هندسی بازی‌های 2×2 در مثال‌های 1 و 2 را بسازیم (شکل‌های 4.6 و 4.7).

دیده ایم که هر بازی 2×2 را می توان با ترفندهای ابتدایی حل کرد. هر بازی 2xn را می توان دقیقاً به همین روش حل کرد. جایی که ما فقط دو استراتژی داریم و دشمن تعداد دلخواه دارد.

اجازه دهید دو استراتژی داشته باشیم: A 1 , A 2 , و دشمن - n استراتژی: B 1 , B 2 , ..., B n . ماتریس ‖a ij‖ داده شده است. دارای دو سطر و n ستون است. همانطور که در مورد دو استراتژی، ما به مسئله یک تفسیر هندسی می دهیم. n استراتژی حریف با n خط مستقیم نشان داده می شود (شکل 4.8). ما مرز پایینی سود (polyline B 1 MNB 2) را می سازیم و نقطه N روی آن را با حداکثر مقدار پیدا می کنیم. این نکته راه حل بازی را می دهد (استراتژی ) اردین نقطه N برابر است با قیمت بازی ν و آبسیسا برابر فرکانس р 2 استراتژی A 2 است.

در این حالت، استراتژی بهینه حریف با استفاده از مخلوطی از دو استراتژی مفید به دست می آید: B 2 و B 4 که در نقطه N تقاطع می کنند. استراتژی B 3 بدیهی است که سودآور نیست و استراتژی B 1 با استراتژی بهینه S A سودآور نیست. *. اگر A به استراتژی بهینه خود پایبند باشد، بدون توجه به اینکه B از کدام یک از استراتژی های "مفید" او استفاده می کند، بازده تغییر نخواهد کرد، اما اگر B به استراتژی های B 1 یا B 3 روی آورد، تغییر خواهد کرد. در تئوری بازی ها ثابت شده است که هر بازی محدود mxn راه حلی دارد که در آن تعداد استراتژی های "مفید" هر دو طرف از کوچکترین دو عدد m و n تجاوز نمی کند. به طور خاص، از این نتیجه می شود که بازی 2xm همیشه راه حلی دارد که در آن بیش از دو استراتژی "مفید" در هر طرف شرکت نمی کنند.

با استفاده از یک تفسیر هندسی، می توان یک راه ساده برای حل هر بازی 2xm ارائه داد. مستقیماً از نقشه، یک جفت استراتژی «مفید» دشمن B j و B k را پیدا می کنیم که در نقطه N قطع می شوند (اگر بیش از دو استراتژی در نقطه N قطع شوند، هر دو را انتخاب می کنیم). ما می دانیم که اگر بازیکن A به استراتژی بهینه خود پایبند باشد، آنگاه بازده به نسبتی که B از استراتژی های "مفید" خود استفاده می کند، بستگی ندارد، بنابراین،

از این معادلات و شرط p 2 = 1 - p 1، p1، p2 و مقدار بازی ν را پیدا می کنیم. با دانستن قیمت بازی، می توانید بلافاصله استراتژی بهینه را تعیین کنید بازیکن B. برای انجام این کار، به عنوان مثال، معادله حل می شود: q j a 1 j + q k a 1 k = ν، که در آن q j + q k = 1. در موردی که m استراتژی داریم و دشمن فقط دو دارد، بدیهی است، مشکل به روشی کاملاً مشابه حل می شود. توجه به این نکته کافی است که با معکوس کردن علامت بازده، می توان بازیکن A را از "برنده" به "بازنده" تبدیل کرد. امکان حل بازی بدون تغییر علامت بازده وجود دارد. سپس مشکل به طور مستقیم برای B حل می شود، اما نه یک حد پایین تر، بلکه یک کران بازده بالا ساخته می شود (شکل 4.9). نقطه N با حداقل مختصات در حاشیه جستجو می شود که قیمت بازی ν است.

چندین مثال از بازی های 2×2 و 2xm را در نظر بگیرید و حل کنید که نمونه های ساده ای از بازی های دارای اهمیت کاربردی هستند.

مثال 3طرف A دو بمب افکن را به منطقه دشمن B می فرستد منو II; منجلو پرواز می کند II- پشت. یکی از بمب افکن ها - از قبل معلوم نیست که کدام یک - باید بمب را حمل کند، دیگری وظیفه اسکورت را انجام می دهد. در منطقه دشمن، بمب افکن ها توسط یک جنگنده از سمت B مورد حمله قرار می گیرند. بمب افکن ها به توپ هایی با سرعت های مختلف آتش مسلح می شوند. اگر جنگنده به بمب افکن عقب حمله کند IIسپس فقط توپ های این بمب افکن به سمت آن شلیک می کنند. اگر به بمب افکن جلویی حمله کند، توپ های هر دو بمب افکن به سمت او شلیک می کنند. احتمال ضربه زدن به جنگنده در حالت اول 0.3 و در حالت دوم 0.7 است.

اگر یک جنگنده با آتش دفاعی بمب افکن سرنگون نشود، با احتمال 0.6 به هدف انتخابی خود برخورد می کند. وظیفه بمب افکن ها حمل بمب به سمت هدف است. وظیفه جنگنده جلوگیری از این است، یعنی. یک بمب افکن حامل را سرنگون کنید انتخاب استراتژی های بهینه طرفین الزامی است:

الف) برای سمت A: کدام بمب افکن باید به عنوان حامل استفاده شود؟

ب) برای طرف B: به کدام بمب افکن حمله کنیم؟

راه حل. ما یک مورد ساده از یک بازی 2×2 داریم. برد - احتمال عدم شکست حامل. استراتژی های ما: یک بمب افکن 1 - حامل من; 2 - حامل - بمب افکن II. استراتژی های دشمن: B 1 - بمب افکن مورد حمله قرار می گیرد من; در 2 - بمب افکن حمله می کند II. اجازه دهید ماتریس بازی را بسازیم، یعنی. میانگین سود را برای هر ترکیبی از استراتژی ها پیدا کنید.

1. A 1 B 1 (حامل من، حمله کرد من). اگر بمب افکن ها جنگنده را ساقط کنند یا نکنند، حامل مورد اصابت قرار نمی گیرد، اما به هدف خود اصابت نمی کند: a 11 = 0.7 + 0.3 * 0.4 = 0.82.

2. A 2 B 1 (حامل II، حمله کرد من). a 21 = 1

3. A 1 B 2 (حامل من، حمله کرد II). A 12 = 1

4. A 2 B 2 (حامل II، حمله کرد II). A 22 \u003d 0.3 + 0.7 * 0.4 \u003d 0.58

ماتریس بازی به شکل زیر است:

قیمت پایین بازی 0.82; قیمت بالا 1. ماتریس نقطه زینی ندارد. ما به دنبال راه حلی در زمینه استراتژی های ترکیبی هستیم. ما داریم:

p 1 * 0.82 + p 2 * 1 = ν

p1 *1 + p2 *0.58 = v

p 1 = 0.7; p 2 \u003d 0.3

استراتژی بهینه ما بله، به عنوان مثال، شما باید بیشتر به عنوان یک حامل انتخاب کنید من، چگونه II. ارزش بازی ν = 0.874 است. با دانستن ν، q 1 و q 2 - فرکانس های استراتژی های B 1 و B 2 را در استراتژی بهینه حریف S B * تعیین می کنیم. ما داریم: q 1 * 0.82 + q 2 * 1 \u003d 0.874 و q 2 \u003d 1 - q 1، از آنجا q 1 \u003d 0.7؛ q 2 \u003d 0.3، یعنی استراتژی بهینه دشمن است .

مثال 4طرف A به جسم حمله می کند، طرف B از آن دفاع می کند. سمت A دارای دو صفحه است. طرف B دارای سه توپ ضد هوایی است. هر هواپیما حامل یک سلاح قدرتمند است. برای اینکه جسم مورد اصابت قرار گیرد کافی است حداقل یک هواپیما به آن نفوذ کند. هواپیمای سمت A ممکن است انتخاب کند که در هر یک از سه جهت به جسم نزدیک شود: من, II, III(شکل 4.10). دشمن (طرف B) می تواند هر یک از تفنگ های خود را در هر جهتی قرار دهد. در همان زمان، هر تفنگ فقط از ناحیه فضای مربوط به یک جهت معین شلیک می کند و از جهت های همسایه شلیک نمی کند. هر تفنگ می تواند تنها یک هواپیما را شلیک کند. هواپیمای شلیک شده با احتمال 1. طرف A نمی داند اسلحه ها کجا قرار گرفته اند. طرف B نمی داند هواپیماها از کجا می آیند. وظیفه طرف A ضربه زدن به جسم است. وظیفه طرف B جلوگیری از شکست اوست. راه حلی برای بازی پیدا کنید.

راه حل. بازی 2×3 است. Gain - احتمال برخورد با جسم. استراتژی های ممکن ما عبارتند از: 1 - ارسال یک هواپیما به دو جهت مختلف. الف 2 - هر دو هواپیما را در یک جهت بفرستید. استراتژی های دشمن: B 1 - یک اسلحه را در هر جهت قرار دهید. ب 2 - دو اسلحه را در یک جهت و یکی در جهت دیگر قرار دهید. در 3 - هر سه اسلحه را در یک جهت قرار دهید. ماتریس بازی را می سازیم.

1. A 1 B 1 (هواپیماها در جهات مختلف پرواز می کنند؛ اسلحه ها در یک زمان قرار می گیرند). بدیهی است که در این مورد، هیچ هواپیمای واحدی به جسم نفوذ نمی کند: a 11 = 0.

2. A 2 B 1 (هواپیماها با هم در یک جهت پرواز می کنند؛ اسلحه ها در یک زمان مرتب می شوند). بدیهی است که در این حالت، یک هواپیما بدون شلیک به شیء عبور می کند: و 21 = 1.

3. A 1 B 2 (هواپیماها یکی یکی پرواز می کنند؛ دشمن از دو جهت دفاع می کند و سمت سوم را بدون محافظت رها می کند). احتمال اینکه حداقل یک هواپیما به جسم نفوذ کند برابر است با احتمال اینکه یکی از آنها جهت محافظت نشده را انتخاب کند: و 12 = 2/3.

4. A 2 B 2 (هواپیماها با هم در یک جهت پرواز می کنند؛ دشمن از یک جهت با دو اسلحه و یکی با یک اسلحه دفاع می کند، یعنی در واقع از یک جهت محافظت می کند و دو جهت را بدون محافظت می گذارد). احتمال اینکه حداقل یک هواپیما به جسم نفوذ کند برابر با احتمال این است که یک جفت هواپیما یک جهت در واقع محافظت نشده انتخاب کند: a 22 = 2/3.

5. A 1 B 3 (هواپیماها یکی یکی پرواز می کنند؛ دشمن فقط از یک جهت با سه تفنگ دفاع می کند): a 13 = 1.

6. A 2 B 3 (هر دو هواپیما با هم پرواز می کنند؛ دشمن تنها از یک جهت با سه تفنگ دفاع می کند). برای اینکه جسم مورد اصابت قرار گیرد، هواپیما باید جهت محافظت نشده را انتخاب کند: a 23 = 2/3.

ماتریس بازی:

از ماتریس می توان دریافت که استراتژی B 3 به وضوح در مقایسه با B 2 بی سود است (این می تواند از قبل تصمیم گرفته شود). با خط زدن استراتژی B 3، بازی به یک بازی 2x2 کاهش می یابد:

ماتریس دارای یک نقطه زینتی است: قیمت پایین تر بازی 2/3 با قیمت بالایی مطابقت دارد. در عین حال، ما توجه می کنیم که برای ما (A) استراتژی A 1 بدیهی است که سودآور نیست. نتیجه گیری: هر دو طرف A و B باید همیشه از استراتژی های خالص خود A 2 و B 2 استفاده کنند، یعنی. ما باید هواپیماها را با 2 ارسال کنیم و به طور تصادفی جهت ارسال جفت را انتخاب کنیم. دشمن باید اسلحه های خود را به روش زیر قرار دهد: دو - در یک جهت، یکی - در جهت دیگر، و انتخاب این جهت ها نیز باید به طور تصادفی انجام شود (در اینجا، همانطور که می بینیم، "استراتژی های ناب" از قبل شامل یک عنصر شانس هستند. ). با استفاده از این استراتژی‌های بهینه، ما همیشه یک میانگین ثابت بازدهی 2/3 دریافت می‌کنیم (یعنی شی با احتمال 2/3 ضربه می‌خورد). توجه داشته باشید که راه حل پیدا شده از بازی منحصر به فرد نیست. علاوه بر راه حل در استراتژی های خالص، طیف کاملی از استراتژی های ترکیبی بازیکن A وجود دارد که بهینه هستند، از p 1 \u003d 0 تا p 1 \u003d 1/3 (شکل 4.11).

به عنوان مثال، به راحتی می توان مستقیماً تأیید کرد که اگر استراتژی های A 1 و A 2 خود را به نسبت 1/3 و 2/3 به کار ببریم، همان سود متوسط ​​2/3 به دست می آید.

مثال 5همان شرایط مثال قبل، اما چهار جهت حمله برای ما امکان پذیر است و دشمن چهار اسلحه دارد.

راه حل.ما هنوز دو استراتژی ممکن داریم: A 1 - ارسال هواپیماها در یک زمان، A 2 - ارسال دو هواپیما با هم. دشمن پنج استراتژی ممکن دارد: B 1 - یک اسلحه را در هر جهت قرار دهید. B 2 - دو اسلحه را در دو جهت مختلف قرار دهید. در 3 - قرار دادن دو اسلحه در یک جهت و یکی در یک زمان - در دو دیگر. در 4 - سه اسلحه را در یک جهت و یکی در جهت دیگر قرار دهید. در 5 - هر چهار اسلحه را در یک جهت قرار دهید. استراتژی های B 4، B 5 از قبل به عنوان آشکارا زیانده کنار گذاشته می شوند. با استدلال مشابه مثال قبلی، ماتریس بازی را می سازیم:

قیمت پایین تر بازی 1/2، بالا 3/4 است. ماتریس نقطه زینی ندارد. راه حل در زمینه استراتژی های ترکیبی نهفته است. با استفاده از یک تفسیر هندسی (شکل 4.12)، ما استراتژی های "مفید" دشمن را مشخص می کنیم: B 1 و B 2.

فرکانس های p 1 و p 2 از معادلات تعیین می شوند: p 1 * 0 + (1 - p 1) * 1 = ν و p 1 * 5/6 + (1 - p 1) * 1/2 = ν. از آنجا p 1 = 3/8; p2 = 5/8; ν = 5/8، یعنی. استراتژی بهینه ما این است . با استفاده از آن، ما میانگین برد 5/8 را برای خود تضمین می کنیم. با دانستن قیمت بازی ν = 5/8، فرکانس های q 1 و q 2 از استراتژی های "مفید" حریف را می یابیم: q 1 * 0 + (1 - q 1) * 5/6 = 5/8 ، q 1 = ¼، q 2 = ¾. استراتژی بهینه دشمن این خواهد بود: .

مثال 6سمت A دارای دو استراتژی A 1 و A 2 است، سمت B دارای چهار استراتژی B 1، B 2، B 3 و B 4 است. ماتریس بازی به شکل زیر است:

راه حلی برای بازی پیدا کنید.

راه حل. قیمت پایین بازی 3; بالا 4. تفسیر هندسی (شکل 4.13) نشان می دهد که استراتژی های مفید بازیکن B B 1 و B 2 یا B 2 و B 4 هستند:

بازیکن A بی نهایت استراتژی های ترکیبی بهینه دارد: در استراتژی بهینه، p 1 می تواند از 1/5 تا 4/5 متغیر باشد. مقدار بازی ν = 4 است. بازیکن B یک استراتژی بهینه خالص B 2 دارد.

§ 5. روش های کلی برای حل بازی های محدود

تا اینجا ما فقط ابتدایی ترین بازی ها از نوع 2xn را در نظر گرفته ایم که می توان آن ها را خیلی ساده حل کرد و به تفسیر هندسی راحت و گویا اعتراف کرد. در حالت کلی، حل بازی mxn یک مشکل نسبتاً دشوار است و پیچیدگی مسئله و مقدار محاسبات مورد نیاز برای حل آن با افزایش m و n به شدت افزایش می یابد. با این حال، این دشواری ها ماهیت اساسی ندارند و تنها با حجم بسیار زیادی از محاسبات همراه هستند، که در تعدادی از موارد ممکن است عملاً غیر ممکن باشد. جنبه اساسی روش یافتن راه حل برای هر m یکسان است.

بیایید این را با مثال بازی 3xn توضیح دهیم. بیایید یک تفسیر هندسی به آن بدهیم - قبلاً یک تفسیر فضایی. سه تا از استراتژی های ما A 1، A 2 و A 3 با سه نقطه در صفحه نمایش داده می شوند. هوی; اولی در مبدا قرار دارد (شکل 5.1)، دومی و سومی روی محورها قرار دارد اوهو OUدر فواصل 1 از مبدا.

محورها از طریق نقاط A 1، A 2 و A 3 کشیده می شوند منمن, IIIIو IIIIII، عمود بر صفحه هوی. روی محور منمنپرداخت ها با استراتژی A 1 در محورها به تعویق می افتد IIIIو IIIIII- سود برای استراتژی های A 2 , A 3 . هر استراتژی دشمن B j با یک هواپیما که بر روی محورها قطع می شود نشان داده می شود منمن, IIIIو IIIIIIبخش هایی برابر با بازده استراتژی های مربوطه A 1 , A 2 و A 3 و استراتژی B j . پس از ساختن تمام استراتژی های دشمن، خانواده ای از هواپیماها را بر روی مثلث A 1، A 2 و A 3 به دست می آوریم (شکل 5.2). برای این خانواده همچنین می‌توان یک کران بازده پایین‌تر ایجاد کرد، همانطور که در مورد 2xn انجام دادیم، و نقطه N را در این مرز با حداکثر ارتفاع بالای صفحه پیدا کنیم. هوی. این ارتفاع قیمت بازی ν خواهد بود.

فرکانس‌های p 1 , p 2 , p 3 از استراتژی‌های A 1 , A 2 و A 3 در استراتژی بهینه S A * با مختصات (x,y) نقطه N تعیین می‌شوند، یعنی: p 2 = x. p 3 = y، p 1 = 1 - p 2 - p 3. با این حال، چنین ساختار هندسی، حتی برای مورد 3xn، به راحتی قابل اجرا نیست و نیاز به زمان و تخیل زیادی دارد. اما در حالت کلی یک بازی، به فضایی با ابعاد m منتقل می شود و همه دید را از دست می دهد، اگرچه استفاده از اصطلاحات هندسی در برخی موارد ممکن است مفید باشد. هنگام حل بازی های mxn در عمل، راحت تر است که از قیاس های هندسی استفاده نکنید، بلکه از روش های تحلیلی محاسباتی استفاده کنید، به خصوص که این روش ها تنها روش هایی هستند که برای حل مشکل در رایانه ها مناسب هستند.

همه این روش‌ها اساساً به حل مشکل با آزمایش‌های متوالی کاهش می‌یابند، اما ترتیب ترتیب آزمایش‌ها به شما امکان می‌دهد الگوریتمی بسازید که به اقتصادی‌ترین راه به راه‌حل منجر شود. در اینجا به طور خلاصه به یک روش محاسباتی برای حل بازی های mxn می پردازیم - به اصطلاح روش "برنامه نویسی خطی". برای این کار ابتدا یک بیان کلی از مشکل یافتن راه حل برای بازی mxn می دهیم. اجازه دهید بازی mxn با m استراتژی A 1 , А 2 , …, A m از بازیکن A و n استراتژی B 1 , B 2 , …, B n بازیکن В داده شود و ماتریس پرداخت ‖a i j ‖ داده می شود. لازم است راه حلی برای بازی پیدا شود، یعنی. دو استراتژی ترکیبی بهینه بازیکنان A و B

که در آن p 1 + p 2 + ... + p m = 1; q 1 + q 2 + ... + q n = 1 (برخی از اعداد p i و q j ممکن است برابر با صفر باشند).

استراتژی بهینه ما S A *باید بازدهی کمتر از ν برای هر رفتار حریف و بازدهی برابر ν برای رفتار بهینه او به ما ارائه دهد (استراتژی S B *). به طور مشابه، استراتژی S B * باید ضرری را برای دشمن فراهم کند که برای هر یک از رفتارهای ما بیشتر از ν و برای رفتار بهینه ما برابر با ν نباشد (استراتژی S A *).

مقدار مقدار بازی ν در این مورد برای ما ناشناخته است. فرض می کنیم که برابر با یک عدد مثبت است. با این فرض، کلیت استدلال را زیر پا نمی گذاریم; برای ν > 0، بدیهی است که همه عناصر ماتریس ‖a i j‖ غیر منفی باشند کافی است. این همیشه می تواند با افزودن یک مقدار مثبت به اندازه کافی بزرگ به عناصر ‖a i j‖ به دست آید. L; در حالی که قیمت بازی افزایش می یابد L، اما راه حل تغییر نمی کند.

اجازه دهید استراتژی بهینه خود را S A * انتخاب کنیم. سپس میانگین سود ما در استراتژی B j حریف برابر خواهد بود: a j = p 1 a 1j + p 2 a 2j + … + p m a mj . استراتژی بهینه ما S A * این ویژگی را دارد که برای هر رفتار حریف، بازدهی کمتر از ν ارائه می‌کند. بنابراین، هیچ یک از اعداد a j نمی تواند کمتر از ν باشد. ما تعدادی از شرایط را دریافت می کنیم:

نابرابری های (5.1) را بر مقدار مثبت ν تقسیم می کنیم و نشان می دهیم

سپس شرایط (5.1) را می توان به صورت نوشتاری نوشت

که ξ 1 , ξ 2 , ..., ξ m اعداد غیر منفی هستند. از آنجایی که p 1 + p 2 + ... + p m = 1، پس کمیت های ξ 1، ξ 2، ...، ξ m شرط را برآورده می کنند.

(5.3) ξ 1 + ξ 2 + … + ξ m = 1/ν.

ما می خواهیم برد تضمین شده خود را تا حد امکان بالا ببریم. بدیهی است که در این حالت سمت راست برابری (5.3) مقدار حداقلی را به خود می گیرد. بنابراین، مسئله یافتن راه‌حل بازی به مسئله ریاضی زیر کاهش می‌یابد: برای تعیین مقادیر غیر منفی ξ 1 , ξ 2 , ..., ξ m شرایط راضی کننده (5.2) به طوری که مجموع آنها Φ = ξ 1 + ξ 2 + … + ξ m حداقل بود.

معمولاً هنگام حل مسائل مربوط به یافتن مقادیر شدید (حداکثر و حداقل)، تابع متمایز می شود و مشتقات برابر با صفر می شوند. اما چنین تکنیکی در این مورد بی فایده است، زیرا تابع Φ، که باید به حداقل کاهش یابد، خطی است و مشتقات آن نسبت به همه آرگومان ها برابر با یک هستند، یعنی. هرگز ناپدید نمی شود در نتیجه، ماکزیمم تابع در جایی در مرز ناحیه تغییر آرگومان‌ها به دست می‌آید که با شرط منفی نبودن آرگومان‌ها و شرایط (5.2) تعیین می‌شود. روش یافتن مقادیر افراطی با استفاده از تمایز نیز در مواردی که حداکثر مرز بازده پایین (یا حداقل بالا) برای حل بازی تعیین می شود، نامناسب است، همانطور که برای مثال ما هنگام حل بازی 2xn انجام دادیم. در واقع، مرز پایینی از قطعات خطوط مستقیم تشکیل شده است، و حداکثر در نقطه‌ای که مشتق برابر با صفر است (اصلاً چنین نقطه‌ای وجود ندارد) به حداکثر می‌رسد، بلکه در مرز بازه یا در نقطه‌ای به حداکثر می‌رسد. نقطه تقاطع قطعات مستقیم

برای حل چنین مسائلی که در عمل کاملاً متداول است، یک دستگاه برنامه ریزی خطی ویژه در ریاضیات ساخته شده است. مسئله برنامه ریزی خطی به صورت زیر مطرح می شود. با توجه به سیستم معادلات خطی:

لازم است مقادیر غیر منفی مقادیر ξ 1 , ξ 2 , ..., ξ m , شرایط رضایت بخش (5.4) را بیابید و در عین حال تابع خطی همگن داده شده مقادیر ξ 1 , ξ 2 را به حداقل برسانید. …, ξ m (شکل خطی): Φ = c 1 ξ 1 + c 2 ξ 2 + … + c m ξ m

به راحتی می توان فهمید که مسئله نظریه بازی که در بالا مطرح شد، یک مورد خاص از یک مسئله برنامه ریزی خطی برای c 1 = c 2 = ... = c m = 1 است. در نگاه اول، ممکن است به نظر برسد که شرایط (5.2) معادل شرایط (5.4) نیست، زیرا به جای علائم مساوی دارای علائم نابرابری هستند. با این حال، با معرفی متغیرهای غیرمنفی ساختگی جدید z 1 , z 2 , …, z n و شرایط نوشتن (5.2) به راحتی می توان از شر علائم نابرابری خلاص شد:

شکل Φ که باید کمینه شود Φ = ξ 1 + ξ 2 + … + ξ m است. دستگاه برنامه نویسی خطی به تعداد نسبتاً کمی از نمونه های متوالی اجازه می دهد تا مقادیر ξ 1، ξ 2، ...، ξ m را که نیازها را برآورده می کنند انتخاب کنند. برای وضوح بیشتر، در اینجا استفاده از این دستگاه را مستقیماً بر روی مواد حل بازی های خاص نشان خواهیم داد.

مثال 1لازم است راه حلی برای بازی 3 × 3 ارائه شده در مثال 2 از § 1 با ماتریس پیدا کنید:

برای اینکه همه یک ij غیر منفی باشد، L = 5 را به تمام عناصر ماتریس اضافه می کنیم. ماتریس را بدست می آوریم:

در این صورت قیمت بازی 5 افزایش می یابد اما تصمیم تغییر نمی کند.

اجازه دهید استراتژی بهینه S A * را تعریف کنیم. شرایط (5.2) به شکل زیر است:

جایی که ξ 1 = p 1 / ν، ξ 2 = p 2 / ν، ξ 3 = p 3 / ν. برای خلاص شدن از شر علائم نابرابری، متغیرهای ساختگی z 1 , z 2 , z 3 را معرفی می کنیم. شرایط (5.6) را می توان به صورت زیر نوشت:

شکل خطی Φ عبارت است از: Φ = ξ 1 + ξ 2 + ξ 3 و باید تا حد امکان کوچک ساخته شود. اگر هر سه استراتژی B "مفید" باشند، هر سه متغیر ساختگی z 1 , z 2 , z 3 ناپدید می شوند (یعنی با هر استراتژی B j بازدهی برابر با قیمت بازی ν حاصل می شود). اما ما هنوز دلیلی نداریم که بگوییم هر سه استراتژی "مفید" هستند. برای بررسی این موضوع، بیایید سعی کنیم شکل Φ را بر حسب متغیرهای ساختگی z 1 , z 2 , z 3 بیان کنیم و ببینیم با صفر کردن آنها به حداقل شکل می رسیم یا خیر. برای انجام این کار، معادلات (5.7) را با توجه به متغیرهای ξ 1 , ξ 2 , ξ 3 حل می کنیم (یعنی ξ 1 , ξ 2 , ξ 3 را بر حسب متغیرهای ساختگی z 1 , z 2 , z 3 بیان می کنیم. ):

با افزودن ξ 1 , ξ 2 , ξ 3 , به دست می آوریم: Φ = 1/5 + z 1 /20 + z 2 /10 + z 3 /20. در اینجا ضرایب برای همه z مثبت هستند. بنابراین، هر افزایشی در z 1، z 2، z 3 بالای صفر تنها می تواند منجر به افزایش شکل Φ شود و ما می خواهیم حداقل باشد. بنابراین، مقادیر z 1 , z 2 , z 3 که فرم Φ را به حداقل می رساند z 1 = z 2 = z 3 = 0 است. بنابراین حداقل مقدار فرم Φ: 1/ν = 1 /5، از آنجایی که قیمت بازی ν = 5 است. با جایگزین کردن مقادیر صفر z 1 , z 2 , z 3 به فرمول (5.8)، پیدا می کنیم: ξ 1 = 1/20، ξ 2 = 1/10، ξ 3 = 1/20، یا ضرب آنها در ν، p 1 \u003d 1/4، p 2 \u003d 1/2، p 3 \u003d 1/4. بنابراین، استراتژی بهینه A یافت می شود: ، یعنی باید عدد 1 را در یک چهارم موارد، 2 را در نیمی از موارد و 3 را در یک چهارم موارد باقیمانده بنویسیم.

با دانستن قیمت بازی ν = 5، می توانیم استراتژی بهینه حریف را با استفاده از روش های شناخته شده پیدا کنیم . برای انجام این کار، از هر دو استراتژی مفید (مثلاً A 2 و A 3) استفاده می کنیم و معادلات را می نویسیم:

9q 1 + 11 (1-q 2 -q 1) = 5،

از آنجا q 1 = q3 = 1/4; q 2 \u003d 1/2. استراتژی بهینه حریف مانند استراتژی ما خواهد بود: . اکنون به بازی اصلی (تبدیل نشده) برگردید. برای این، فقط کافی است مقدار L = 5 را از مقدار بازی ν = 5 که به عناصر ماتریس اضافه شده است، کم کنید. ما قیمت بازی اصلی v 0 = 0 را به دست می آوریم. بنابراین، استراتژی های بهینه هر دو طرف یک بازده متوسط ​​برابر با صفر را ارائه می دهند. بازی به همان اندازه برای هر دو طرف سودمند یا مضر است.

مثال 2باشگاه ورزشی A سه گزینه برای ترکیب تیم A 1 , A 2 و A 3 دارد . باشگاه B - همچنین سه گزینه B 1 , B 2 و B 3 . هنگام ارسال درخواست برای شرکت در مسابقات، هیچ یک از باشگاه ها نمی دانند حریف چه ترکیبی را انتخاب خواهد کرد. احتمالات برنده شدن باشگاه A با گزینه های مختلف برای ترکیب تیم ها که تقریباً از تجربه دیدارهای گذشته مشخص است، توسط ماتریس ارائه شده است:

تعداد دفعاتی را که باشگاه‌ها باید هر یک از تیم‌ها را در جلسات با یکدیگر به میدان بروند تا به بالاترین میانگین تعداد بردها دست یابند، بیابید.

راه حل. قیمت پایین تر بازی 0.4; بالا 0.6; ما به دنبال راه حلی در زمینه استراتژی های ترکیبی هستیم. برای اینکه با کسری سروکار نداشته باشیم، تمام عناصر ماتریس را در 10 ضرب می کنیم. در این صورت قیمت بازی 10 برابر افزایش می یابد و تصمیم تغییر نمی کند. ماتریس را دریافت می کنیم:

شرایط (5.5) به شکل زیر است:

و شرط حداقل Φ = ξ 1 + ξ 2 + ξ 3 = min.

بررسی می کنیم که آیا هر سه استراتژی حریف "مفید" هستند یا خیر. به عنوان یک فرضیه، ابتدا فرض می کنیم که متغیرهای ساختگی z 1 , z 2 , z 3 برابر با صفر هستند و برای بررسی معادلات (5.10) را برای ξ 1 , ξ 2 , ξ 3 حل می کنیم:

(5.12) 136Φ = 30 +13z 1 +18z 2 – 51z 3

فرمول (5.12) نشان می دهد که افزایش متغیرهای z 1 و z 2 از مقدار فرضی صفر آنها فقط می تواند ف را افزایش دهد، در حالی که افزایش z 3 می تواند باعث کاهش Φ شود. اما افزایش z 3 باید با دقت انجام شود تا مقادیر ξ 1 , ξ 2 , ξ 3 بسته به z 3 در این حالت منفی نشوند. بنابراین، مقادیر z 1 و z 2 را در سمت راست برابری ها برابر با صفر قرار می دهیم (5.11) و مقدار z 3 را تا حد قابل قبول افزایش می دهیم (تا هر یک از مقادیر ξ 1، ξ 2، ξ 3 ناپدید می شود). از برابری دوم (5.11) می توان دریافت که افزایش z 3 برای مقدار ξ 2 "ایمن" است - فقط از این افزایش می یابد. در مورد مقادیر ξ 1 و ξ 3 ، در اینجا افزایش z 3 فقط تا حد معینی امکان پذیر است. مقدار ξ 1 در z 3 = 10/23 ناپدید می شود. کمیت ξ 3 زودتر ناپدید می شود، در حال حاضر در z 3 = 1/4. بنابراین با دادن z 3 حداکثر مقدار مجاز آن z 3 = 1/4، مقدار ξ 3 را نیز به صفر تبدیل می کنیم.

برای بررسی اینکه آیا شکل Φ در z 1 = 0، z 2 = 0، ξ 3 = 0 به حداقل می رسد یا خیر، متغیرهای باقیمانده (غیر صفر) را بر حسب z 1 , z 2 , ξ 3 ظاهراً برابر با صفر بیان می کنیم. . حل معادلات (5.10) با توجه به ξ 1، ξ 2 و z 3، به دست می آید:

(5.13) 32Φ = 7 + Zz 1 + 4z 2 + ξ 3

از فرمول (5.13) می توان دریافت که هر افزایش z 1 , z 2 , ξ 3 فراتر از مقادیر صفر فرضی آنها فقط می تواند شکل Φ را افزایش دهد. بنابراین راه حل بازی پیدا می شود. با مقادیر z 1 = z 2 = ξ 3 = 0 تعیین می شود، از آنجا ξ 1 = 1/32، ξ 2 = 3/16، z 3 = 1/4. با جایگزین کردن فرمول (5.13)، مقدار بازی ν را پیدا می کنیم: 32Φ = 7 = 32/ν. v = 32/7. استراتژی بهینه ما: . استراتژی های "مفید" (ترکیب های A 1 و A 2) باید با فرکانس های 1/7 و 6/7 اعمال شوند. ترکیب A 3 - هرگز استفاده نشود.

برای یافتن استراتژی بهینه حریف، در حالت کلی، می‌توان به صورت زیر عمل کرد: علامت بازده را معکوس کرد، یک مقدار ثابت L را به عناصر ماتریس اضافه کرد تا آنها را غیرمنفی کند، و مشکل را برای حریف به همین ترتیب حل کرد. همانطور که برای خودمان حلش کردیم. با این حال، این واقعیت که ما از قبل ارزش بازی ν را می دانیم، کار را تا حدودی ساده می کند. علاوه بر این، در این مورد خاص، کار علاوه بر این با این واقعیت ساده می شود که فقط دو استراتژی دشمن "مفید" B 1 و B 2 در راه حل شرکت می کنند، زیرا مقدار z 3 برابر با صفر نیست، و بنابراین، با استراتژی B 3 به قیمت بازی نمی رسد. با انتخاب هر استراتژی "مفید" بازیکن A، به عنوان مثال A 1، می توان فرکانس های q 1 و q 2 را پیدا کرد. برای انجام این کار، معادله 8q 1 + 2 (1 - q 1) = 32/7 را می نویسیم، از آنجا q 1 = 3/7، q 2 = 4/7; استراتژی بهینه حریف این خواهد بود: ، یعنی دشمن نباید از ترکیب B 3 استفاده کند و ترکیبات B 1 و B 2 باید با فرکانس های 3/7 و 4/7 استفاده شود.

با بازگشت به ماتریس اصلی، مقدار واقعی بازی را تعیین می کنیم ν 0 = 32/7:10 = 0.457. یعنی با تعداد زیاد دیدارها، تعداد بردهای باشگاه A 0.457 از کل دیدارها خواهد بود.

§ 6. روش های تقریبی برای حل بازی ها

اغلب در مسائل عملی نیازی به یافتن راه حل دقیق بازی نیست. کافی است یک راه حل تقریبی پیدا کنید که بازده متوسطی نزدیک به قیمت بازی بدهد. دانش تقریبی از قیمت بازی ν می‌تواند تحلیل ساده‌ای از ماتریس و تعریف قیمت‌های پایین (α) و بالا (β) بازی ارائه دهد. اگر α و β به هم نزدیک باشند، عملاً نیازی به جستجوی راه حل دقیق نیست و انتخاب استراتژی های حداقلی خالص کافی است. در مواردی که α و β نزدیک نباشند، می توان با استفاده از روش های عددی برای حل بازی ها، راه حل عملی به دست آورد که به طور خلاصه روش تکرار را برجسته می کنیم.

ایده روش تکرار به شرح زیر است. یک "آزمایش فکری" انجام می شود که در آن حریفان A و B از استراتژی های خود علیه یکدیگر استفاده می کنند. این آزمایش شامل دنباله‌ای از بازی‌های ابتدایی است که هر کدام دارای یک ماتریس بازی هستند. با این واقعیت شروع می شود که ما (بازیکن A) به طور تصادفی یکی از استراتژی های خود را انتخاب می کنیم، برای مثال A i. دشمن با استراتژی B j به این امر پاسخ می دهد که کمترین سود را برای ما دارد، یعنی. سود استراتژی A i را به حداقل می رساند. ما به این حرکت با استراتژی A k خود پاسخ می‌دهیم، که حداکثر میانگین سود را زمانی که حریف از استراتژی B j استفاده می‌کند، می‌دهد. بعد - دوباره نوبت دشمن. او به جفت حرکات A i و A k ما با استراتژی B j پاسخ می دهد که کمترین میانگین بازدهی را برای این دو استراتژی (A i، A k) و غیره به ما می دهد. در هر مرحله از فرآیند تکراری، هر بازیکن به هر حرکت بازیکن دیگر با استراتژی خود پاسخ می دهد که با توجه به تمام حرکات قبلی او بهینه است و به عنوان یک استراتژی مختلط در نظر گرفته می شود که در آن استراتژی های خالص به نسبت های مربوط به نشان داده می شوند. فرکانس استفاده از آنها

این روش همان طور که گفته شد، مدلی از «تمرین» عملی واقعی بازیکنان است، زمانی که هر یک از آنها با تجربه رفتار حریف را بررسی می کند و سعی می کند به روشی که برای خود سودمند است به آن پاسخ دهد. اگر چنین تقلید از فرآیند یادگیری به اندازه کافی ادامه یابد، آنگاه میانگین افزایش در هر جفت حرکت (یک بازی ابتدایی) به قیمت بازی و فرکانس‌ها p 1 ... p m ; q 1 … q n، که استراتژی های بازیکنان در این قرعه کشی با آن روبرو می شوند، به فرکانس هایی نزدیک می شوند که استراتژی های بهینه را تعیین می کنند. محاسبات نشان می دهد که همگرایی روش بسیار کند است، اما این مانعی برای کامپیوترهای پرسرعت نیست.

اجازه دهید کاربرد روش تکراری را در مثال بازی 3×3 حل شده در مثال 2 پاراگراف قبل نشان دهیم. بازی توسط ماتریس ارائه شده است:

جدول 6.1 18 مرحله اول فرآیند تکراری را نشان می دهد. ستون اول شماره بازی ابتدایی (جفت حرکت) را نشان می دهد. n; در دوم - شماره مناستراتژی انتخابی بازیکن A؛ در سه بعدی - "سود تجمعی" برای اولین nبازی با استراتژی های حریف B 1 , B 2 , B 3 . کوچکترین این مقادیر زیر خط کشیده شده است. بعد شماره می آید jاستراتژی انتخاب شده توسط حریف، و بر این اساس، بازده انباشته شده برای nبازی هایی با استراتژی های A 1 , A 2 , A 3 از این مقادیر، حداکثر از بالا زیر خط کشیده شده است. مقادیر زیر خط کشی شده انتخاب استراتژی پاسخ بازیکن دیگر را تعیین می کند. ستون‌های زیر پشت سر هم نشان می‌دهند: حداقل میانگین بازده ν برابر با حداقل بازده انباشته تقسیم بر تعداد بازی‌ها n; حداکثر میانگین برد، برابر با حداکثر برد انباشته تقسیم بر n، و میانگین حسابی آنها ν* = (ν + )/2. با افزایش nهر سه مقدار ν و ν* به مقدار بازی ν نزدیک می شوند، اما مقدار ν* طبیعتاً نسبتاً سریعتر به آن نزدیک می شود.

جدول 6.1.

همانطور که از مثال مشاهده می شود، همگرایی تکرارها بسیار کند است، اما حتی چنین محاسبه کوچکی این امکان را فراهم می کند که مقدار تقریبی قیمت بازی را پیدا کنید و شیوع استراتژی های "مفید" را آشکار کنید. هنگام استفاده از ماشین های محاسبه، ارزش روش به طور قابل توجهی افزایش می یابد. مزیت روش تکراری حل بازی ها این است که با افزایش تعداد استراتژی ها، حجم و پیچیدگی محاسبات نسبتاً ضعیف افزایش می یابد. مترو n.

§ 7. روش هایی برای حل چند بازی بی نهایت

بازی بی نهایت بازی ای است که در آن حداقل یکی از طرفین دارای مجموعه بی نهایتی از استراتژی ها باشد. روش های کلی برای حل این گونه بازی ها هنوز توسعه نیافته است. با این حال، برای عمل، برخی از موارد خاص ممکن است مورد توجه باشد، که راه حل نسبتا ساده ای را پذیرفته است. بازی دو حریف A و B را در نظر بگیرید که هر کدام دارای مجموعه ای بی نهایت (غیر قابل شمارش) از استراتژی ها هستند. این استراتژی ها برای بازیکن A مربوط به مقادیر مختلف پارامتر دائماً در حال تغییر است ایکسو برای B - پارامتر در. در این مورد، به جای ماتریس ‖a ij‖، بازی با تابعی از دو آرگومان پیوسته در حال تغییر تعیین می شود. a (x, y)، که آن را تابع payoff می نامیم (توجه داشته باشید که خود تابع a (x, y)لازم نیست پیوسته باشد). تابع برد a (x، y)را می توان به صورت هندسی با مقداری سطح نشان داد a (x, y)بالای ناحیه تغییر آرگومان (x، y)(شکل 7.1)

تجزیه و تحلیل تابع سود a (x، y)مشابه تجزیه و تحلیل ماتریس پرداخت انجام می شود. ابتدا قیمت پایین‌تر بازی α یافت می‌شود. زیرا این برای هر کدام تعیین می شود ایکسحداقل عملکرد a (x، y)برای همه در:، سپس حداکثر این مقادیر برای همه جستجو می شود ایکس(حداکثر):

قیمت بالای بازی (مینیمکس) به طور مشابه تعریف شده است:

موردی را در نظر بگیرید که α = β. از آنجایی که قیمت بازی ν همیشه بین α و β است، ارزش کل آنها ν است. برابری α = β به این معنی است که سطح a (x، y)یک نقطه زین دارد، یعنی چنین نقطه ای با مختصات x 0، y 0، که در آن a (x، y)در عین حال حداقل است درو حداکثر ایکس(شکل 7.2).

معنی a (x، y)در این مرحله قیمت بازی ν: ν = است a (x 0، y 0).وجود نقطه زینی به این معنی است که این بازی بی نهایت یک راه حل استراتژی خالص دارد. x 0، y 0استراتژی های خالص بهینه A و B هستند. در حالت کلی، زمانی که α ≠ β، بازی فقط می تواند راه حلی در منطقه استراتژی های ترکیبی داشته باشد (شاید تنها راه حل نباشد). استراتژی ترکیبی برای بازی های بی نهایت دارای توزیع احتمالی برای استراتژی ها است ایکسو دربه عنوان متغیرهای تصادفی در نظر گرفته می شود. این توزیع می تواند پیوسته باشد و با چگالی تعیین شود f 1 (ایکس)و f 2 (y); می‌تواند گسسته باشد، و سپس استراتژی‌های بهینه شامل مجموعه‌ای از استراتژی‌های خالص منفرد است که با برخی احتمالات غیر صفر انتخاب شده‌اند.

در شرایطی که بازی بی نهایت نقطه زینی نداشته باشد، می توان یک تفسیر هندسی بصری از قیمت های پایین و بالای بازی ارائه داد. یک بازی بی نهایت با عملکرد بازده را در نظر بگیرید a (x، y)و استراتژی ها x، y، به طور مداوم بخش های محورها را پر می کند (x 1، x 2)و (در 1، در 2). برای تعیین قیمت پایین تر بازی α، باید به سطح "نگاه" کنیم a (x، y)از کنار محور در، یعنی آن را صاف طرح کنید هوآ(شکل 7.3). ما یک شکل مشخص را از طرفین با خطوط مستقیم x \u003d x 1 و x \u003d x 2 و از بالا و پایین - با منحنی های K B و K N محدود می کنیم. بدیهی است که قیمت پایین تر بازی α چیزی بیشتر نیست. از حد اکثر منحنی K H.

به طور مشابه، برای پیدا کردن قیمت بالای بازی β، باید به سطح "نگاه کرد". a (x، y)از کنار محور ایکس(یک سطح را روی یک صفحه قرار دهید uOa) و حداقل مختصات مرز بالایی K B برجستگی را پیدا کنید (شکل 7.4).

دو مثال ابتدایی از بازی های بی نهایت را در نظر بگیرید.

مثال 1بازیکنان A و B هر کدام مجموعه ای غیرقابل شمارش از استراتژی های ممکن دارند ایکسو درو 0 ≤ x ≤ 1; 0 ≤ y ≤ 1. تابع سود برای a با عبارت a (x, y) - (x - y) 2 داده می شود. راه حلی برای بازی پیدا کنید.

راه حل: سطح a(x,y) یک استوانه سهموی است (شکل 7.5) و نقطه زینی ندارد. بیایید قیمت کمتر بازی را تعیین کنیم. بدیهی است برای همه ایکس; بنابراین = 0. اجازه دهید قیمت بالای بازی را تعیین کنیم. برای انجام این کار، ما برای یک ثابت پیدا می کنیم در

در این حالت، ماکزیمم همیشه در مرز بازه به دست می آید (زمانی که x = 0 یا x = 1)، یعنی. برابر است با مقادیر y 2 . (1 - y) 2 که بزرگتر است. بیایید نمودارهای این توابع را به تصویر بکشیم (شکل 7.6)، یعنی. پیش بینی سطح a (x، y)به هواپیما uOa. خط پررنگ در شکل 7.6 عملکرد را نشان می دهد. بدیهی است که حداقل مقدار آن در y = 1/2 به دست می آید و برابر با 1/4 است. بنابراین، هزینه بالای بازی β = 1/4 است. در این حالت قیمت بالای بازی با قیمت بازی ν مطابقت دارد. در واقع، بازیکن A می تواند یک استراتژی ترکیبی S A = را اعمال کند ، که در آن مقادیر افراطی x = 0 و x = 1 با فرکانس های یکسان گنجانده شده اند. سپس، برای هر استراتژی، میانگین بازده بازیکن B برای بازیکن A خواهد بود: ½ سال 2 + ½ (1 - سال) 2. بررسی اینکه این مقدار برای هر مقداری آسان است دربین 0 و 1 مقداری کمتر از ¼ ندارد: ½ y 2 + ½ (1 - y) 2 ≥ ¼.

بنابراین، بازیکن A، با استفاده از این استراتژی ترکیبی، می‌تواند برای خود سودی برابر با قیمت بالای بازی تضمین کند. از آنجایی که قیمت بازی نمی تواند بیشتر از قیمت بالا باشد، این استراتژی S A بهینه است: S A = S A *.

باقی مانده است که استراتژی بهینه بازیکن B را پیدا کنیم. بدیهی است که اگر قیمت بازی ν برابر با قیمت بالای بازی β باشد، استراتژی بهینه بازیکن B همیشه استراتژی حداقلی خالص او خواهد بود که به او تضمین می کند قیمت بالای بازی در این مورد، چنین استراتژی y 0 = ½ است. در واقع، با این استراتژی، مهم نیست که بازیکن A چه کاری انجام دهد، سود او بیشتر از ¼ نخواهد بود. این از نابرابری آشکار (x - ½) 2 = x (x -1) + ¼ ≤ ¼ نتیجه می شود

مثال 2طرف A ("ما") به سمت هواپیمای دشمن B شلیک می کند. برای فرار از گلوله باران، دشمن می تواند با مقداری اضافه بار مانور دهد در، که او به صلاحدید خود می تواند ارزش هایی را از آن ضمیمه کند در= 0 (حرکت مستقیم) تا در = درحداکثر(پرواز در امتداد دایره ای با حداکثر انحنا). ما فرض می کنیم درحداکثرواحد اندازه گیری، یعنی بگذاریم درحداکثر= 1. در مبارزه با دشمن، می توانیم از مناظر بر اساس یک فرضیه در مورد حرکت هدف در طول پرواز پرتابه استفاده کنیم. اضافه بار ایکسدر این مانور فرضی را می توان برابر با هر مقدار از 0 تا 1 فرض کرد. وظیفه ما ضربه زدن به دشمن است. وظیفه دشمن این است که شکست نخورده بماند. احتمال شکست داده ها ایکسو درتقریباً با فرمول a(x,y) = بیان می شود , جایی که در- اضافه بار اعمال شده توسط دشمن؛ x - اضافه بار، در نظر گرفته شده است. تعیین استراتژی های بهینه برای هر دو طرف الزامی است.

راه حل. بدیهی است که اگر p = 1 را تنظیم کنیم، راه حل بازی تغییر نمی کند. تابع payoff a (x، y)با سطح نشان داده شده در شکل نشان داده شده است. 7.7.

این یک سطح استوانه ای است که مولدهای آن موازی با نیمساز زاویه مختصات هستند. هویو مقطع توسط صفحه عمود بر ژنراتیکس منحنی از نوع منحنی توزیع نرمال است. با استفاده از تفسیر هندسی قیمت پایین و بالای بازی پیشنهاد شده در بالا، β = 1 (شکل 7.8) و (شکل 7.9) را پیدا می کنیم. بازی نقطه زینی ندارد. راه حل را باید در حوزه استراتژی های ترکیبی جستجو کرد. مشکل تا حدودی شبیه مشکل مثال قبلی است. در واقع، برای مقادیر کوچک کتابع مانند یک تابع رفتار می کند – (x – y) 2و اگر در حل مثال قبل، نقش بازیکنان A و B معکوس شود، راه حل بازی به دست می آید. آن ها استراتژی بهینه ما استراتژی خالص x = 1/2 خواهد بود و استراتژی بهینه حریف S B = استفاده از استراتژی های افراطی y = 0 و y = 1 با فرکانس یکسان خواهد بود. این بدان معنی است که ما همیشه باید از دامنه استفاده کنیم. محاسبه شده برای اضافه بار x = 1/2، و دشمن باید در نیمی از موارد به هیچ وجه از مانور استفاده نکند و در نیمی از حداکثر مانور ممکن استفاده کند.

برنج. 7.8 شکل. 7.9.

به راحتی می توان ثابت کرد که این راه حل برای k ≤ 2 معتبر خواهد بود. در واقع، میانگین بازده برای استراتژی حریف S B = و برای استراتژی ما است. ایکستوسط تابع بیان می شود , که برای مقادیر k ≤ 2 دارای یک حداکثر در x = 1/2 است که برابر با قیمت پایین‌تر بازی α است. بنابراین، استفاده از استراتژی S B ضرری بیشتر از α را برای حریف تضمین می کند، که از آن مشخص است که α - هزینه کمتر بازی - قیمت بازی ν است.

برای k > 2، تابع a(x) دارای دو ماکزیمم است (شکل 7.10) که به طور متقارن در حدود x = 1/2 در نقاط x 0 و 1 - x 0 قرار دارند و مقدار x 0 به k بستگی دارد.

بدیهی است، در ک\u003d 2 x 0 \u003d 1 - x 0 \u003d ½; با افزایش کنقاط x 0 و 1 - x 0 از هم دور می شوند و به نقاط انتهایی (0 و 1) نزدیک می شوند. بنابراین، راه حل بازی به k بستگی دارد. بیایید یک مقدار خاص k را تعیین کنیم، به عنوان مثال k = 3، و یک راه حل برای بازی پیدا کنیم. برای این کار، آبسیسا x 0 حداکثر منحنی a(x) را تعیین می کنیم. با برابر کردن مشتق تابع a(x) با صفر، معادله ای برای تعیین x 0 می نویسیم:

این معادله دارای سه ریشه است: x \u003d 1/2 (که در آن به حداقل رسیده است) و x 0، 1 - x 0، جایی که به حداکثر می رسد. با حل عددی معادله، تقریباً x 0 ≈ 0.07 را پیدا می کنیم. 1 - x 0 ≈ 0.93.

اجازه دهید ثابت کنیم که راه حل بازی در این مورد، جفت استراتژی زیر است:

با استراتژی ما و دشمن درمتوسط ​​بازده است

حداقل a 1 (y) را در 0 پیدا کنید< у < 1. Функция a 1 (y) симметрична относительно y = 1/2 и может иметь только один или два максимума; ее минимум, во всяком случае, достигается либо в середине отрезка (0, 1), либо на его концах. Полагая у = 0 (или у = 1), найдем

با تنظیم y = 1/2، دریافت می کنیم

که بزرگتر از 1 (0) است؛ بنابراین، قیمت بازی کمتر از 1 (0) نیست:

حال فرض کنید که حریف از استراتژی S B * استفاده می کند و ما از استراتژی x استفاده می کنیم. سپس میانگین بازده خواهد بود

اما ما دقیقاً x 0 را انتخاب کرده ایم تا در x = x 0 حداکثر عبارت (7.2) به دست آید. در نتیجه،

آن ها حریف با استفاده از استراتژی S B * می تواند از ضرر بیشتر از 0.530 جلوگیری کند. بنابراین، ν = 0.530 قیمت بازی است و استراتژی های S A * و S B * راه حل را ارائه می دهند. یعنی باید از دید با 0.07 = x و 0.93 x = با فرکانس یکسان استفاده کنیم و دشمن نباید با همان فرکانس مانور دهد و با حداکثر اضافه بار مانور دهد.

توجه داشته باشید که بازده ν = 0.530 به طور قابل توجهی بزرگتر از قیمت پایین بازی است ، که می‌توانیم با اعمال استراتژی حداکثری x 0 = 1/2 برای خودمان فراهم کنیم.

یکی از راه های عملی برای حل بازی های بی نهایت، کاهش تقریبی آن ها به محدود است. در این مورد، طیف وسیعی از استراتژی های ممکن برای هر بازیکن به طور مشروط در یک استراتژی ترکیب می شود. به این ترتیب البته فقط می توان به یک راه حل تقریبی از بازی دست یافت، اما در اکثر موارد نیازی به راه حل دقیق نیست.

با این حال، باید در نظر داشت که هنگام استفاده از این ترفند، راه‌حل‌هایی در منطقه استراتژی‌های مختلط ممکن است حتی در مواردی که حل بازی بی‌نهایت اصلی در استراتژی‌های خالص امکان‌پذیر باشد، ظاهر شوند، یعنی: زمانی که بازی بی نهایت یک نقطه زین دارد. اگر با تقلیل یک بازی نامتناهی به یک بازی متناهی، یک راه حل ترکیبی به دست آید که فقط شامل دو استراتژی "مفید" همسایه باشد، منطقی است که سعی کنیم استراتژی خالص بازی بی نهایت اصلی را بین آنها اعمال کنیم.

در خاتمه، متذکر می شویم که برخلاف بازی های محدود، بازی های بی نهایت ممکن است راه حلی نداشته باشند. بیایید یک مثال از یک بازی بی نهایت بیاوریم که راه حلی ندارد. دو بازیکن هر کدام یک عدد صحیح را نام می برند. کسی که عدد بزرگتر را نامیده است 1 روبل از دیگری دریافت می کند. اگر هر دو با یک شماره تماس بگیرند، بازی با تساوی به پایان می رسد. بدیهی است که بازی راه حلی ندارد. با این حال، کلاس‌هایی از بازی‌های بی‌نهایت وجود دارند که مطمئناً راه‌حلی برای آنها وجود دارد.

برای کسی که در سیاست متخصص نیست، بروس بوئنو دی مسکیتا از دانشگاه نیویورک اتفاقات بسیار دقیقی را رقم می زند. او با دقت چند ماهه توانست خروج پرویز مشرف از سمت خود را پیش بینی کند. او 5 سال قبل از مرگ آیت‌الله خمینی را دقیقاً به عنوان رهبر ایران معرفی کرد. وقتی از او می پرسند راز چیست، او پاسخ می دهد که پاسخ را نمی داند - بازی او را می شناسد. بازی در اینجا به معنای یک روش ریاضی است که در ابتدا برای شکل‌گیری و تجزیه و تحلیل استراتژی‌های بازی‌های مختلف، یعنی نظریه بازی، ایجاد شده است. در اقتصاد، بیشتر مورد استفاده قرار می گیرد. اگرچه در ابتدا برای ساخت و تجزیه و تحلیل استراتژی‌ها در بازی‌های مورد استفاده برای سرگرمی طراحی شده بود.

نظریه بازی یک دستگاه عددی است که به شما امکان می دهد سناریو یا به طور دقیق تر، احتمال سناریوهای مختلف رفتار یک سیستم یا "بازی" را که توسط عوامل مختلف کنترل می شود محاسبه کنید. این عوامل به نوبه خود توسط تعداد معینی از "بازیکنان" تعیین می شود.

بنابراین، نظریه بازی، که انگیزه اصلی توسعه در اقتصاد را دریافت کرد، می تواند در زمینه های مختلف فعالیت های انسانی به کار رود. هنوز خیلی زود است که بگوییم این برنامه ها برای حل درگیری های نظامی مورد استفاده قرار خواهند گرفت، اما در آینده کاملاً واقع بینانه است.

از وبلاگ معروف آمریکایی کرک شده.

تئوری بازی همه چیز در مورد یادگیری نحوه انجام بهترین حرکت است و با جدا کردن برخی از آن از سایر بازیکنان، بزرگترین تکه پای ممکن را به دست آورید. این به شما می آموزد که بسیاری از عوامل را تجزیه و تحلیل کنید و نتایج منطقی وزن بگیرید. به نظر من باید بعد از اعداد و قبل از حروف الفبا مطالعه شود. صرفاً به این دلیل که افراد زیادی بر اساس شهود، پیشگویی های پنهانی، همسویی ستارگان و مواردی از این دست تصمیمات مهمی می گیرند. من تئوری بازی ها را به دقت مطالعه کرده ام و اکنون می خواهم در مورد اصول اولیه آن به شما بگویم. شاید این امر عقل سلیم را به زندگی شما اضافه کند.

1. دوراهی زندانی

برتو و رابرت پس از ناکامی در استفاده صحیح از ماشین دزدیده شده برای فرار به دلیل سرقت از بانک دستگیر شدند. پلیس نمی تواند ثابت کند که آنها کسانی بودند که از بانک سرقت کردند، اما آنها را در یک ماشین سرقتی دستگیر کردند. آنها را به اتاق های مختلف بردند و به هر کدام پیشنهاد دادند که یک همدست را تحویل دهند و او را به مدت 10 سال به زندان بفرستند و خودش آزاد شود. اما اگر هر دو به یکدیگر خیانت کنند، هر کدام 7 سال می گیرند. اگر کسی چیزی نگوید هر دو 2 سال فقط به خاطر دزدی ماشین می نشینند.

معلوم می شود که اگر برتو ساکت باشد، اما رابرت به او خیانت کند، برتو 10 سال به زندان می رود و رابرت آزاد می شود.

هر زندانی یک بازیکن است و سود هر یک را می توان به عنوان یک "فرمول" نشان داد (آنچه هر دو به دست می آورند، آنچه که دیگری به دست می آورد). به عنوان مثال، اگر من به شما ضربه بزنم، طرح برنده من به این شکل می شود (من یک برد خشن می گیرم، شما درد زیادی دارید). از آنجایی که هر زندانی دو گزینه دارد، می توانیم نتایج را در جدولی ارائه کنیم.

کاربرد عملی: تشخیص جامعه شناسی

در اینجا کاربرد اصلی نظریه بازی ها را می بینیم: شناسایی افراد اجتماعی که فقط به خود فکر می کنند.تئوری بازی واقعی یک ابزار تحلیلی قدرتمند است و آماتوریسم اغلب به عنوان یک پرچم قرمز عمل می کند، با یک سر که به شخص خالی از شرافت خیانت می کند. افراد شهودی فکر می‌کنند که بهتر است زشت باشیم، زیرا بدون توجه به آنچه بازیکن دیگر انجام می‌دهد، حبس کوتاه‌تری در پی خواهد داشت. از نظر فنی، این درست است، اما فقط در صورتی که فردی کوته فکر باشید که اعداد را بالاتر از جان انسان ها قرار می دهد. به همین دلیل است که نظریه بازی ها در امور مالی بسیار محبوب است.

مشکل واقعی Prisoner's Dilemma این است که داده ها را نادیده می گیرد.به عنوان مثال، امکان ملاقات شما با دوستان، اقوام یا حتی طلبکاران فردی را که به مدت 10 سال در زندان قرار داده اید، در نظر نمی گیرد.

بدتر از همه، هرکسی که درگیر معضل زندانی است طوری رفتار می کند که انگار هرگز آن را نشنیده است.

و بهترین حرکت این است که سکوت کنید و در دو سال با یک دوست خوب از پول مشترک استفاده کنید.

2. استراتژی غالب

این موقعیتی است که در آن اقدامات شما بدون توجه به اقدامات حریف شما بیشترین سود را به همراه دارد.هر اتفاقی بیفتد، شما همه چیز را درست انجام دادید. به همین دلیل است که بسیاری از افراد در معضل زندانی معتقدند که خیانت بدون توجه به آنچه طرف مقابل انجام می دهد به "بهترین" نتیجه می رسد و ناآگاهی از واقعیت ذاتی این روش باعث می شود همه چیز فوق العاده ساده به نظر برسد.

اکثر بازی‌هایی که انجام می‌دهیم استراتژی‌های کاملاً غالبی ندارند زیرا در غیر این صورت وحشتناک خواهند بود. تصور کنید که شما همیشه همین کار را انجام می دهید. هیچ استراتژی غالبی در بازی سنگ-کاغذ-قیچی وجود ندارد. اما اگر با فردی بازی می‌کردید که دستکش‌های تنور به تن داشت و فقط می‌توانست سنگ یا کاغذ را نشان دهد، استراتژی غالب را خواهید داشت: کاغذ. کاغذ شما سنگ او را می پیچد یا منجر به یک تساوی می شود و شما نمی توانید ببازید زیرا حریف شما نمی تواند قیچی نشان دهد. اکنون که شما یک استراتژی مسلط دارید، یک احمق می خواهد هر چیز دیگری را امتحان کند.

3. نبرد بین دو جنس

بازی ها زمانی جالب تر می شوند که استراتژی کاملاً غالبی نداشته باشند. مثلاً نبرد بین دو جنس. آنجلی و بوریسلاو قرار ملاقات می گذارند اما نمی توانند بین باله و بوکس تصمیم بگیرند. انجلی مشت زنی را دوست دارد، زیرا دوست دارد جریان خون را ببیند تا جمعیت فریاد زده تماشاگرانی که فکر می کنند متمدن هستند فقط به این دلیل که برای سر شکسته یک نفر پول داده اند، ببیند.

بوریسلاو می‌خواهد باله تماشا کند زیرا می‌داند که بالرین‌ها آسیب‌های زیادی را پشت سر می‌گذارند و سخت‌ترین تمرین‌ها را پشت سر می‌گذارند، زیرا می‌دانند که یک مصدومیت می‌تواند به همه چیز پایان دهد. رقصندگان باله بزرگترین ورزشکاران روی زمین هستند. یک بالرین ممکن است به سر شما لگد بزند، اما هرگز این کار را نخواهد کرد، زیرا ارزش پای او بسیار بیشتر از صورت شماست.

هر کدام می خواهند به فعالیت مورد علاقه خود بروند، اما نمی خواهند به تنهایی از آن لذت ببرند، بنابراین طرح برنده آنها این است: بالاترین ارزش انجام کاری است که از آن لذت می برند، کمترین ارزش فقط بودن با شخص دیگری است و صفر تنها بودن است.

برخی از افراد توصیه می کنند سرسختانه در آستانه جنگ تعادل برقرار کنید: اگر کاری را که می خواهید انجام دهید، مهم نیست که چه باشد، طرف مقابل باید مطابق با انتخاب شما باشد یا همه چیز را از دست بدهد. همانطور که قبلاً گفتم، تئوری بازی های ساده شده در تشخیص احمق ها عالی است.

کاربرد عملی: از گوشه های تیز خودداری کنید

البته این استراتژی ایرادات قابل توجهی نیز دارد. اول از همه، اگر با قرارهای خود مانند یک "نبرد جنسیت ها" رفتار کنید، کارساز نخواهد بود. جدا کنید تا هر کدام از شما فردی را که دوست دارد پیدا کنید. و مشکل دوم این است که در این شرایط شرکت کنندگان آنقدر نسبت به خود نامطمئن هستند که نمی توانند این کار را انجام دهند.

یک استراتژی واقعاً برنده برای همه این است که آنچه را که می خواهند انجام دهند،و بعد یا روز بعد که آزاد شدند با هم به کافه می روند. یا به طور متناوب بین بوکس و باله تا زمانی که دنیای سرگرمی متحول شود و باله بوکس اختراع شود.

4. تعادل نش

تعادل نش مجموعه‌ای از حرکات است که در آن هیچ‌کس نمی‌خواهد کاری را متفاوت انجام دهد.و اگر بتوانیم آن را عملی کنیم، نظریه بازی ها جایگزین کل سیستم فلسفی، مذهبی و مالی روی کره زمین خواهد شد، زیرا "میل به شکست نخوردن" به نیروی محرکه ای قدرتمندتر از آتش برای بشریت تبدیل شده است.

بیایید 100 دلار را سریع تقسیم کنیم. من و شما تصمیم می گیریم از این صدها چه تعداد مطالبه کنیم و در عین حال مبلغ را اعلام می کنیم. اگر مجموع ما کمتر از صد باشد، هرکس به خواسته خود می رسد. اگر مجموع آنها بیش از صد باشد، کسی که کمترین مقدار را درخواست کرده است، مقدار مورد نظر را دریافت می کند، در حالی که فرد حریص تر، آنچه را که باقی مانده است، دریافت می کند. اگر همین مقدار را بخواهیم، ​​هر کدام 50 دلار می گیرند. چقدر خواهی پرسید؟ چگونه پول را تقسیم خواهید کرد؟ تنها یک حرکت برنده وجود دارد.

شرط 51 دلاری بدون توجه به انتخاب حریف، حداکثر مقدار را به شما می دهد. اگر او بیشتر بخواهد، 51 دلار دریافت خواهید کرد. اگر او 50 یا 51 دلار بخواهد، 50 دلار دریافت خواهید کرد. و اگر کمتر از 50 دلار درخواست کند، 51 دلار دریافت خواهید کرد. در هر صورت هیچ گزینه دیگری غیر از این گزینه برای شما پول بیشتری به همراه ندارد. تعادل نش موقعیتی است که در آن هر دو 51 دلار را انتخاب می کنیم.

کاربرد عملی: اول فکر کن

این تمام نکته تئوری بازی هاست. شما مجبور نیستید برنده شوید، چه برسد به اینکه به بازیکنان دیگر آسیب برسانید، اما باید بهترین حرکت را برای خود انجام دهید، مهم نیست که دیگران چه چیزی برای شما در نظر گرفته اند. و حتی بهتر است اگر این حرکت برای سایر بازیکنان مفید باشد. این یک نوع ریاضیات است که می تواند جامعه را تغییر دهد.

یک نوع جالب از این ایده نوشیدن است که می توان آن را تعادل نش با وابستگی زمانی نامید. وقتی به اندازه کافی مشروب می خورید، به کارهای دیگران اهمیتی نمی دهید، مهم نیست که آنها چه می کنند، اما روز بعد واقعاً پشیمان می شوید که خلاف آن را انجام نداده اید.

5. بازی پرتاب

بازیکن 1 و بازیکن 2 در پرتاب شرکت می کنند.هر بازیکن به طور همزمان سر یا دم را انتخاب می کند. اگر درست حدس بزنند، بازیکن 1 پنی بازیکن 2 را دریافت می کند و اگر این کار را نکنند، بازیکن 2 سکه بازیکن 1 را دریافت می کند.

ماتریس برنده ساده است...

... استراتژی بهینه: بازی کاملاً تصادفی.سخت تر از آن چیزی است که فکر می کنید، زیرا انتخاب باید کاملا تصادفی باشد. اگر ترجیحی برای سر یا دم دارید، حریف می تواند از آن برای گرفتن پول شما استفاده کند.

البته مشکل اصلی اینجاست که اگر فقط یک پنی به طرف هم پرتاب کنند خیلی بهتر است. در نتیجه، سود آنها یکسان خواهد بود و آسیب های ناشی از آن می تواند به این افراد بدبخت کمک کند چیزی غیر از کسالت وحشتناک را احساس کنند. به هر حال، این بدترین بازی تاریخ است. و این مدل عالی برای ضربات پنالتی است.

کاربرد عملی: جریمه

در فوتبال، هاکی و بسیاری از بازی های دیگر، وقت اضافه یک ضربات پنالتی است. و اگر بر اساس تعداد دفعاتی باشد که بازیکنان در فرم کامل می توانند "چرخ" را انجام دهند، جالب تر خواهند بود، زیرا این حداقل نشان دهنده توانایی های بدنی آنها خواهد بود و تماشای آن سرگرم کننده خواهد بود. دروازه بان ها نمی توانند حرکت توپ یا پوک را در همان ابتدای حرکت خود به وضوح تعیین کنند، زیرا متأسفانه ربات ها هنوز در ورزش ما شرکت نمی کنند. دروازه بان باید جهت چپ یا راست را انتخاب کند و امیدوار باشد که انتخاب او با انتخاب حریفی که به دروازه ضربه می زند همزمان باشد. شباهتی با بازی سکه دارد.

البته توجه داشته باشید که این مثال کاملی از شباهت به سر و دم نیست، زیرا حتی با جهت گیری صحیح، دروازه بان ممکن است توپ را نگیرد و مهاجم گل را از دست بدهد.

پس نتیجه گیری ما بر اساس تئوری بازی ها چیست؟ بازی‌های توپ باید به شیوه‌ای «چند توپی» به پایان برسد، جایی که در هر دقیقه یک توپ/پاک اضافی به بازیکنان داده می‌شود تا زمانی که هر یک از طرفین به نتیجه مشخصی دست یابند که نشان‌دهنده مهارت واقعی بازیکنان باشد، و یک تصادف نمایشی نیست

بالاخره باید از تئوری بازی ها استفاده کرد تا بازی هوشمندتر شود. و این یعنی بهتر.

از ویکیپدیا، دانشنامه آزاد

    1 داستان

    2 ارائه بازی

    • 2.1 فرم گسترده

      2.2 فرم معمولی

      2.3 عملکرد مشخصه

    3 کاربرد نظریه بازی ها

    • 3.1 توضیحات و مدلسازی

      3.2 تحلیل هنجاری (شناسایی بهترین رفتار)

    4 انواع بازی

    • 4.1 تعاونی و غیر تعاونی

      4.2 متقارن و نامتقارن

      4.3 مجموع صفر و مجموع غیرصفر

      4.4 موازی و سریال

      4.5 با اطلاعات کامل یا ناقص

      4.6 بازی هایی با تعداد بی نهایت مرحله

      4.7 بازی های گسسته و پیوسته

      4.8 متاگیم ها

نظریه بازی- یک روش ریاضی برای مطالعه بهینه استراتژی هاکه در بازی ها. بازی به عنوان فرآیندی درک می شود که در آن دو یا چند طرف شرکت می کنند و برای تحقق منافع خود می جنگند. هر طرف هدف خود را دارد و از استراتژی هایی استفاده می کند که بسته به رفتار سایر بازیکنان می تواند منجر به برد یا باخت شود. تئوری بازی به انتخاب بهترین استراتژی ها با در نظر گرفتن ایده های مربوط به سایر شرکت کنندگان کمک می کند منابعو اقدامات احتمالی آنها

نظریه بازی یک بخش است ریاضیات کاربردی، دقیق تر - تحقیق در عملیات. اغلب از روش های تئوری بازی ها استفاده می شود اقتصاد، در دیگران کمی کمتر است علوم اجتماعی-جامعه شناسی,علوم سیاسی,روانشناسی,اخلاقو دیگران. شروع با دهه 1970سال، او به فرزندی پذیرفته شد زیست شناسانبرای مطالعه رفتار حیوانات و نظریه های تکامل. از اهمیت بالایی برخوردار است هوش مصنوعیو سایبرنتیک، به خصوص با علاقه به عوامل هوشمند.

تاریخچه تحقیق در نظریه بازی ها

راه‌حل‌ها یا استراتژی‌های بهینه در مدل‌سازی ریاضی در اوایل قرن هجدهم پیشنهاد شدند. مشکلات تولید و قیمت گذاری در شرایط انحصار چندجانبهکه بعدها به نمونه های کتاب درسی نظریه بازی تبدیل شد، در قرن نوزدهم مورد توجه قرار گرفت. الف. کورنوو جی برتراند. در آغاز قرن XX. ای.لاسکر E. Zermelo، E. Borel ایده یک نظریه ریاضی تضاد منافع را مطرح کردند.

نظریه بازی های ریاضی از اقتصاد نئوکلاسیک. برای اولین بار، جنبه های ریاضی و کاربردهای نظریه در کتاب کلاسیک ارائه شد 1944جان فون نویمانو اسکار مورگنسترنتئوری بازی و رفتار اقتصادی (انگلیسیتئوری از بازی ها و اقتصادی رفتار - اخلاق).

این حوزه از ریاضیات بازتابی در فرهنگ عمومی پیدا کرده است. AT 1998آمریکایینویسندهو روزنامه نگارسیلویا نظرکتابی منتشر کرد در مورد سرنوشت جان نش,و دانشمند در زمینه نظریه بازی ها; و در 2001 بر اساس این کتاب فیلمی ساخته شد بازی ذهن". برخی از برنامه های تلویزیونی آمریکایی مانند " دوست یا دشمن"، "نام مستعار"، یا "NUMB3RS"، به طور دوره ای به این نظریه در قسمت های خود اشاره می کنند.

جی. نشدر سال 1949 پایان نامه ای در مورد نظریه بازی ها می نویسد و پس از 45 سال جایزه نوبل اقتصاد را دریافت می کند. جی. نشپس از فارغ التحصیلی از موسسه پلی تکنیک کارنگی با دو دیپلم - لیسانس و فوق لیسانس - وارد شد. دانشگاه پرینستونجایی که در سخنرانی ها شرکت می کرد جان فون نویمان. در نوشته هایش جی. نشاصول "دینامیک مدیریت" را توسعه داد. اولین مفاهیم نظریه بازی ها مورد تجزیه و تحلیل قرار گرفت بازی های متضادوقتی بازنده ها و بازیکنانی هستند که با هزینه خود برنده شدند. نش روش های تحلیلی را توسعه می دهد که در آن همه شرکت کنندگان یا برنده می شوند یا می بازند. این موقعیت ها نامیده می شوند "تعادل نش"یا «تعادل غیرهمکاری»، در شرایطی که طرفین از استراتژی بهینه استفاده می کنند که منجر به ایجاد تعادل پایدار می شود. حفظ این تعادل برای بازیکنان مفید است، زیرا هر تغییری موقعیت آنها را بدتر می کند. این آثار جی. نشکمک جدی به توسعه تئوری بازی ها کرد، ابزارهای ریاضی مدل سازی اقتصادی تجدید نظر شدند. جی. نشنشان می دهد که رویکرد کلاسیک به رقابت A. اسمیت، زمانی که هر مردی برای خودش، نابهینه است. استراتژی‌های بهینه‌تر زمانی است که همه سعی می‌کنند برای خودشان بهتر عمل کنند در حالی که برای دیگران بهتر عمل کنند.

اگرچه نظریه بازی ها در ابتدا با مدل های اقتصادی سروکار داشت، تا دهه 1950 یک نظریه رسمی در ریاضیات باقی ماند. اما از دهه 1950 تلاش‌ها برای استفاده از روش‌های نظریه بازی‌ها نه تنها در اقتصاد، بلکه در زیست‌شناسی آغاز می‌شود. سایبرنتیک,تکنیک,مردم شناسی. در حین جنگ جهانی دومو بلافاصله پس از آن، ارتش به طور جدی به نظریه بازی ها علاقه مند شد که آن را ابزاری قدرتمند برای مطالعه تصمیمات استراتژیک می دانست.

در 1960-1970. با وجود نتایج ریاضی قابل توجهی که در آن زمان به دست آمده بود، علاقه به نظریه بازی ها در حال محو شدن است. از اواسط دهه 1980. استفاده عملی فعال از نظریه بازی ها، به ویژه در اقتصاد و مدیریت آغاز می شود. در طول 20 تا 30 سال گذشته، اهمیت نظریه بازی ها و علاقه به طور قابل توجهی افزایش یافته است، برخی از زمینه های نظریه اقتصادی مدرن را نمی توان بدون استفاده از نظریه بازی توصیف کرد.

سهم عمده ای در کاربرد نظریه بازی ها این کار بود توماس شلینگ,برنده جایزه نوبل اقتصاد 1384. «استراتژی تعارض». تی شلینگ «استراتژی»های مختلفی از رفتار شرکت کنندگان در تعارض را در نظر می گیرد. این استراتژی ها با تاکتیک های مدیریت تعارض و اصول تحلیل تعارض در همخوانی دارند تضاد شناسی(این یک رشته روانشناسی است) و در مدیریت تعارضات در یک سازمان (نظریه مدیریت). در روانشناسی و سایر علوم، واژه بازی به معانی دیگری غیر از ریاضیات به کار می رود. برخی از روانشناسان و ریاضیدانان در مورد استفاده از این اصطلاح در معانی دیگری که قبلاً توسعه یافته بود تردید دارند. مفهوم فرهنگی بازی در کار داده شد یوهان هویزینگاهومو لودنس(مقالاتی در مورد تاریخ فرهنگ)، نویسنده در مورد استفاده از بازی در عدالت، فرهنگ، اخلاق ... می گوید که بازی از خود شخص قدیمی تر است، زیرا حیوانات نیز بازی می کنند. مفهوم بازی در مفهوم پیدا می شود اریکا برن"بازی هایی که مردم انجام می دهند، افرادی که بازی می کنند." این‌ها بازی‌های صرفاً روان‌شناختی هستند تحلیل معاملاتی. مفهوم بازی توسط J.Hözing با تفسیر بازی در تئوری درگیری ها و نظریه ریاضی بازی ها متفاوت است. بازی ها همچنین برای آموزش در موارد تجاری، سمینارها استفاده می شوند G. P. Shchedrovitsky، بنیانگذار رویکرد سازمانی و فعالیتی. در دوران پرسترویکا در اتحاد جماهیر شوروی G. P. Shchedrovitskyبازی های زیادی را با مدیران شوروی گذراند. از نظر شدت روانی، ODI (بازی های سازمانی-فعالیتی) آنقدر قوی بودند که به عنوان یک کاتالیزور قدرتمند برای تغییرات در اتحاد جماهیر شوروی عمل کردند. اکنون در روسیه یک جنبش ODI وجود دارد. منتقدان به منحصر به فرد بودن مصنوعی ODI توجه می کنند. اساس ODI بود دایره متدولوژی مسکو (MMC).

نظریه بازی های ریاضی اکنون به سرعت در حال توسعه است، بازی های پویا در حال بررسی هستند. با این حال، دستگاه ریاضی نظریه بازی ها پرهزینه است . از آن برای کارهای مشروع استفاده می شود: سیاست، اقتصاد انحصارها و توزیع قدرت بازار، و غیره. تعدادی از دانشمندان مشهور شدند. برای کمک او به توسعه نظریه بازی، که فرآیندهای اجتماعی-اقتصادی را توصیف می کند. جی. نش، به لطف تحقیقات خود در تئوری بازی ها، به یکی از متخصصان برجسته در زمینه تبدیل شده است "جنگ سرد"، که مقیاس مشکلاتی را که تئوری بازی با آن سروکار دارد تایید می کند.

برندگان نوبل اقتصادبرای دستاوردها در زمینه تئوری بازی ها و تئوری اقتصادی: رابرت اومان,راینهارد سلتن,جان نش,جان هرسانی,ویلیام ویکری,جیمز میرلیز,توماس شلینگ,جورج آکرلوف,مایکل اسپنس,جوزف استیگلیتز,لئونید گورویتز,اریک ماسکین,راجر میرسون.


دانشگاه دولتی بلاروس

دانشکده اقتصاد

صندلی…

نظریه بازی ها و کاربرد آن در اقتصاد

پروژه دوره

دانشجوی سال دوم

بخش "مدیریت"

مشاور علمی

مینسک، 2010

1. مقدمه. صفحه 3

2. مفاهیم اساسی نظریه بازی ها ص.4

3. ارائه بازی ها صفحه 7

4. انواع بازی ها ص.9

5. کاربرد نظریه بازی ها در اقتصاد ص 14

6. مسائل کاربرد عملی در مدیریت ص21

7. نتیجه گیری ص23

فهرست مراجع صفحه 24

1. مقدمه

در عمل، اغلب هماهنگ کردن اقدامات شرکت ها، انجمن ها، وزارتخانه ها و سایر شرکت کنندگان در پروژه در مواردی که منافع آنها مطابقت ندارد ضروری می شود. در چنین شرایطی، تئوری بازی به شما امکان می دهد بهترین راه حل را برای رفتار شرکت کنندگانی که موظف به هماهنگی اقدامات در صورت تضاد منافع هستند، بیابید. نظریه بازی ها به طور فزاینده ای در عمل تصمیم گیری ها و تحقیقات اقتصادی نفوذ می کند. می توان آن را به عنوان ابزاری برای کمک به بهبود کارایی تصمیمات برنامه ریزی و مدیریت در نظر گرفت. این امر در حل مشکلات صنعت، کشاورزی، حمل و نقل، تجارت، به ویژه هنگام انعقاد قرارداد با شرکای خارجی در هر سطحی از اهمیت بالایی برخوردار است. بنابراین، می توان سطوح علمی کاهش قیمت خرده فروشی و سطح بهینه موجودی کالا را تعیین کرد، مشکلات خدمات گشت و گذار و انتخاب خطوط جدید حمل و نقل شهری، وظیفه برنامه ریزی رویه سازماندهی بهره برداری مواد معدنی را حل کرد. رسوبات در کشور و غیره. وظیفه انتخاب قطعه زمین برای محصولات کشاورزی به یک کلاسیک تبدیل شده است. از روش تئوری بازی ها می توان در بررسی های نمونه جمعیت های محدود، در آزمون فرضیه های آماری استفاده کرد.

نظریه بازی ها روشی ریاضی برای مطالعه استراتژی های بهینه در بازی ها است. بازی به عنوان فرآیندی درک می شود که در آن دو یا چند طرف شرکت می کنند و برای تحقق منافع خود می جنگند. هر طرف هدف خود را دارد و از استراتژی هایی استفاده می کند که بسته به رفتار سایر بازیکنان می تواند منجر به برد یا باخت شود. تئوری بازی به انتخاب بهترین استراتژی ها با در نظر گرفتن ایده های مربوط به سایر شرکت کنندگان، منابع و اقدامات احتمالی آنها کمک می کند.

نظریه بازی ها شاخه ای از ریاضیات کاربردی و به طور دقیق تر، تحقیق در عملیات است. اغلب، روش های نظریه بازی در اقتصاد استفاده می شود، کمی کمتر در سایر علوم اجتماعی - جامعه شناسی، علوم سیاسی، روانشناسی، اخلاق و دیگران. از دهه 1970، زیست شناسان برای مطالعه رفتار حیوانات و نظریه تکامل پذیرفته شدند. برای هوش مصنوعی و سایبرنتیک بسیار مهم است، به ویژه با تجلی علاقه به عوامل هوشمند.

نظریه بازی ها ریشه در اقتصاد نئوکلاسیک دارد. جنبه های ریاضی و کاربردهای این نظریه برای اولین بار در کتاب کلاسیک نظریه بازی ها و رفتار اقتصادی در سال 1944 توسط جان فون نویمان و اسکار مورگنسترن ارائه شد.

این حوزه از ریاضیات بازتابی در فرهنگ عمومی پیدا کرده است. در سال 1998، سیلویا نظر، نویسنده و روزنامه نگار آمریکایی، کتابی درباره سرنوشت جان نش، برنده جایزه نوبل اقتصاد و دانشمند در زمینه نظریه بازی ها منتشر کرد. و در سال 2001 بر اساس کتاب، فیلم یک ذهن زیبا ساخته شد. برخی از برنامه های تلویزیونی آمریکایی مانند "دوست یا دشمن"، "نام مستعار" یا "NUMB3RS" به طور دوره ای در قسمت های خود به این نظریه اشاره می کنند.

یک نسخه غیر ریاضی از نظریه بازی ها در آثار توماس شلینگ، برنده جایزه نوبل اقتصاد در سال 2005 ارائه شده است.

برندگان جایزه نوبل اقتصاد برای دستاوردها در زمینه نظریه بازی ها عبارتند از: رابرت اومان، راینهارد زلتن، جان نش، جان هارسانی، توماس شلینگ.

2. مفاهیم اساسی نظریه بازی

بیایید با مفاهیم اولیه تئوری بازی ها آشنا شویم. مدل ریاضی یک موقعیت درگیری را بازی، طرفین درگیر در تعارض را بازیکن و نتیجه درگیری را برد نامیده می‌شود. برای هر بازی رسمی، قوانینی معرفی می شوند، به عنوان مثال. سیستمی از شرایط که تعیین می کند: 1) گزینه هایی برای اقدامات بازیکنان. 2) حجم اطلاعات هر بازیکن در مورد رفتار شرکا. 3) بازدهی که هر مجموعه از اقدامات به آن منتهی می شود. به طور معمول، سود (یا ضرر) را می توان کمی تعیین کرد. به عنوان مثال، می توانید یک باخت را صفر، یک برد و یک تساوی را با ½ ارزیابی کنید.

یک بازی در صورتی که دو بازیکن در آن شرکت کنند یک بازی زوجی و اگر تعداد بازیکنان بیش از دو نفر باشد، چندگانه نامیده می شود.

یک بازی را یک بازی مجموع صفر یا آنتاگونیست می نامند، اگر سود یکی از بازیکنان برابر با ضرر دیگری باشد، یعنی برای انجام وظیفه بازی، کافی است مقدار یکی از آنها را نشان دهیم. آنها اگر a - سود یکی از بازیکنان، b - بازده دیگری را نشان دهیم، برای یک بازی با مجموع صفر b = -a، بنابراین کافی است که مثلاً a را در نظر بگیریم.

انتخاب و اجرای یکی از اقدامات پیش بینی شده توسط قوانین را حرکت بازیکن می نامند. حرکات می تواند شخصی و تصادفی باشد. یک حرکت شخصی، انتخاب آگاهانه یک بازیکن از یکی از اقدامات ممکن است (مثلاً حرکت در یک بازی شطرنج). یک حرکت تصادفی یک عمل انتخابی تصادفی است (به عنوان مثال، انتخاب یک کارت از یک عرشه درهم). در ادامه فقط حرکات شخصی بازیکنان را در نظر خواهیم گرفت.

استراتژی یک بازیکن مجموعه ای از قوانین است که بسته به موقعیت، انتخاب عمل او را برای هر حرکت شخصی تعیین می کند. معمولاً در طول بازی، در هر حرکت شخصی، بازیکن بسته به موقعیت خاص، انتخاب می کند. با این حال، در اصل ممکن است که تمام تصمیمات توسط بازیکن از قبل (در پاسخ به هر موقعیتی) گرفته شود. این بدان معنی است که بازیکن استراتژی خاصی را انتخاب کرده است که می تواند در قالب لیستی از قوانین یا یک برنامه ارائه شود. (بنابراین می توانید بازی را با استفاده از کامپیوتر انجام دهید). اگر هر بازیکن تعداد محدودی استراتژی داشته باشد، به یک بازی محدود گفته می شود و در غیر این صورت نامحدود است.

برای حل بازی یا یافتن راه حلی برای بازی، باید برای هر بازیکن استراتژی ای انتخاب کرد که شرایط بهینه را برآورده کند، یعنی. زمانی که دیگری به استراتژی خود پایبند باشد، یکی از بازیکنان باید حداکثر بازده را دریافت کند. در عین حال، اگر بازیکن اول به استراتژی خود پایبند باشد، بازیکن دوم باید حداقل باخت را داشته باشد. به چنین استراتژی هایی بهینه می گویند. استراتژی های بهینه نیز باید شرایط ثبات را برآورده کنند، یعنی برای هر یک از بازیکنان باید استراتژی خود را در این بازی رها کنند، سودآور نباشد.

اگر بازی به اندازه کافی تکرار شود، ممکن است بازیکنان علاقه ای به برد و باخت در هر بازی خاص نداشته باشند، بلکه به میانگین برد (باخت) در همه بازی ها علاقه مند باشند.

هدف تئوری بازی ها تعیین استراتژی بهینه برای هر بازیکن است. هنگام انتخاب استراتژی بهینه، طبیعی است که فرض کنیم هر دو بازیکن از نقطه نظر علایق خود رفتار معقولی دارند. مهمترین محدودیت تئوری بازی ها طبیعی بودن بازده به عنوان معیار کارایی است، در حالی که در اکثر مسائل واقعی اقتصادی بیش از یک معیار کارایی وجود دارد. علاوه بر این، در اقتصاد، به عنوان یک قاعده، وظایفی وجود دارد که در آن منافع شرکا لزوماً متضاد نیست.

3. ارائه بازی ها

بازی ها اشیاء ریاضی کاملاً تعریف شده هستند. بازی توسط بازیکنان تشکیل می شود، مجموعه ای از استراتژی ها برای هر بازیکن، و نشانه ای از بازده یا بازده بازیکنان برای هر ترکیبی از استراتژی ها. بیشتر بازی های مشارکتی با یک عملکرد مشخص توصیف می شوند، در حالی که برای انواع دیگر، شکل معمولی یا گسترده بیشتر استفاده می شود.

فرم گسترده

بازی "اولتیماتوم" در فرم گسترده

بازی‌ها به شکل گسترده یا توسعه‌یافته به‌عنوان یک درخت هدایت‌شده نشان داده می‌شوند که در آن هر رأس مربوط به موقعیتی است که بازیکن استراتژی خود را انتخاب می‌کند. به هر بازیکن یک سطح کامل از رئوس اختصاص داده می شود. پرداخت ها در پایین درخت، زیر هر رأس برگ ثبت می شود.

تصویر سمت چپ یک بازی برای دو بازیکن است. بازیکن 1 ابتدا حرکت می کند و استراتژی F یا U را انتخاب می کند. بازیکن 2 موقعیت خود را تجزیه و تحلیل می کند و تصمیم می گیرد که استراتژی A یا R را انتخاب کند. به احتمال زیاد، بازیکن اول U را انتخاب می کند و دومی - A (برای هر یک از آنها استراتژی های بهینه هستند. ) سپس به ترتیب 8 و 2 امتیاز دریافت خواهند کرد.

شکل گسترده بسیار گویا است، به ویژه نمایش بازی با بیش از دو بازیکن و بازی با حرکات متوالی راحت است. اگر شرکت کنندگان حرکات همزمان انجام دهند، رئوس مربوطه یا با یک خط نقطه به هم متصل می شوند یا با یک خط ثابت مشخص می شوند.

فرم معمولی

بازیکن 2
استراتژی 1

بازیکن 2
استراتژی 2

بازیکن 1
استراتژی 1

4 , 3

1 , –1

بازیکن 1
استراتژی 2

0 , 0

3 , 4

فرم معمولی برای یک بازی با 2 بازیکن، هر کدام دارای 2 استراتژی.

در فرم معمولی یا استراتژیک، بازی با یک ماتریس پرداخت توصیف می شود. هر طرف (به طور دقیق تر، بعد) ماتریس یک بازیکن است، ردیف ها استراتژی های بازیکن اول و ستون ها استراتژی های بازیکن دوم را مشخص می کنند. در تقاطع این دو استراتژی، می توانید بازده هایی را که بازیکنان دریافت می کنند، مشاهده کنید. در مثال سمت راست، اگر بازیکن 1 استراتژی اول را انتخاب کند و بازیکن 2 استراتژی دوم را انتخاب کند، در تقاطع (-1, -1) را می بینیم، به این معنی که هر دو بازیکن هر کدام یک امتیاز از دست دادند. حرکت.

بازیکنان استراتژی هایی با حداکثر نتیجه را برای خود انتخاب کردند، اما به دلیل ناآگاهی از حرکت بازیکن دیگر شکست خوردند. معمولاً فرم معمولی بازی‌هایی را نشان می‌دهد که در آن حرکات به طور همزمان انجام می‌شوند، یا حداقل فرض بر این است که همه بازیکنان نمی‌دانند سایر شرکت‌کنندگان چه می‌کنند. این گونه بازی ها با اطلاعات ناقص در زیر بررسی خواهند شد.

فرمول مشخصه

در بازی های تعاونی با ابزار قابل انتقال، یعنی توانایی انتقال وجه از یک بازیکن به بازیکن دیگر، نمی توان مفهوم پرداخت های فردی را به کار برد. در عوض، از تابع به اصطلاح مشخصه استفاده می شود که سود هر ائتلاف بازیکنان را تعیین می کند. فرض بر این است که بازده ائتلاف خالی صفر است.

زمینه های این رویکرد را می توان در کتاب فون نویمان و مورگنسترن یافت. با مطالعه شکل عادی بازی های ائتلافی، آنها استدلال کردند که اگر ائتلاف C در یک بازی با دو طرف تشکیل شود، ائتلاف N \ C با آن مخالفت می کند. اما از آنجایی که انواع مختلفی از ائتلاف های احتمالی وجود دارد (یعنی 2N، که در آن N تعداد بازیکنان است)، بازده برای C بسته به ترکیب ائتلاف، مقدار مشخصی خواهد بود. به طور رسمی، یک بازی به این شکل (که بازی TU نیز نامیده می شود) با یک جفت (N، v) نشان داده می شود، که در آن N مجموعه همه بازیکنان و v: 2N → R تابع مشخصه است.

این شکل از ارائه را می توان برای همه بازی ها، از جمله بازی هایی که ابزار قابل انتقال ندارند، اعمال کرد. در حال حاضر راه هایی برای تبدیل هر بازی از حالت عادی به فرم مشخصه وجود دارد، اما تبدیل در جهت مخالف در همه موارد امکان پذیر نیست.

4. انواع بازی ها

تعاونی و غیر تعاونی.

این بازی را تعاونی یا ائتلاف می نامند، در صورتی که بازیکنان بتوانند به صورت گروهی متحد شوند و تعهداتی را در قبال سایر بازیکنان بپذیرند و اقدامات خود را هماهنگ کنند. از این نظر با بازی های غیرهمکاری که در آن هرکس موظف است برای خودش بازی کند تفاوت دارد. بازی های سرگرم کننده به ندرت همکاری می کنند، اما چنین مکانیسم هایی در زندگی روزمره غیر معمول نیست.

اغلب تصور می شود که بازی های مشارکتی دقیقاً در توانایی بازیکنان برای برقراری ارتباط با یکدیگر متفاوت هستند. به طور کلی، این درست نیست. بازی هایی وجود دارد که در آن ارتباط مجاز است، اما بازیکنان اهداف شخصی را دنبال می کنند و برعکس.

از بین دو نوع بازی، بازی‌های غیرهمکاری موقعیت‌ها را با جزئیات زیاد توصیف می‌کنند و نتایج دقیق‌تری تولید می‌کنند. تعاونی ها روند بازی را به عنوان یک کل در نظر می گیرند. تلاش برای ترکیب این دو رویکرد نتایج قابل توجهی به همراه داشته است. برنامه موسوم به نش قبلاً راه حل هایی برای برخی بازی های مشارکتی به عنوان موقعیت های تعادلی برای بازی های غیرهمکاری پیدا کرده است.

بازی های ترکیبی شامل عناصر بازی های مشارکتی و غیرهمکاری می شود. به عنوان مثال، بازیکنان می توانند گروه تشکیل دهند، اما بازی به سبک غیر مشارکتی انجام می شود. این به این معنی است که هر بازیکن به دنبال منافع گروه خود خواهد بود و در عین حال برای دستیابی به منافع شخصی تلاش می کند.