نظریه بازی تعاونی
پرش به ناوبریپرش به جستجو
این مقاله در مورد تئوری بازی است. برای بازی های ویدیویی ، به گیم پلی Cooperative مراجعه کنید . برای ویژگی مشابه در برخی از بازی های تخته ، به بازی Board Cooperative مراجعه کنید .
در تئوری بازی ، بازی تعاونی (یا بازی ائتلاف) به دلیل امکان اجرای خارجی رفتارهای تعاونی (به عنوان مثال از طریق قانون قرارداد ) یک بازی با رقابت بین گروه های بازیکنان ("ائتلاف" ) است. اینها مخالف بازیهای غیر همكاری هستند كه در آن امكان جعل اتحادها وجود ندارد یا همه توافق نامه ها باید خودسرانه باشند (به عنوان مثال از طریق تهدیدهای معتبر ). [1]
بازی های تعاونی اغلب از طریق چارچوب نظریه بازی های تعاونی ، مورد تجزیه و تحلیل قرار می گیرند ، که بر پیش بینی اینکه ائتلاف ها را تشکیل می دهند ، اقدامات مشترکی که گروه ها انجام می دهند و بازده های جمعی حاصل می شود ، متمرکز می شوند. این مخالف است با تئوری بازی سنتی غیر تعاونی که بر پیش بینی عملکرد بازیکنان و بازپرداخت های فردی و تجزیه و تحلیل تعادل نش تمرکز دارد . [2] [3]
تئوری بازی تعاونی یک رویکرد سطح بالا را ارائه می دهد ، زیرا تنها ساختار ، استراتژی ها و بازپرداخت ائتلاف ها را توصیف می کند ، در حالی که تئوری بازی غیر تعاونی همچنین به این موضوع نگاه می کند که روش های چانه زنی چگونه بر توزیع سودهای پرداختی در هر ائتلاف تأثیر خواهد گذاشت. از آنجا که تئوری بازی غیر تعاونی عمومی تر است ، بازی های تعاونی را می توان با رویکرد نظریه بازی های غیر تعاونی (Convers) نگه ندارد) مورد تجزیه و تحلیل قرار داد به شرط آنکه فرضیات کافی در نظر گرفته شود تا تمام استراتژی های ممکن را در اختیار بازیکنان قرار دهد به دلیل امکان اجرای خارجی همکاری. اگرچه می توان تمام بازی ها را در چارچوب غیر تعاونی بیان کرد ، اما در بسیاری از موارد اطلاعات کافی برای مدل سازی دقیق رویه های رسمی در دسترس بازیکنان در طی فرآیند چانه زنی استراتژیک وجود ندارد ، یا مدل حاصل پیچیدگی بسیار بالایی برای ارائه ابزاری عملی در دنیای واقعی خواهد بود. در چنین مواردی ، تئوری بازی تعاونی یک رویکرد ساده تر را ارائه می دهد که به تجزیه و تحلیل بازی می پردازد بدون اینکه نیازی به فرض درباره قدرت چانه زنی باشد.
فهرست1تعریف ریاضی2سود هارسانی3ثنویت4زیرمجموعه ها5خصوصیات توصیف5.1حساس بودن5.2یکنواختی5.3ویژگی های بازی های ساده6رابطه با تئوری غیر تعاونی7مفاهیم راه حل7.1مجموعه پایدار7.1.1خصوصیات7.2هسته7.2.1خصوصیات7.3هسته اصلی یک بازی ساده با توجه به ترجیحات7.4هسته قوی اپسیلون7.5مقدار Shapley7.6هسته7.7هسته7.7.1خصوصیات8بازی های تعاونی محدب8.1خصوصیات8.2شباهت ها و تفاوت ها با بهینه سازی ترکیبی9همچنین ببینید10منابع10.1خواندن بیشتر11لینک های خارجیتعریف ریاضی [ ویرایش ]
با مشخص کردن ارزش برای هر ائتلاف ، یک بازی تعاونی ارائه می شود. به طور رسمی ، بازی ائتلاف شامل یک مجموعه محدود از بازیکنان است{\ نمایشگر N}، به نام ائتلاف بزرگ و یک کارکرد مشخص \ displaystyle v: 2 ^ {N} \ to \ mathbb {R} [4] از مجموعه کلیه ائتلافهای احتمالی بازیکنان گرفته تا مجموعه پرداختهای که رضایت بخش باشد\ displaystyle v (\ gapyset) = 0. این تابع توضیح می دهد که با تشکیل یک ائتلاف ، چقدر می توان مجموعه بازیکنان را از لیست بازپرداخت کسب کرد و بازی را گاهی یک بازی با ارزش یا یک بازی سود می نامند .
برعکس ، یک بازی تعاونی نیز می تواند با یک تابع هزینه مشخصه تعریف شود \ displaystyle c: 2 ^ {N} \ to \ mathbb {R} رضایت بخش \ displaystyle c (\ gapyset) = 0. در این تنظیم ، بازیکنان باید وظیفه و عملکرد مشخصی را انجام دهند{\ displaystyle cنشان دهنده هزینه مجموعه ای از بازیکنان است که با هم وظیفه را انجام می دهند. یک بازی از این نوع به عنوان یک بازی هزینه شناخته می شود . اگرچه بیشتر تئوری بازی تعاونی مربوط به بازی های سود است ، اما همه مفاهیم را می توان به راحتی به تنظیم هزینه ترجمه کرد.سود سهام هرسانی [ ویرایش ]
هارسانی سود سهام (به نام بعد از جان هارسانی ، کسی که آن را تعمیم دهند ارزش شپلی در سال 1963 [5] ) شناسایی مازاد است که توسط ائتلافی از بازیکن در یک بازی تعاونی ایجاد شده است. برای مشخص کردن این مازاد ، ارزش این ائتلاف با مازادی که از قبل توسط زیرمجموعه ها ایجاد می شود ، اصلاح می شود. برای این منظور ، سود سهام{\ displaystyle d_ {v} (S) از ائتلاف {\ displaystyle S در بازی {\ displaystyle v به صورت بازگشتی توسط
{\ displaystyle {\ شروع {تراز شده d_ {v} (\ {i \}) & = v (\ {i \}) \\ d_ {v} (\ {i، j \}) & = v (\ {i، j \}) - d_ {v} (\ {i \}) - d_ {v} (\ {j \}) \\ d_ {v} (\ {i، j، k \}) & = v (\ {i، j، k \}) - d_ {v} (\ {i، j \}) - d_ {v} (\ {i، k \}) - d_ {x} (\ {j، k \}) - d_ {v} (\ {i \}) - d_ {v} (\ {j \}) - d_ {v} (\ {k \}) \\ & \ vdots \\ d_ {v } (S) & = v (S) - \ sum _ {T \ subsetneq S} d_ {v} (T) \ end {تراز شده}}
فرمول صریح برای سود سهام توسط داده شده است \ textstyle d_ {v} (S) = \ sum _ {T \ subsetneq S} (- 1) ^ {| S \ setminus T |} v (T). کارکرد\ displaystyle d_ {v}: 2 ^ {N} \ به \ mathbb {R}همچنین به عنوان شناخته شده معکوس موبیوس از\ displaystyle v: 2 ^ {N} \ to \ mathbb {R}. [6] در واقع ، ما می توانیم بهبود یابیم{\ displaystyle v از جانب {\ نمایشگر d_ {v}} با کمک فرمول \ textstyle v (S) = d_ {v} (S) + \ sum _ {T \ subseteq S} d_ {v} (T).
سود سهام هرسانی برای تجزیه و تحلیل هر دو بازی و مفاهیم راه حل مفید است ، به عنوان مثال با توزیع سود سهام هر ائتلاف بین اعضای خود ، ارزش Shapley بدست می آید ، یعنی ارزش Shapley\ displaystyle \ phi _ {i} (v) بازیکن {\ displaystyle i در بازی {\ displaystyle v با جمع کردن سهم یک بازیکن از سود سهام همه ائتلاف های متعلق به او ، \ textstyle \ phi _ {i} (v) = \ sum _ {S \ زیرمجموعه N: i \ in S} {d_ {v} (S) / {| S |}.دوگانگی [ ویرایش ]
اجازه دهید {\ displaystyle vیک بازی سودمند باشید بازی دوگانه از{\ displaystyle v بازی هزینه است \ displaystyle v ^ {*}} که تعریف میشود
\ displaystyle v ^ {*} (S) = v (N) -v (N \ setminus S) ، \ forall S \ subseteq N.
به طور شهودی ، بازی دوگانه هزینه فرصت برای ائتلاف را نشان می دهد{\ displaystyle S از پیوستن به ائتلاف بزرگ نیست {\ نمایشگر N}. یک بازی سود دوگانه\ displaystyle c ^ {*}} برای یک بازی هزینه می تواند به صورت یکسان تعریف شود {\ displaystyle c. یک بازی همکاری و دوتایی آن به نوعی معادل آن است و بسیاری از خواص آنها را به اشتراک می گذارد. برای مثال هسته اصلی یک بازی و دوتایی آن برابر است. برای اطلاعات بیشتر در مورد دوگانگی بازی های مشارکتی ، به عنوان مثال مراجعه کنید ( Bilbao 2000 ).زیرمجموعه ها [ ویرایش ]
اجازه دهید \ displaystyle S \ subsetneq Nیک ائتلاف خالی از بازیکنان باشید. نام فرعی \ displaystyle v_ {S}: 2 ^ {S} \ to \ mathbb {R} بر {\ displaystyle S به طور طبیعی به عنوان تعریف شده است
{\ displaystyle v_ {S} (T) = v (T) ، \ forall T \ subseteq S.
به عبارت دیگر ، ما فقط توجه خود را به ائتلاف های موجود در آن محدود می کنیم {\ displaystyle S. زیرمجموعه ها مفید هستند زیرا به ما اجازه می دهد مفاهیم راه حل تعریف شده برای ائتلاف بزرگ را در ائتلاف های کوچکتر اعمال کنیم.خصوصیات توصیف [ ویرایش ]سوپرادتی [ ویرایش ]
توابع مشخصه غالباً فرض برانگیز است ( اوون 1995 ، ص 213). این بدان معنی است که ارزش اتحادیه ائتلافهای جداگانه از مجموع ارزشهای جداگانه ائتلافها کمتر نیست:
\ displaystyle v (S \ cup T) \ geq v (S) + v (T) هر زمان که \ displaystyle S ، T \ subseteq N راضی کردن \ displaystyle S \ cap T = \ vacyset.یکنواختی [ ویرایش ]
ائتلاف های بزرگتر بیشتر کسب می کنند:
\ displaystyle S \ subseteq T \ Rightarrow v (S) \ leq v (T).
این ناشی از ابرقدرت است . یعنی اگر بازپرداخت ها عادی شده باشند ، بنابراین ائتلاف های تک قلو دارای ارزش صفر هستند.ویژگی های بازی های ساده [ ویرایش ]
بازی ائتلافی V در نظر گرفته شده ساده اگر پاداش را 0 یا 1، ائتلاف یعنی هم "برنده" و یا "از دست دادن". [7]
به طور برابر ، یک بازی ساده را می توان به عنوان مجموعه W ائتلاف ها تعریف کرد ، جایی که اعضای W به عنوان ائتلاف برنده شناخته می شوند ، و بقیه ائتلاف ها را از دست می دهند . بعضی اوقات فرض بر این است که یک بازی ساده بدون حرکتی است یا شامل یک مجموعه خالی نیست. با این حال ، در سایر زمینه های ریاضیات ، بازی های ساده ای نیز به نام هایپرگراف یا توابع بولی (توابع منطقی) گفته می شوند.یک بازی ساده W است یکنواخت در صورت هر گونه ائتلاف حاوی یک ائتلاف برنده است، برنده، این است که، اگر{\ displaystyle S \ in W و \ displaystyle S \ subseteq T دلالت {\ نمایشگر T \ در W.یک بازی ساده W است مناسب اگر مکمل (مخالفان) از هر ائتلاف برنده از دست دادن است، این است که، اگر{\ displaystyle S \ in W دلالت دارد \ displaystyle N \ setminus S \ notin W.یک بازی ساده W است قوی اگر مکمل هر ائتلاف از دست دادن برنده است، این است که، اگر{\ displaystyle S \ notin W دلالت دارد \ displaystyle N \ setminus S \ in W.اگر یک بازی W مناسب و صحیح و مناسب باشد ، در صورت پیروزی اگر مکمل آن از دست می رود ، ائتلافی پیروز می شود ،{\ displaystyle S \ in W اگر \ displaystyle N \ setminus S \ notin W. (اگر v یک بازی ساده colional است که مناسب و قدرتمند است ،\ displaystyle v (S) = 1-v (N \ setminus S)برای هر S. )بازیکن حق وتو (vetoer) در یک بازی ساده یک بازیکن است که متعلق به همه ائتلاف برنده است. به فرض اینکه بازیکن وتو وجود داشته باشد ، هر ائتلافی که حاوی بازیکن وتو نباشد ، ضرر می کند. یک بازی ساده W است ضعیف ( دانشگاهی ) اگر آن را تا یک بازیکن حق وتو، این است که اگر در تقاطع\ displaystyle \ bigcap W: = \ bigcap _ {S \ in W} S از همه ائتلاف های برنده غیر منتخب است.یک دیکتاتور در یک بازی ساده یک بازیکن حق وتو دارد به گونه ای که هر ائتلاف حاوی این بازیکن برنده می شود. دیکتاتور متعلق به هیچ ائتلاف گمشده نیست. ( بازی های دیکتاتور در اقتصاد آزمایشی با این ارتباط ندارند.)حامل از یک بازی ساده W مجموعه ای است\ displaystyle T \ subseteq Nبه گونه ای که برای هر ائتلاف S داریم{\ displaystyle S \ in W اگر \ displaystyle S \ cap T \ in W. وقتی یک بازی ساده دارای حامل باشد ، هر بازیکنی که متعلق به آن نباشد نادیده گرفته نمی شود. اگر یک حامل محدود (حتی اگر N نامتناهی باشد) یک بازی ساده گاهی محدود نامیده می شود .تعداد ناکامورا از یک بازی ساده حداقل تعداد است برنده ائتلاف با تقاطع خالی است. طبق نظریه ناکامورا ، این عدد میزان عقلانیت را اندازه می گیرد. این یک شاخص از میزان حکم یک قانون تجمیع می تواند گزینه های مناسبی را ارائه دهد.
چند رابطه در بین بدیهیات فوق بطور گسترده شناخته شده است ، مانند موارد زیر (به عنوان مثال ، پله ، 2002 ، بخش 2.1 [8] ):اگر یک بازی ساده ضعیف است ، مناسب است.یک بازی ساده اگر قدرتمند و ضعیف باشد ، دیکتاتوری است.
به طور کلی ، یک تحقیق کامل در مورد رابطه بین چهار بدیهی متعارف (یکنواختی ، استحکام ، استحکام و عدم ضعف) ، ظرافت و محاسبه الگوریتمی [9] انجام شده است (کومبه و میهارا ، 2011 [10] ) که نتایج در جدول "وجود بازیهای ساده" در زیر خلاصه شده است.وجود بازی های ساده [11]تایپ کنیدمتناهی غیر کاملیمحاسبه محدودنامتناهی غیر کاملیبی نهایت قابل محاسبه1111نهآرهآرهآره1110نهآرهنهنه1101نهآرهآرهآره1100نهآرهآرهآره1011نهآرهآرهآره1010نهنهنهنه1001نهآرهآرهآره1000نهنهنهنه0111نهآرهآرهآره0110نهنهنهنه0101نهآرهآرهآره0100نهآرهآرهآره0011نهآرهآرهآره0010نهنهنهنه0001نهآرهآرهآره0000نهنهنهنه
محدودیت هایی که اشیاء مختلف برای بازی های ساده به شماره ناکامورا تحمیل می کنند نیز به طور گسترده مورد بررسی قرار گرفت. [12] به طور خاص ، یک بازی ساده قابل محاسبه بدون بازیکن وتو ، تعداد ناکامورا را بیشتر از 3 می کند فقط اگر یک بازی مناسب و غیر قوی باشد.رابطه با تئوری غیر تعاونی [ ویرایش ]
بگذارید G یک بازی استراتژیک (غیر تعاونی) باشد. سپس با فرض اینکه ائتلاف ها توانایی اجرای رفتار هماهنگ را داشته باشند ، چندین بازی تعاونی مرتبط با G وجود دارد . این بازی ها اغلب به عنوان بازنمایی G گفته می شوند . دو نمایندگی استاندارد عبارتند از: [13]بازی α مؤثر با هر یک از ائتلاف ها ، دستاوردهای اعضای خود را می توان با پیوستن به نیروها "تضمین" کرد. با "ضمانت" ، به این معنی است که مقدار حداکثر حداقل است ، به عنوان مثال مقدار حداکثر حداقل در نظر گرفته شده برای استراتژی های مخالفان.بازی β مؤثر با هر یک از ائتلاف ها ، مجموع دستاوردهای اعضای خود می تواند با پیوستن به نیروهای "استراتژیک" را تضمین کند. منظور از "تضمین استراتژیک" ، این ارزش است که حداقل مقدار باشد ، به عنوان مثال مقدار حداکثر حداکثر تصرف استراتژی های مخالفان.
منبع
https://en.wikipedia.org/wiki/Cooperative_game_theory