مثالی از قطری سازی ماتریس مجاورت

ماتریس مجاورتA
11110
00001
00001
00001
00001

مقادیر ویژه  عبارت است:2و 0و0و0و2-

طیف گراف :

2,0,0,0,-2

بردارهای ویژه متناظر 0:(0و0و1و1-و0) =x1 و (0و1و0و1-و0) =x2و (1و0و0و1-و0)=x3

بردارهای ویژه متناظر 2-:(1و1و1و1و2-)=x4

بردارهای ویژه متناظر 2:(1و1و1و1و2)=x5

ماتریس D برابر است با:

ماتریس D
00000
00000
00000
02-000
20000

 

ماتریس P
22-000
111-1-1-
11001
11010
11100

 

معکوس P'=P
1/4-1/4-3/41/4-0
1/4-3/41/4-1/4-0
3/41/4-1/4-1/4-0
1/81/81/81/81/4-
1/81/81/81/81/4

A =P'DP

سوال امتحانی در مورد قطری کردن(1)

نتیجه تصویری برای diagonalized matrix

سوال امتحانی در مورد  قطری کردن

نتیجه تصویری برای diagonalized matrix

ادامه ماتریس متقارن مشخص

 سایر خصوصیات [ ویرایش ]

اجازه دهیدم n \ n n ماتریس هرمیتی . خواص زیر معادل می باشدم مثبت بودن قطعی:

فرم کنجکاوی مرتبط یک محصول داخلی است

فرم sesquilinear تعریف شده توسطم این عملکرد است\ displaystyle \ langle \ cdot، \ cdot \ rangle از جانب \ displaystyle \ mathbb {C} ^ {n} \ بار \ mathbb {C} ^ {n} به \ mathbb {C} ^ {n به طوری که\ displaystyle \ langle x، y \ rangle: = y ^ {*} Mx برای همه ایکس و ی که در\ mathbb {C} ^ {n، جایی کهy ^ {* پیوند مزدوج است ی. برای هر ماتریس پیچیدهم، این فرم به صورت خطی است ایکس و نیمه تمام در ی. بنابراین، فرم است محصول داخلی در\ mathbb {C} ^ {n اگر و تنها اگر \ displaystyle \ langle z، z \ rangle برای همه غیروزارها واقعی و مثبت است z؛ این در صورتی است که فقط و فقط اگرمقطعی مثبت است (در واقع ، هر محصول درونی در\ mathbb {C} ^ {n در این مد از یک ماتریس مشخص مثبت هرمیتی ناشی می شود.)

خردسالان اصلی آن همه مثبت هستند

K هفتم منجر جزئی اصلی از یک ماتریسماست تعیین از آن بالا سمت چپk \ بار kماتریس فرعی به نظر می رسد که اگر همه این عوامل تعیین کننده مثبت باشند ، یک ماتریس مثبت است. این شرط به عنوان معیار سیلوستر شناخته می شود و یک آزمایش کارآمد از قطعیت مثبت یک ماتریس واقعی متقارن را فراهم می کند. یعنی ، با استفاده از عملیات ردیف مقدماتی ، ماتریس به یک ماتریس مثلثی فوقانی کاهش می یابد ، همانطور که در قسمت اول روش حذف گاوسی ، با مراقبت از حفظ نشانه تعیین کننده آن در طی فرآیند چرخش . از آنجا که ک هفتم منجر جزئی اصلی یک ماتریس مثلثی کالا از عناصر مورب تا آن را به ردیف استکمعیار سیلوستر معادل بررسی اینکه آیا عناصر مورب آن همه مثبت هستند یا خیر. این وضعیت را می توان هر بار که یک ردیف جدید بررسی کردک از ماتریس مثلث به دست می آید.

اگر و فقط اگر غیرقابل برگشت باشد ، یک ماتریس نیممشخص مثبت است . [7] یک ماتریسم منفی (نیمه) قطعی است اگر و فقط اگر {\ displaystyle -M مثبت (نیمه) قطعی است.

فرم های درجه دوم [ ویرایش ]

مقاله اصلی: فرم درجه چهار قطعی

(کاملاً) شکل درجه دوم که مربوط به یک واقعیت استn \ n n ماتریس م این عملکرد است\ displaystyle Q: \ mathbb {R} ^ {n} \ to \ mathbb {R} به طوری که \ displaystyle Q (x) = x ^ {\ Texff {T}} Mx برای همهایکسم{\ displaystyle {\ tfrac {1} {2}} \ left (M + M ^ {\ textf {T}} \ Right).

یک ماتریس متقارن ممثبت است اگر تنها و فقط اگر فرم درجه دوم آن یک تابع محدب است .

به طور کلی ، هر عملکرد درجه دوم از\ mathbb {R} ^ {n به \ mathbb {R}  می تواند به عنوان نوشته شود \ displaystyle x ^ {\ Texff {T}} Mx + x ^ {\ Texff {T}} b + c جایی که م متقارن استn \ n n ماتریس ، ب واقعی استن-وکتور ، و جیک ثابت واقعی این عملکرد درجه دوم کاملاً محدب است و از این رو حداقل و در صورت محدود بودن حداقل جهانی منحصر به فرد داردمقطعی مثبت است به همین دلیل ، ماتریس های مثبت مثبت نقش مهمی در مشکلات بهینه سازی بازی می کنند.

قطر همزمان [ ویرایش ]

یک ماتریس متقارن و یک ماتریس قطعی مثبت و متقارن می تواند به طور همزمان مورب باشد ، اگرچه لزوماً از طریق یک تغییر شباهت نیست . این نتیجه در مورد سه یا چند ماتریس گسترش نمی یابد. در این بخش برای پرونده واقعی می نویسیم. گسترش به مورد پیچیده فوری است.

اجازه دهید م متقارن باشد و نیک ماتریس مشخص و متقارن و مثبت. معادله ویژه مقدماتی عمومی را بنویسید\ displaystyle (M- \ lambda N) x = 0 جایی که ما آن را تحمیل می کنیم ایکس عادی شود ، یعنی\ displaystyle x ^ {\ textf {T}} Nx = 1. اکنون ما برای تجزیه و تحلیل معکوس از تجزیه چولسکی   استفاده می کنیمن مانند \ displaystyle Q ^ {\ textf {T}} Q. ضرب توسطس و اجازه دادن\ displaystyle x = Q ^ {\ textf T}} y}، ما گرفتیم\ displaystyle Q (M- \ lambda N) Q ^ {\ Texff {T}} y = 0، که می تواند بازنویسی به عنوان {\ نمایشگر \ چپ (QMQ ^ {\ Texf {T}} \ راست) y = \ lambda y جایی که \ displaystyle y ^ {\ textf {T}} y = 1. دستکاری اکنون بازده است\ displaystyle MX = NX \ لامبدا جایی که ایکس یک ماتریس است که به عنوان ستون های ویژه مجرای عمومی و\ لامبدا یک ماتریس مورب از مقادیر ویژه ای تعمیم یافته است. در حال حاضر نسخه آزمایشی با\\ displaystyle X ^ {\ textf {T}} نتیجه نهایی را می دهد: \ displaystyle X ^ {\ textf {T}} MX = \ Lambda و\ displaystyle X ^ {\ textf {T}} NX = Iاما توجه داشته باشید که این دیگر یک مورب شدن متعامد با توجه به کالای داخلی است که در آن وجود ندارد \ displaystyle y ^ {\ textf {T}} y = 1. در حقیقت ، ما مورب هستیمم با توجه به محصول داخلی ناشی از  ن[8]

توجه داشته باشید که این نتیجه با آنچه گفته می شود در مورد مورب مورب همزمان در مقاله ماتریس Diagonalizable گفته شده است ، که اشاره به مورب همزمان با یک تغییر شباهت دارد ، مغایرت ندارد . نتیجه ما در اینجا بیشتر شبیه به مورب مشخص همزمان دو شکل درجه چهار است و برای بهینه سازی یک فرم تحت شرایط از طرف دیگر مفید است.

ادامه ماتریس متقارن مشخص

 مثالها [ ویرایش ]

  • ماتریس\ displaystyle I = {\ fill bmatrix 1 & 0 \\ 0 & 1 \ end {bmatrix}}قطعی مثبت است (و به همین ترتیب نیمه مثبت قطعی نیز مثبت است). این یک ماتریس متقارن واقعی است ، و برای هر بردار ستونی غیر صفر z با ورودی های واقعی a و b ،

    \ displaystyle z ^ {\ Texsf {T}} Iz = {\ fill bmatrix} a & b \ end {bmatrix}} {\ fill bmatrix 1 & 0 \\ 0 & 1 \ end {bmatrix}} {\ fill {bmatrix} a \\ b \ end {bmatrix}} = a ^ {2} + b ^ {2}.

    به عنوان یک ماتریس پیچیده ، برای هر بردار ستونی غیر صفر z که دارای ورودی های پیچیده a و b است ، دیده می شود

    \ displaystyle z ^ {*} Iz = {\ fill bmatrix} {\ overline {a}} & {\ overline {b}} \ end {bmatrix}} {\ fill bmatrix 1 & 0 \\ 0 & 1 \ end { bmatrix}} {\ fill {bmatrix a \\ b \ end {bmatrix}} = {\ overline {a}} a + {\ overline {b}} b = | a | ^ {2} + | b | ^ 2.

    در هر صورت ، از آن زمان نتیجه مثبت استz بردار صفر نیست (یعنی حداقل یکی از آنها آ و ب صفر نیست)
  • ماتریس متقارن واقعی

    \ displaystyle M = {\ fill bmatrix 2 & -1 & 0 \\ - 1 & 2 & -1 \\ 0 & -1 & 2 \ end bmatrix}}

    مثبت است- از آنجا که برای هر بردار ستون غیر صفر z با مدخلهای a ، b و c داریم

    \ displaystyle {\ شروع {تراز شده} z ^ {\ Texsf {T}} Mz = \ سمت چپ (z ^ {\ Texff {T}} M \ سمت راست) z & = {\ fill bmatrix} (2a-b) & (-a + 2b-c) & (- b + 2c) \ end {bmatrix}} {\ fill bmatrix} a \\ b \\ c \ end {bmatrix} \\ & = (2a-b) a + (-a + 2b-c) b + (- b + 2c) c \\ & = 2a ^ {2} -ba-ab + 2b ^ {2} -cb-bc + 2c ^ {2} \\ & = 2a ^ {2} -2ab + 2b ^ {2} -2bc + 2c ^ {2} \\ & = a ^ {2} + a ^ {2} -2ab + b ^ {2} + b ^ {2} - 2bc + c ^ {2} + c ^ {2} \\ & = a ^ {2} + (ab) ^ {2} + (bc) ^ {2} + c ^ {2} \ end {تراز شده} }

    این نتیجه مجموع مربعات است و بنابراین غیر منفی است. و فقط اگر صفر باشد صفر است\ displaystyle a = b = c = 0، یعنی وقتی z بردار صفر است.
  • برای هر ماتریس برگشت پذیر واقعی آ، ضرب\ displaystyle A ^ {\ textf {T}} Aیک ماتریس قطعی مثبت است. اثبات ساده این است که برای هر بردار غیر صفر وجود داردz، شرایط\ displaystyle z ^ {\ textf {T}} A ^ {\ Texf {T}} Az = (Az) ^ {\ Texsf {T}} (Az) = \ | Az \ | ^ {2}> 0، } از آنجا که غیرقابل برگشت بودن ماتریس است آ یعنی که .Az \ neq 0.
  • مثال مدر بالا نشان می دهد که ماتریسی که در آن برخی از عناصر منفی هستند ممکن است هنوز هم قطعی مثبت باشد. در مقابل ، ماتریسی که ورودی های آن همه مثبت است ، مثلاً مثلاً مثبت نیست

    \ displaystyle N = {\ fill bmatrix 1 & 2 \\ 2 & 1 \ end {bmatrix}}،

    برای کدام {\ displaystyle {\ fill {bmatrix} -1 & 1 \ end {bmatrix} N {\ fill bmatrix} -1 & 1 \ end {bmatrix}} ^ {\ textf T}} = - - 2 <0

مقدمات ویژه [ ویرایش ]

اجازه دهید م n \ n n ماتریس هرمیتی . این بدان معناست که همه مقادیر خاص آن واقعی هستند.

  • م مثبت و قطعی است اگر و فقط اگر همه مقادیر ویژه آن مثبت باشد.
  • م نیمه قطعی مثبت است اگر و فقط اگر همه مقادیر خاص آن غیر منفی باشد.
  • م اگر منفی باشد و فقط اگر تمام مقادیر ویژه آن منفی باشد ، قطعی منفی است
  • م منفی نیمه قطعی است اگر و فقط اگر همه مقادیر ویژه آن غیر مثبت هستند.
  • م نامشخص است اگر و فقط اگر هم مقادیر مهم و مثبتی داشته باشد و هم منفی باشد.

اجازه دهید\ displaystyle P ^ {- 1} DPباشد تجارتی ویژهم، جایی که پیک ماتریس پیچیده واحد که ردیف هایی تشکیل گردیده اساس orthonormal از بردارهای ویژه ازمو دیک ماتریس مورب واقعی است که مورب اصلی آن حاوی مقادیر ویژه ای است . ماتریکسم ممکن است به عنوان یک ماتریس مورب در نظر گرفته شود د که در مختصات پایه دوباره بیان شده است پ. به طور خاص ، تغییر یک به یک متغیر{\ displaystyle y = Pz نشان میدهد که\ displaystyle z ^ {*} Mz} برای هر بردار پیچیده واقعی و مثبت است z اگر و تنها اگر\ displaystyle y ^ {*} Dy} برای هر کسی واقعی و مثبت است ی؛ به عبارت دیگر ، اگردقطعی مثبت است برای یک ماتریس مورب ، این درست است اگر هر عنصر مورب اصلی - یعنی هر مقادیر ویژه ای ازممثبت است. از آنجا که قضیه طیفی همه مقادیر ویژه یک ماتریس هرمیتی را واقعی می داند ، می تواند مثبت بودن مقادیر ویژه را با استفاده از قاعده دکارت در مورد علائم متناوب ، هنگامی که چند جمله ای مشخصه یک ماتریس واقعی ، متقارن بررسی کرد.م موجود است.

 

ادامه تجزیه چولسکی

تجزیه LDL [ ویرایش ]

یک شکل جایگزین ، حذف نیاز به ریشه های مربعی هنگامی که A متقارن باشد ، عامل بندی نامشخص متقارن است [12]

\ displaystyle {\ fill {تراز شده} \ mathbf {A} = \ mathbf {LDL ^ {\ mathrm {T}} & = {\ fill pmatrix} 1 & 0 & 0 \\ L_ {21} & 1 & 0 \\ L_ {31} & L_ {32} & 1 \\\ end {pmatrix}} {\ fill {pmatrix} D_ {1} & 0 & 0 \\ 0 & D_ {2} & 0 \\ 0 & 0 & D_ {3} \** end {pmatrix}} {\ fill {pmatrix } 1 & L_ {21} & L_ {31} \\ 0 & 1 & L_ {32} \\ 0 & 0 & 1 \\ end {pmatrix}} \\ & = {\ fill pmatrix} D_ {1 && (\ mathrm {متقارن}) \\ L_ {21} D_ {1} & L_ {21} ^ {2} D_ {1} + D_ {2} & \\ L_ {31} D_ {1} & L_ {31} L_ {21} D_ {1} + L_ {32} D_ {2} & L_ {31} ^ {2} D_ {1} + L_ {32} ^ {2} D_ {2} + D_ {3}. \ end {pmatrix}}. \ end {تراز شده} }

روابط بازگشتی زیر برای ورود D و L اعمال می شود :

\ displaystyle D_ {j} = A_ {jj} - \ sum _ {k = 1} ^ {j-1} L_ {jk} ^ {2} D_ {k}،

left \ displaystyle L_ {ij} = {\ frac {1} {D_ {j}}} \ left (A_ {ij} - \ sum _ {k = 1} ^ {j-1} L_ {ik} L_ {jk D_ {k} \ درست) \ quad {\ متن {برای}} i> j.}

این کار تا زمانی ادامه می یابد که عناصر مورب تولید شده در D بدون صفر بمانند. تجزیه پس از آن منحصر به فرد است. D و L واقعی اگر واقعی است.

برای ماتریس پیچیده هرمیتی A ، فرمول زیر اعمال می شود:

\ displaystyle D_ {j} = A_ {jj} - \ sum _ {k = 1} ^ {j-1} L_ {jk} L_ {jk} ^ {*} D_ {k}،}

left \ displaystyle L_ {ij} = {\ frac {1} {D_ {j}}} \ left (A_ {ij} - \ sum _ {k = 1} ^ {j-1} L_ {ik} L_ {jk } ^ {*} D_ {k} \ درست) \ quad {\ متن {برای}} i> j.}

باز هم ، الگوی دسترسی اجازه می دهد تا در صورت دلخواه کل محاسبات در محل انجام شود.

نوع بلوک [ ویرایش ]

هنگامی که در ماتریس نامشخص استفاده می شود ، فاکتورسازی LDL * بدون محور دقیق دقت ناپایدار است. [13] به طور خاص ، عناصر عامل پذیری می توانند خودسرانه رشد کنند. بهبود احتمالی اجرای فاکتورسازی در ماتریسهای زیر بلوک است که معمولاً 2 � 2 است: [14]

\ displaystyle {\ fill {تراز شده} \ mathbf {A} = \ mathbf {LDL ^ {\ mathrm {T}} & = {\ fill pmatrix} \ mathbf {I} & 0 & 0 \ 0 mathbf {L} _ {21} & \ mathbf {I} & 0 \\\ mathbf {L} _ {31} & \ mathbf {L} _ {32} & \ mathbf {I} \\\ end pmatrix}} {\ fill {pmatrix \ mathbf {D} _ {1} & 0 & 0 \\ 0 & \ mathbf {D} _ {2} & 0 \\ 0 & 0 & \ mathbf {D} _ {3} \** end {pmatrix}} {\ fill {pmatrix} \ mathbf {I} & \ mathbf {L} _ {21} ^ {\ mathrm {T}} & \ mathbf {L} _ {31} ^ {\ mathrm {T}} \\ 0 & \ mathbf {I} & \ mathbf {L} _ {32} ^ {\ mathrm {T} \ \\ 0 & 0 & \ mathbf {I} \\\ end {pmatrix}} \\ & = {\ start pmatrix} \ mathbf {D} _ { 1 }&& (\ mathrm {متقارن) \\\ mathbf {L} _ {21 \ mathbf {D} _ {1} & \ mathbf {L} _ {21} \ mathbf {D} _ {1} \ mathbf {L} _ {21} ^ {\ mathrm {T}} + \ mathbf {D} _ {2} & \\\ mathbf {L} _ {31} \ mathbf {D} _ {1} &\ mathbf {L} _ {31} \ mathbf {D} _ {1} \ mathbf {L} _ {21} ^ {\ mathrm {T}} + \ mathbf {L} _ {32} \ mathbf {D} _ {2} & \ mathbf {L} _ {31} \ mathbf {D} _ {1} \ mathbf {L} _ {31} ^ {\ mathrm {T}} + \ mathbf {L} _ {32} \ mathbf {D} _ {2} \ mathbf {L} _ {32} ^ {\ mathrm {T}} + \ mathbf {D} _ {3} \ end {pmatrix}}، \ end {تراز شده}}}

که در آن هر عنصر در ماتریس های بالا یک زیرمجاز مربع است. از این ، این روابط بازگشتی مشابه به دنبال دارند:

\ displaystyle \ mathbf {D} _ {j} = \ mathbf {A} _ {jj} - \ sum _ {k = 1} ^ {j-1} \ mathbf {L} _ {jk} \ mathbf {D _ {k} \ mathbf {L} _ {jk} ^ {\ mathrm {T}}،

\ displaystyle \ mathbf {L} _ {ij} = \ left (\ mathbf {A} _ {ij} - \ sum _ {k = 1} ^ {j-1 \ mathbf {L} _ {ik} \ mathbf {D} _ {k} \ mathbf {L} _ {jk} ^ {\ mathrm {T}} \ Right) \ mathbf {D} _ {j} ^ {- 1}.

این شامل محصولات ماتریس و وارونگی صریح است ، بنابراین اندازه بلوک عملی را محدود می کند.

به روزرسانی تجزیه [ ویرایش ]

وظیفه ای که اغلب در عمل بوجود می آید این است که فرد باید تجزیه Cholesky را به روز کند. در جزییات بیشتر ، یک نفر قبلاً تجزیه Cholesky را محاسبه کرده است

\ displaystyle \ mathbf {A} = \ mathbf {L} \ mathbf {L} ^ {*}} برخی از ماتریس 

\ mathbf {A سپس یکی ماتریس را تغییر می دهد

\ mathbf {A  به نوعی بگویید\ tilde {\ mathbf {A}}، و یکی می خواهد تجزیه Cholesky ماتریس به روز شده را محاسبه کند:\ tilde {\ mathbf {A}}} = {\ tilde {\ mathbf {L}}} {\ tilde {\ mathbf {L}}} ^ {*}. حال این سؤال مطرح است که آیا می توان از تجزیه چولسکی استفاده کرد؟

\ mathbf {A  که قبل از محاسبه برای تجزیه Cholesky محاسبه شد\ tilde {\ mathbf {A}}.

مرتباً یک به روزرسانی [ ویرایش ]

مورد خاص ، که در آن ماتریس به روز شده است \ tilde {\ mathbf {A}} مربوط به ماتریس است 

\ mathbf {A  توسط\ tilde {\ mathbf {A}}} = \ mathbf {A} + \ mathbf x} \ mathbf x} ^ {*}، به عنوان یک به روزرسانی درجه یک شناخته می شود .

در اینجا یک تابع کوچک [15] با نحوی Matlab نوشته شده است که یک بروزرسانی درجه یک را تحقق می بخشد:

تابع  [L] = cholupdate ( L ، x ) 
    n  =  طول ( x )؛
    برای k = 1: n
        r  =  sqrt ( L ( k ،  k ) ^ 2     x ( k ) ^ 2 )؛ 
        c  =  r  /  L ( k ،  k )؛ 
        s  =  x ( k )  /  L ( k ،  k )؛ 
        L ( k ،  k )  =  r ؛
        اگر k 
            L (( k   1 ): n ،  k )  =  ( L (( k   1 ): n ،  k )     s  *  x (( k   1 ): n ))  /  c ؛ 
            x (( k   1 ): n )  =  c  *  x (( k   1 ): n )  -  s  *  L ((k   1 ): n ،  k )؛
        پایان 
پایان    ​
پایان

رتبه بندی یک نزولی [ ویرایش ]

downdate رتبه یک شبیه به یک رتبه یک به روز رسانی است، به جز که علاوه بر تفریق است جایگزین:\ tilde {\ mathbf {A}}} = \ mathbf {A} - \ mathbf {x} \ mathbf x} ^ {*}. این تنها در صورت ماتریس جدید کار می کند\ tilde {\ mathbf {A}} هنوز قطعی مثبت است

کد برای به روزرسانی درجه یک که در بالا نشان داده شده است به راحتی می تواند برای انجام یک نزولی رتبه یک باشد: یکی فقط نیاز به جایگزینی دو اضافات در انتساب به r و L((k 1):n, k) تفریق دارد.

اضافه کردن و حذف سطرها و ستون ها [ ویرایش ]

در صورت داشتن ماتریس مشخص و متقارن و مثبت\ displaystyle \ mathbf {A} به صورت بلوک به عنوان نشان داده شده است

\ displaystyle \ mathbf {A = {\ آغاز {pmatrix} \ mathbf {A} _ {11} & \ mathbf {A} _ {13 \\\ mathbf {A} _ {13} ^ {\ mathrm { T}} & \ mathbf {A} _ {33} \\\ end {pmatrix}}

و عامل بالایی آن Cholesky است

\ displaystyle \ mathbf {L} = {\ fill {pmatrix \ mathbf {L} _ {11} & \ mathbf {L} _ {13 \\ 0 & \ mathbf {L} _ {33} \** end {pmatrix} ،}

سپس برای یک ماتریس جدید\ tilde {\ mathbf {A}}، که همان است\ displaystyle \ mathbf {A} اما با درج ردیف ها و ستون های جدید ،

\ displaystyle {\ شروع {تراز شده} {\ tilde {\ mathbf {A}}} & = {\ آغاز {pmatrix} \ mathbf {A _ {11} & \ mathbf {A} _ {12} & \ mathbf {A} _ {13} \\\ mathbf {A} _ {12} ^ {\ mathrm {T}} & \ mathbf {A} _ {22 & \ mathbf {A} _ {23} \\\ mathbf A} _ {13} ^ {\ mathrm {T}} & \ mathbf {A} _ {23} ^ {\ mathrm {T}} & \ mathbf {A} _ {33} \** end {pmatrix} } \ end {تراز شده}}}

ما علاقه مند به یافتن فاکتورسازی Cholesky از \ tilde {\ mathbf {A}}، که ما آن را صدا می کنیم\ displaystyle \ tilde {\ mathbf {S}}}بدون محاسبه مستقیم کل تجزیه.

\ displaystyle {\ شروع {تراز شده} {\ tilde {\ mathbf {S}}} & = {\ آغاز {pmatrix} \ mathbf {S} _ {11} & \ mathbf {S} _ {12} & \ mathbf {S} _ {13} \\ 0 & \ mathbf {S} _ {22} & \ mathbf {S} _ {23} \\ 0 & 0 & \ mathbf {S} _ {33 \\\ end {pmatrix}. \ end {تراز شده}}}

نوشتن\ displaystyle \ mathbf {A} \ setminus \ mathbf {b} برای راه حل

\ displaystyle \ mathbf {A} \ mathbf {x} = \ mathbf {b، که می توان به راحتی برای ماتریس های مثلثی پیدا کرد ، و\ displaystyle \ متن {chol}} (\ mathbf {M})} برای تجزیه Cholesky از {\ mathbf Mروابط زیر را می توان یافت:

\ displaystyle {\ شروع {تراز شده} \ mathbf {S} _ {11} & = \ mathbf {L} _ {11} ، \\\ mathbf {S} _ {12} & = \ mathbf {L} _ { 11} ^ {\ mathrm {T}} \ setminus \ mathbf {A} _ {12}، \\\ mathbf {S} _ {13} & = = mathbf {L} _ {13}، \\\ mathbf { S} _ {22} & = {\ text {chol}} (\ mathbf {A} _ {22} - \ mathbf {S} _ {12} ^ {\ mathrm {T}} \ mathbf {S} _ 12}) ، \\\ mathbf {S} _ {23} & = \ mathbf {S} _ {22} ^ {\ mathrm {T}} \ setminus (\ mathbf {A} _ {23} - \ mathbf { S} _ {12} ^ {\ mathrm {T}} \ mathbf {S} _ {13})، \\\ mathbf {S} _ {33} & = {\ text {chol}} (\ mathbf {L } _ {33} ^ {\ mathrm {T}} \ mathbf {L} _ {33} - \ mathbf {S} _ {23} ^ {\ mathrm {T}} \ mathbf {S} _ {23}) . \\\ end {تراز شده}}}

در صورت تنظیم مناسب ابعاد سطر و ستون (از جمله به صفر) ممکن است از این فرمولها برای تعیین فاکتور چولسکی پس از درج سطرها یا ستونها در هر موقعیت استفاده شود. مشکل معکوس ، وقتی که داریم

\ displaystyle {\ شروع {تراز شده} {\ tilde {\ mathbf {A}}} & = {\ آغاز {pmatrix} \ mathbf {A _ {11} & \ mathbf {A} _ {12} & \ mathbf {A} _ {13} \\\ mathbf {A} _ {12} ^ {\ mathrm {T}} & \ mathbf {A} _ {22 & \ mathbf {A} _ {23} \\\ mathbf A} _ {13} ^ {\ mathrm {T}} & \ mathbf {A} _ {23} ^ {\ mathrm {T}} & \ mathbf {A} _ {33} \** end {pmatrix} } \ end {تراز شده}}}

با تجزیه شناخته شده Cholesky

\ displaystyle {\ شروع {تراز شده} {\ tilde {\ mathbf {S}}} & = {\ آغاز {pmatrix} \ mathbf {S} _ {11} & \ mathbf {S} _ {12} & \ mathbf {S} _ {13} \\ 0 & \ mathbf {S} _ {22} & \ mathbf {S} _ {23} \\ 0 & 0 & \ mathbf {S} _ {33 \** end {pmatrix}} \ پایان {تراز وسط}}

و آرزو می کنیم فاکتور چولسکی را تعیین کنیم

\ displaystyle {\ fill {تراز شده} \ mathbf {L} & = {\ fill pmatrix \ mathbf {L} _ {11} & \ mathbf {L} _ {13} \\ 0 & \ mathbf {L} _ {33} \\\ end {pmatrix}} \ end {تراز شده}}

ماتریس\ displaystyle \ mathbf {A} با حذف ردیف ها و ستون ها ،

\ displaystyle {\ fill {تراز شده} \ mathbf {A} & = {\ fill pmatrix} \ mathbf {A _ {11} & \ mathbf {A} _ {13} \\\ mathbf {A} _ { 13} ^ {\ mathrm {T}} & \ mathbf {A} _ {33} \\\ end {pmatrix}}، \ end {تراز شده}}

قوانین زیر را ارائه می دهد:

\ displaystyle {\ شروع {تراز شده} \ mathbf {L} _ {11} & = \ mathbf {S} _ {11}، \\\ mathbf {L} _ {13} & = \ mathbf {S} _ 13} ، \\\ mathbf {L} _ {33} & = {\ text {chol}} (\ mathbf {S} _ {33} + \ mathbf {S} _ {23} ^ {\ mathrm {T } \ mathbf {S} _ {23}). \ end {تراز شده}}}

توجه کنید که معادلات فوق که شامل یافتن تجزیه Cholesky یک ماتریس جدید هستند ، همه از این شکل هستند 

\ displaystyle {\ tilde {\ mathbf {A}}} = \ mathbf {A} \ pm \ mathbf {x} \ mathbf {x} ^ {*}}، که به آنها اجازه می دهد تا با استفاده از روشهای به روزرسانی و downdate که به تفصیل در قسمت قبلی شرح داده شده ، محاسبه شوند. [16]

اثبات ماتریسهای نیمه قطعی مثبت [ ویرایش ]

اثبات با محدود کردن استدلال [ ویرایش ]

الگوریتم های فوق نشان می دهد که هر ماتریس مشخص مثبت است\ mathbf {A تجزیه Cholesky است. این نتیجه را می توان با یک استدلال محدود به پرونده نیمه نهایی قطعی مثبت افزایش داد. این استدلال کاملاً سازنده نیست ، یعنی هیچ محاسبه ای صریح برای محاسبه فاکتورهای چولسکی ارائه نمی دهد.

اگر\ mathbf {A  هست یک n \ n n ماتریس نیمه قطعی مثبت ، سپس دنباله\ displaystyle \ left (\ mathbf {A} _ {k} \ Right) _ {k}: = \ left (\ mathbf {A} + {\ frac {1} {k}} \ mathbf {I} _ { n} \ درست) _ {k}}متشکل از ماتریس های مثبت مثبت است . (این یک نتیجه فوری مثلاً قضیه نقشه برداری طیفی برای حساب کارکردی چند جمله ای است.) همچنین ،

\ displaystyle \ mathbf {A} _ {k} \ rightarrow \ mathbf {A} \ quad {\ متن {برای}} \ quad k \ rightarrow \ infty

در هنجار اپراتور . از مورد قطعی مثبت ، هر کدام

{\ mathbf {A}} _ {k} تجزیه Cholesky است \ displaystyle \ mathbf {A} _ {k} = \ mathbf {L} _ {k} \ mathbf {L} _ {k} ^ {*}}. براساس ویژگی هنجار اپراتور ،

\ displaystyle \ | \ mathbf {L} _ {k} \ | ^ {2} \ geq \ | \ mathbf {L} _ {k} \ mathbf {L} _ {k} ^ {*} \ | = \ | \ mathbf {A} _ {k} \ | \،.

بنابراین{\ نمایش صفحه \ سمت چپ (\ mathbf {L} _ {k} \ سمت راست) _ {k}}یک مجموعه محدود در فضای Banach اپراتورها است ، بنابراین نسبتاً جمع و جور است (زیرا فضای بردار زیرین متناهی است). در نتیجه ، این یک پیامد همگرایی دارد ، که از آن نیز یاد شده است{\ نمایش صفحه \ سمت چپ (\ mathbf {L} _ {k} \ سمت راست) _ {k}}، با حد مجاز \ mathbf {L. به راحتی قابل بررسی است که این \ mathbf {L دارای خواص مورد نظر ، یعنی \ displaystyle \ mathbf {A} = \ mathbf {L} \ mathbf {L} ^ {*}}و 

 \ mathbf {L مثلث پایین با ورودی های مورب غیر منفی است: برای همه ایکس و ی،

\ displaystyle \ langle \ mathbf {A} x، y \ rangle = \ left \ langle \ lim \ mathbf {A} _ {k} x، y \ Right \ rangle = \ langle \ lim \ mathbf {L} _ { k} \ mathbf {L} _ {k} ^ {*} x، y \ rangle = \ langle \ mathbf {L} \ mathbf {L} ^ {*} x، y \ rangle \ ،.}

از این رو،\ displaystyle \ mathbf {A} = \ mathbf {L} \ mathbf {L} ^ {*}}. از آنجا که فضای بردار زیرین محدود است ، تمام توپولوژی های موجود در فضای اپراتورها معادل هستند. بنابراین{\ نمایش صفحه \ سمت چپ (\ mathbf {L} _ {k} \ سمت راست) _ {k}} تمایل دارد 

 \ mathbf {L به معنای هنجار{\ نمایش صفحه \ سمت چپ (\ mathbf {L} _ {k} \ سمت راست) _ {k}} تمایل دارد \ mathbf {Lورودی این به نوبه خود نشان می دهد که ، از هر یک\ displaystyle \ mathbf {L} _ {k}} مثلث پایین با ورودی های مورب غیر منفی است ،  \ mathbf {L هم هست

اثبات تجزیه QR [ ویرایش ]

اجازه دهید\ mathbf {A یک ماتریس نیمه قطعی مثبت هرمی باشد. سپس می توان آن را به عنوان محصولی از ماتریس ریشه مربع آن نوشت ،\ displaystyle \ mathbf {A} = \ mathbf {B} \ mathbf {B} ^ {*}}. اکنون می توان تجزیه QR را نیز اعمال کرد\ displaystyle \ mathbf {B} ^ {*}}، منجر به\ displaystyle \ mathbf {B} ^ {*} = \ mathbf {Q} \ mathbf {R}} ، جایی که\ mathbf {Q  واحد است و \ mathbf {R مثلث فوقانی است درج تجزیه در بازده اصلی برابری

\ displaystyle A = \ mathbf {B} \ mathbf {B} ^ {*} = (\ mathbf {QR}) ^ {*} \ mathbf {QR} = \ mathbf {R} ^ {*} \ mathbf {Q } ^ {*} \ mathbf {QR} = \ mathbf {R} ^ {*} \ mathbf {R}. تنظیمات

\ displaystyle \ mathbf {L} = \ mathbf {R} ^ {*} اثبات را کامل می کند.

تعمیم [ ویرایش ]

فاکتورسازی Cholesky را می توان [با استناد به نیاز ] برای ماتریس (نه لزوما محدود) با ورودی اپراتور تعمیم داد . اجازه دهید

\ {{\ mathcal {H}} _ {n} \}دنباله ای از فضاهای هیلبرت باشید . ماتریس اپراتور را در نظر بگیرید

\ mathbf {A} = {\ آغاز {bmatrix} \ mathbf {A} _ {11} & \ mathbf {A _ {12} & \ mathbf {A} _ {13} & \؛ \\\ mathbf {A _ {12} ^ {*} & \ mathbf {A} _ {22} & \ mathbf {A} _ {23} & \؛ \\\ mathbf {A} _ {13} ^ {*} & \ mathbf {A} _ {23} ^ {*} & \ mathbf {A} _ {33} & \؛ \\\؛ & \؛ & \؛ & \ ddots \ end {bmatrix}

اقدام به مبلغ مستقیم

\ displaystyle {\ mathcal {H}} = \ bigoplus _ {n} {\ mathcal {H}} _ {n،

جایی که هر کدام

\ mathbf {A} _ {ij}: {\ mathcal {H}} _ {j} \ rightarrow {\ mathcal {H}} _ {i}

یک اپراتور محدود است . اگر A مثبت باشد (semidefinite) به این معنا که برای همه k K محدود و برای هر

\ displaystyle h \ in \ bigoplus _ {n = 1} ^ {k} {\ mathcal {H}} _ {k}،

ما داریم\ langle h، \ mathbf {A} h \ rangle \ geq 0، سپس یک ماتریس اپراتور مثلثی L پایین وجود دارد به گونه ای که A = LL *. همچنین می توان ورودی های مورب L را مثبت دانست.

منبع

https://en.wikipedia.org/wiki/Cholesky_decomposition#

ادامه ماتریس ژاکوبین

مثالها ویرایش

مثال 1 ویرایش ]

در نظر گرفتن تابع F  : ℝ 2 → ℝ 2 ، با

X ، Y ) ↦ ( 1 ( X ، Y )، F2 ( X ، Y ))،

 داده شده توسط

{\ displaystyle \ mathbf {f} \ left ({\ شروع {bmatrix x \\ y \ end {bmatrix}} \ Right) = {\ fill bmatrix} f_ {1} (x، y) \\ f_ 2} (x، y) \ end {bmatrix}} = {\ fill bmatrix} x ^ {2} y \\ 5x + \ sin y \ end {bmatrix}}.

سپس ما

f_ {1} (x، y) = x ^ {2} y

و

f_ {2} (x، y) = 5x + \ sin y

و ماتریس Jacobian از f است

\ mathbf {J} _ {\ mathbf {f} x (x، y) = {\ آغاز {bmatrix {\ dfrac {\ جزئی f_ {1}} {\ جزئی x}} & {\ dfrac {\ جزئی f_ 1}} {\ part y y}} \\ [1em] {\ dfrac {\ partial f_ {2}} part \ partial x}} & {\ dfrac {\ جزئی f_ {2}} {\ جزئی y}} \ end {bmatrix}} = {\ fill bmatrix} 2xy & x ^ {2} \\ 5 & \ cos y \ end {bmatrix

و تعیین کننده یعقوبیان است

\ det (\ mathbf {J} _ {\ mathbf {f}} (x، y)) = 2xy \ cos y-5x ^ {2.

مثال 2: تحول قطبی-دکارتی ویرایش ]

انتقال از مختصات قطبی r ، φ ) به مختصات دکارتی ( x ، y ) توسط تابع F : given + × [0، 2 π ) → ℝ 2 با اجزای:

{\ شروع {تراز شده} x & = r \ cos \ varphi؛ \\ y & = r \ sin \ varphi. \ end {تراز شده}

\ displaystyle \ mathbf {J} _ {\ mathbf {F} r (r، \ varphi) = {\ آغاز {bmatrix} {\ dfrac {\ جزئی x} {\ جزئی جزئی r}} & {\ dfrac {\ جزئی x} {\ partial \ varphi}} \\ [1em] {\ dfrac {\ partial y} {\ partial r}} & {\ dfrac {\ partial y} {\ partial \ varphi} \ end {bmatrix} = {\ fill bmatrix \ cos \ varphi & -r \ sin \ varphi \\\ sin \ varphi & r \ cos \ varphi \ end {bmatrix}}}

تعیین کننده Jacobian برابر با r است . این می تواند برای تبدیل انتگرال بین دو سیستم مختصات استفاده شود:

\ displaystyle \ iint _ {\ mathbf {F} (A) f (x، y) \، dx \، dy = \ iint _ {A} f (r \ cos \ varphi، r \ sin \ varphi) \ ، r \، dr \، d \ varphi.

مثال 3: تحول کروی- دکارتی ویرایش ]

تبدیل از مختصات کروی r ، θ ، φ ) به مختصات دکارتی ( x ، y ، z ) توسط تابع F :: + × [0، π ] × [0، 2 π ) → ℝ 3 با مؤلفه ها انجام می شود :

\ displaystyle {\ fill {تراز شده} x & = r \ sin \ vartheta \ cos \ phi؛ ​​\\ y & = r \ sin \ vartheta \ sin \ phi؛ ​​\\ z & = r \ cos \ vartheta. \ end {تراز شده }

ماتریس Jacobian برای این تغییر مختصات است

\ displaystyle \ mathbf {J} _ {\ mathbf {F}} (r، \ theta، \ varphi) = {\ آغاز {bmatrix} {\ dfrac {\ جزئی x} {\ جزئی r r} & {\ dfrac \ partial x} {\ partial \ phi}} & {\ dfrac {\ partial x} {\ partial \ vartheta}} \\ [1em] {\ dfrac {\ partial y} {\ جزئی r}} & {\ dfrac {\ partial y} {\ partial \ phi}} & {\ dfrac {\ part y y} {\ partial \ vartheta}} \\ [1em] \ dfrac {\ partial z} {\ جزئی r}} & { \ dfrac {\ partial z {\ partial \ phi}} & {\ dfrac {\ partial z} {\ partial \ vartheta} \ end {bmatrix}} = {\ fill bmatrix} \ sin \ vartheta \ cos \ phi & -r \ sin \ vartheta \ sin \ phi & r \ cos \ vartheta \ cos \ phi \\\ sin \ vartheta \ sin \ phi & r \ sin \ vartheta \ cos \ phi & r \ cos \ vartheta \ sin \ phi \ \\ cos \ vartheta & 0 & -r \ sin \ vartheta \ end {bmatrix}.

آنچه این را در تحول کروی-دکارتی نشان می دهد ، نسبت مساحت پایه جدید (پایه کروی) نسبت به پایه اصلی (x ، y ، z) است. [ نیاز به توضیح ]

تعیین است 2 گناه φ . به عنوان مثال ، از dV = dx dy dz این تعیین کننده دلالت بر این دارد که عنصر حجم دیفرانسیل dV = - 2 sin θ dr dθ  . برخلاف تغییر مختصات دکارتی ، این تعیین کننده ثابت نیست و با مختصات ( r و θ ) متفاوت است.

مثال 4 ویرایش ]

ماتریس Jacobian از تابع F  : ℝ 3 ℝ 4 با مؤلفه ها

{\ شروع {تراز شده} y_ {1} & = x_ {1} \\ y_ {2} & = 5x_ {3} \\ y_ {3} & = 4x_ {2} ^ {2} -2x_ {3} \ \ y_ {4} & = x_ {3} \ sin x_ {1} \ end {تراز شده}}

است

\ mathbf {J} _ {\ mathbf {F}} (x_ {1}، x_ {2}، x_ {3}) = {\ آغاز {bmatrix {\ dfrac {\ جزئی y_ {1}} {\ جزئی x_ {1}}} & {\ dfrac {\ part y_ {1}} {\ partial x_ {2}}} & {\ dfrac {\ جزئی y_ {1}} {\ جزئی x_ {3}}} \\ [1em] \ dfrac {\ جزئی y_ {2}} {\ جزئی x_ {1}}} & {\ dfrac {\ جزئی y_ {2}} {\ جزئی x_ {2}}} & {\ dfrac {\ جزئی y_ {2}} part \ جزئی x_ {3}}} \\ [1em] {\ dfrac {\ جزئی y_ {3}} {\ جزئی x_ {1}}} & {\ dfrac {\ جزئی y_ {3 }} {\ partial x_ {2}}} & {\ dfrac {\ part y y {3}} {\ partial x_ {3}}} \\ [1em] \ dfrac {\ جزئی y_ {4}} {\ جزئی x_ {1}}} & {\ dfrac {\ جزئی y_ {4}} {\ جزئی x_ {2}}} & {\ dfrac {\ جزئی y_ {4}} {\ جزئی x_ {3}}} \ end bmatrix}} = {\ fill {bmatrix} 1 & 0 & 0 \\ 0 & 0 & 5 \\ 0 & 8x_ {2} & - 2 \\ x_ {3} \ cos x_ {1} & 0 & \ sin x_ {1} \ end {bmatrix}} .

این مثال نشان می دهد که ماتریس Jacobian نیازی به ماتریس مربع ندارد.

مثال 5 ویرایش ]

تعیین کننده Jacobian از عملکرد F  : ℝ 3 ℝ 3 با مؤلفه ها

{\ شروع {تراز شده} y_ {1} & = 5x_ {2} \\ y_ {2} & = 4x_ {1} ^ {2} -2 \ sin (x_ {2} x_ {3}) \\ y_ 3} & = x_ {2} x_ {3} \ end {تراز شده}}

است

{\ fill vmatrix} 0 & 5 & 0 \\ 8x_ {1} & - 2x_ {3} \ cos (x_ {2} x_ {3}) & - 2x_ {2} \ cos (x_ {2} x_ {3}) \ \ 0 & x_ {3} & x_ {2} \ end {vmatrix}} = - 8x_ {1} {\ آغاز {vmatrix 5 & 0 \\ x_ {3} & x_ {2} \ end {vmatrix}} = - 40x_ {1} x_ {2.

از این رو می بینیم که F جهت یابی را در نزدیکی نقاطی که 1 و 2 دارای یک نشانه هستند معکوس می کند . این تابع به صورت محلی غیرقابل برگشت است بجز نقاط نزدیک که 1 = 0 یا 2 = 0 باشد. بصری ، اگر کسی با یک جسم کوچک در اطراف نقطه (1 ، 2 ، 3) شروع کرده و F را بر روی آن جسم اعمال کند ، یک شیء با تقریباً 40 × 1 × 2 = 80 برابر حجم اصلی دریافت می کند ، با جهت گیری معکوس شد

منبع

https://en.wikipedia.org/wiki/Jacobian_matrix_and_determinant

قضیه بنیادی فضاهای هیلبرت

 

در ریاضیات ، به طور خاص در تجزیه و تحلیل عملکردی و نظریه فضای هیلبرت ، تئوری بنیادی فضاهای هیلبرت شرط ضروری و کافی را فراهم می کند تا یک فضای قبل از هیلدورف هاسدورف یک فضای هیلبرت از نظر ایزومتری عادی یک فضای قبل از هیلبرت باشد. ضد دوگانه .

 

فهرست

بیانیه ویرایش ]

مقدماتی ویرایش ]

اشکال نیمه تمام ، اشکال سسکولینار ، و ضد دوگانه ویرایش ]

فرض کنید H یک فضای بردار توپولوژیکی (TVS) است. یک تابع L  : H → ℂ است که به نام semilinear یا خطی اگر برای همه X ، Y ∈ H و همه اسکالرهای  ،( L ( X + Y ) = L ( X ) + L ( Y  و(L(c x) = {\displaystyle {\overline {c}}} L(x فضای برداری از تمام توابع پیوسته semilinear در H است به نام ضد دوگانه از H است و توسط نشان داده می شود{\ displaystyle {\ Overline {H}} ^ {\ Prime}}(در مقابل ، فضای دوتایی مداوم H با مشخص شده است\ displaystyle H ^ {\ نخست}}) و با تحمل آن با هنجار متعارف (به همان روشی كه هنجار كانونی در فضای دوتایی مداوم H است تعریف می کنیم) به یك فضای عادی تبدیل می شویم . [1] یک فرم پیمایشی یک نقشه B  : H × H → است به گونه ای که برای همه y ∈ H ، نقشه تعریف شده توسط x ↦ B ( x ، y ) خطی است و برای همه x ∈ H ، نقشه تعریف شده توسط (y ↦ B ( x ، y نیمه تمام است. [1] توجه داشته باشید که در فیزیک ، این کنوانسیون به این صورت است که فرم مختصری به صورت خطی در مختصات دوم و آنتی قطبی در اولین مختصات خود وجود دارد.

فرم sesquilinear در H نامیده می شود مثبت قطعی اگر B ( X ، X )> 0 برای همه غیر 0 X ∈ H ؛ اگر B ( x ، X ) for برای همه x ∈ H باشد ، آن را غیر منفی می نامیم . [1] یک فرم کنسانتره B در H به صورت فرم هرمیتیت نامیده می شود اگر علاوه بر این دارای خاصیت آن باشد{\ displaystyle B (x، y) = {\ overline {B (x، y)}}برای همه X ، Y ∈ H . [1]

فضاهای پیش هیلبرت و هیلبرت ویرایش ]

فضای هیلبرت از پیش یک جفت متشکل از یک فضای برداری است H و یک فرم sesquilinear غیر منفی B در H ؛ اگر علاوه بر این ، این فرم پایدار B تعریف مثبت باشد ، ( H ، B ) یک فضای قبل از هیلبرتوس Hausdorff نامیده می شود . [1] اگر B غیر منفی باشد ، باعث ایجاد سمینوروم معمولی در H می شود\ | \ cdot \ |، تعریف شده توسط x ↦ B ( x ، x ) 1/2 ، در صورتی که اگر B نیز قطعی مثبت باشد ، این نقشه یک هنجار است لازم است برای تنظیم مجدد ] . [1] این نیمه هنجار معمولی باعث می شود هر فضای قبل از هیلبرت به یک فضای نیمه هورمبر و هر فضای قبل از هیلدورف قبل از هیلبرت در یک فضای نرمال تبدیل شود . یک فضای قبل از هیلدورف قبل از هیلبرت که کامل است ، فضای هیلبرت نامیده می شود .

نقشه متعارف به ضد دوتایی ویرایش ]

اگر ( H ، B ) یک فضای قبل از هیلبرت باشد ، آنگاه نقشه متعارف از H به ضد دوتایی آن می رسد{\ displaystyle {\ Overline {H}} ^ {\ Prime}} نقشه است {\ displaystyle H \ to {\ overline {H}} ^ {\ Prime}} تعریف شده توسط \ displaystyle x \ mapsto B (x، \ bullet)، جایی که \ نمایشگر B (x ، \ گلوله): H \ to \ mathbb {C}نقشه تعریف شده توسط [y ↦ B ( x ، y ). [1 اگر ( H ، B ) یک فضای قبل از هیلبرت باشد ، این نقشه متعارف خطی و مداوم است. این نقشه یک ایزومتری بر روی یک فضای فرعی بردار ضد دوگانه است اگر و فقط اگر ( H ، B ) یک هاسدورف پیش هیلبرت است. [1]

قضیه بنیادی ویرایش ]

قضیه اساسی فضاهای هیلبرت : [1] فرض کنید که ( H ، B ) است هاسدورف پیش هیلبرت فضای که در آن B  : H × H → ℂ است فرم sesquilinear است که خطی در آن برای اولین بار از هماهنگی و semilinear در آن دوم هماهنگ می کند. سپس نگاشت خطی های متعارف از H به ضد دوگانه از H است پوشا اگر و تنها اگر ( H ، B ) فضای هیلبرت، که در این صورت بر روی نقشه متعارف پوشا است است همسان ازH بر روی ضد دوگانه خود است.

منبع

https://en.wikipedia.org/wiki/Fundamental_theorem_of_Hilbert_spaces

تجزیه QR


 

در جبر خطی ، یک تجزیه و تحلیل QR ، همچنین به عنوان فاکتورسازی QR یا فاکتورسازی QU شناخته می شود ، تجزیه یک ماتریس A به یک محصول A  =  QR از یک ماتریس متعامد Q و یک ماتریس مثلثی بالا است . تجزیه QR اغلب برای حل مسئله حداقل مربعات خطی مورد استفاده قرار می گیرد و پایه و اساس یک الگوریتم خاص مقدمه خاص ، الگوریتم QR است .

 

فهرست

موارد و تعاریف ویرایش ]

ماتریس مربع ویرایش ]

هر واقعی ماتریس مربع ممکن است به عنوان تجزیه

 A = QR ، \ ،

که در آن Q یک ماتریس متعامد است (ستون های آن بردارهای واحد متعامد به معنی هستند= I\ displaystyle Q ^ {\ Texff {T}} Q = QQ ^ {\ Texff {T}} = I) و R یک ماتریس مثلثی فوقانی است (از این رو نام ماتریس مثلثی راست نیز نامیده می شود). اگر است وارون ، سپس فاکتور منحصر به فرد است در صورت نیاز به عناصر مورب R مثبت باشد.

اگر در عوض A یک ماتریس مربع پیچیده باشد ، پس تجزیه A = QR وجود دارد که Q یک ماتریس واحد است (بنابراین\ displaystyle Q ^ {*} Q = QQ ^ {*} = I)

اگر است مستقل خطی ستون، پس از آن اولین نفر ستون از Q فرم اساس orthonormal برای فضای ستون از . به طور کلی، برای اولین بار ک ستون از Q به صورت orthonormal برای فرم دهانه از اولین K ستون از برای هر 1 ≤  K  ≤  N . [1] این واقعیت که هر ستون K از تنها در اولین بستگی دارد ک ستون از Q مسئول شکل مثلثی  R است . [1]

ماتریس مستطیل شکل ویرایش ]

به طور کلی، ما می توانیم یک مجتمع عامل متر × N ماتریس ، با متر  ≥  N ، به عنوان محصول یک متر × متر ماتریس واحد Q و یک متر × N ماتریس بالا مثلثی R . از آنجا که سطرهای پایین ( m - n ) یک ماتریس مثلثی فوقانی m × n کاملاً از صفر تشکیل شده است ، اغلب برای تقسیم R یا هر دو R و Q مفید است :

\ displaystyle A = QR = Q {\ شروع {bmatrix} R_ {1} \\ 0 \ end {bmatrix} = {\ fill bmatrix} Q_ {1، Q_ {2} \ end {bmatrix}} { \ fill bmatrix} R_ {1} \\ 0 \ end {bmatrix}} = Q_ {1} R_ {1}،

که در آن 1 یک IS N × N ماتریس بالا مثلثی، 0 است ( متر  -  N ) × N ماتریس صفر، 1 است متر × N ، 2 است متر × ( متر  -  N ) و 1 و 2 هر دو ستون های متعامد

گلوب و ون وام (1996 ، §5.2) پاسخ فاکتور QR نازک از ؛ Trefethen و Bau این را عامل پایین تر QR می نامند . [1] اگر است کامل رتبه N و ما نیاز دارند که عناصر مورب 1 مثبت سپس 1 و 1 منحصر به فرد هستند، اما در کل 2 است. 1 و سپس به عامل مثلثی بالای برابر است تجزیه Cholesky از * A (=  A اگر A واقعی باشد).

تجزیه QL ، RQ و LQ ویرایش ]

به طور مشابه ، ما می توانیم تجزیه QL ، RQ و LQ را تعریف کنیم که L یک ماتریس مثلثی پایین تر است.

محاسبه تجزیه QR ویرایش ]

روشهای مختلفی برای محاسبه در واقع تجزیه QR وجود دارد ، از جمله با استفاده از فرآیند گرم-اشمیت ، تحولات خانه دار یا چرخش گینز . هر کدام دارای چندین مزیت و مضرات هستند.

با استفاده از فرآیند گرم-اشمیت ویرایش ]

اطلاعات بیشتر: گرم-اشمیت stability ثبات عددی

فرایند Gram-Schmidt را که در ستونهای ماتریس مرتبه کامل ستون اعمال می شود ، در نظر بگیرید{\ displaystyle A = \ left [\ mathbf {a} _ {1}، \ ldots، \ mathbf {a} _ {n} \ Right]\ displaystyle \ langle \ mathbf {v}، \ mathbf {w} \ rangle = \ mathbf {v} ^ {\ textf T}} \ mathbf {w} (یا\ displaystyle \ langle \ mathbf {v}، \ mathbf {w} \ rangle = \ mathbf {v} ^ {*} \ mathbf {w} برای مورد پیچیده).

طرح را تعریف کنید :

\ displaystyle \ operatorname {proj} _ {\ mathbf {u}} \ mathbf {a} = {\ frac {\ left \ langle \ mathbf {u}، \ mathbf {a} \ Right \ rangle} {\ چپ \ langle \ mathbf {u}، \ mathbf {u} \ Right \ rangle}} {\ mathbf {u}}}

سپس:

\ displaystyle {\ شروع {تراز شده} \ mathbf {u} _ {1} & = \ mathbf {a} _ {1} ، & \ mathbf {e} _ {1} & = {\ mathbf {u} _ 1} \ over \ | \ mathbf {u} _ {1} \ |} \\\ mathbf {u} _ {2} & = \ mathbf {a} _ {2 - \ operatorname {proj} _ {\ mathbf {u} _ {1}} \، \ mathbf {a} _ {2}، & \ mathbf {e} _ {2} & = {\ mathbf {u} _ {2} \ over \ | \ mathbf {u _ {2} \ |} \\\ mathbf {u} _ {3} & = \ mathbf {a} _ {3} - \ operatorname {proj} _ {\ mathbf {u} _ {1}} \، \ mathbf {a} _ {3} - \ operatorname {proj} _ {\ mathbf {u} _ {2}} \، \ mathbf {a} _ {3}، & \ mathbf {e} _ {3} & = {\ mathbf {u} _ {3} \ over \ | \ mathbf {u} _ {3} \ |} \\ & \ vdots && \ vdots \\\ mathbf {u} _ {k} & = \ mathbf a _ {k} - \ sum _ {j = 1} ^ {k-1} \ operatorname {proj} _ {\ mathbf {u} _ {j}} \، \ mathbf {a} _ {k} ، & \ mathbf {e} _ {k} & = {\ mathbf {u} _ {k} \ over \ | \ mathbf {u} _ {k} \ |} \ end {تراز شده}}

اکنون می توانیم بیان کنیم\ mathbf {a} _iبر اساس مبنای ارتودنسی تازه محاسبه شده ما:

\ displaystyle {\ شروع {تراز شده} \ mathbf {a} _ {1} & = \ langle \ mathbf {e} _ {1}، \ mathbf {a} _ {1} \ rangle \ mathbf {e} _ { 1} \\\ mathbf {a} _ {2} & = langle \ mathbf {e} _ {1}، \ mathbf {a} _ {2} \ rangle \ mathbf {e} _ {1} + \ langle \ mathbf {e} _ {2}، \ mathbf {a} _ {2} \ rangle \ mathbf {e} _ {2} \\\ mathbf {a} _ {3} & = langle \ mathbf {e} _ {1} ، \ mathbf {a} _ {3} \ rangle \ mathbf {e} _ {1} + \ langle \ mathbf {e} _ {2}، \ mathbf {a} _ {3} \ rangle \ mathbf {e} _ {2} + \ langle \ mathbf {e} _ {3}، \ mathbf {a} _ {3} \ rangle \ mathbf {e} _ {3} \\ & \ vdots \\\ mathbf {a _ {k} & = \ sum _ {j = 1} ^ {k} \ langle \ mathbf {e} _ {j}، \ mathbf {a} _ {k} \ rangle \ mathbf {e} _ {j} \ end {تراز شده}}}

\ displaystyle \ left \ langle \ mathbf {e} _ {i}، \ mathbf {a} _ {i} \ Right \ rangle = \ left \ | \ mathbf {u} _ {i} \ Right \ |}. این را می توان به شکل ماتریس نوشت:

A = QR

جایی که:

{\ displaystyle Q = \ left [\ mathbf {e} _ {1}، \ ldots، \ mathbf {e} _ {n} \ Right]

و

\ displaystyle R = {\ fill {pmatrix} \ langle \ mathbf {e} _ {1}، \ mathbf {a} _ {1} \ rangle & \ langle \ mathbf {e} _ {1}، \ mathbf { a} _ {2} \ rangle & \ langle \ mathbf {e} _ {1}، \ mathbf {a} _ {3 \ rangle & \ ldots \\ 0 & langle \ mathbf {e} _ {2}، \ mathbf {a} _ {2} \ rangle & \ langle \ mathbf {e} _ {2}، \ mathbf {a} _ {3} \ rangle & \ ldots \\ 0 & 0 & \ langle \ mathbf {e} _ { 3} ، \ mathbf {a} _ {3} \ rangle & \ ldots \\\ vdots & \ vdots & \ vdots & \ ddots \ end {pmatrix}.

مثال ویرایش ]

در نظر بگیرید تجزیه

\ displaystyle A = {\ fill {pmatrix} 12 & -51 & 4 \\ 6 & 167 & -68 \\ - 4 & 24 & -41 \ end {pmatrix}}.

به یاد بیاورید که یک ماتریس متعامد متعارف س دارایی داره

\ displaystyle Q ^ {\ textf {T}} \، Q = I.

سپس ، می توانیم محاسبه کنیم س با استفاده از گرم-اشمیت به شرح زیر است:

\ displaystyle {\ fill {تراز شده} U = {\ fill {pmatrix} \ mathbf {u} _ {1} & \ mathbf {u} _ {2} & \ mathbf {u} _ {3} \ end {pmatrix }} & = {\ fill {pmatrix} 12 & -69 & -58 / 5 \\ 6 & 158 & 6/5 \\ - 4 & 30 & -33 \ end {pmatrix}}؛ \\ Q = {\ fill pmatrix} {\ frac {\ mathbf {u} _ {1}} {\ | \ mathbf {u} _ {1} \ |}} & {\ frac {\ mathbf {u} _ {2}} {\ | \ mathbf {u} _ { 2} \ |}} & {\ frac {\ mathbf {u} _ {3}} {\ | \ mathbf {u} _ {3} \ |}} \ end {pmatrix} & = begin \ آغاز {pmatrix } 6/7 & -69 / 175 & -58 / 175 \\ 3/7 & 158/175 & 6/175 \\ - 2/7 & 6/35 & -33 / 35 \ end {pmatrix}}. \ end {تراز شده}}

بنابراین ، ما داریم

\ displaystyle {\ شروع {تراز شده} Q ^ {\ Texff {T}} A & = Q ^ {\ Texf {T}} Q \، R = R؛ \\ R & = Q ^ {\ tekstf T}} A = {\ fill pmatrix} 14 & 21 & -14 \\ 0 & 175 & -70 \\ 0 & 0 & 35 \ end {pmatrix}}. \ end {تراز شده}}}

رابطه با تجزیه RQ ویرایش ]

تجزیه RQ یک ماتریس A را به محصول یک ماتریس مثلثی R بالایی (که به عنوان مثلث راست نیز معروف است) و یک ماتریس Q متعامد متعامد تبدیل می کند . تنها تفاوت در تجزیه QR ، ترتیب این ماتریس ها است.

تجزیه QR ارتودنسی ستون های گرم-اشمیت ستون های A است که از ستون اول شروع شده است.

تجزیه RQ ارتودنسی سازی گرم-اشمیت ردیف های A است ، از ردیف آخر شروع شده است.

مزایا و معایب ویرایش ]

روند گرام-اشمیت ذاتاً از نظر عددی بی ثبات است. در حالی که کاربرد پیش بینی ها دارای یک قیاس هندسی جذاب با ارتزونزاسیون است ، خود ارتودنسی شدن مستعد خطای عددی است. با این وجود یک مزیت مهم سهولت اجرای آن است که باعث می شود در صورت عدم دسترسی کتابخانه جبر خطی از پیش ساخته ، از الگوریتم مفیدی برای نمونه سازی استفاده شود.

استفاده از بازتاب های خانه دار ویرایش ]

بازتاب خانه دار برای تجزیه و تحلیل QR: هدف این است که یک تحول خطی پیدا کنید که بردار را تغییر می دهدایکس به یک بردار با همان طول که برابر است با خط e_ {1. ما می توانیم از یک طرح ریزی متعامد (گرم-اشمیت) استفاده کنیم اما اگر بردارها از نظر عددی ناپایدار باشند.ایکس وe_ {1نزدیک به متعامد هستند. در عوض ، انعکاس خانه دار از طریق خط نقطه ای (که برای گسسته کردن زاویه بین آنها انتخاب شده است) منعکس می شود{\ نمایشگر x}ایکس و {\ نمایشگر e_ {1}}e_ {1) حداکثر زاویه با این ترانسفر 45 درجه است.

سرپرست خانوار بازتاب (یا سرپرست خانوار تحول ) یک تغییر و تحول که طول می کشد یک بردار و آن را نشان دهنده در مورد برخی است هواپیما و یا ابرصفحه . ما می توانیم از این عملیات برای محاسبه فاکتور QR یک ماتریس m -by- n استفاده کنیمآبا m  ≥  n .

Q می تواند برای بازتاب یک بردار به گونه ای استفاده شود که همه مختصات اما یکی از بین بروند.

اجازه دهید \ mathbf {x یک واقعی خودسرانه متر بردار ستونی بعدی ازآ به طوری که \ | \ mathbf {x} \ |  = | \ alpha |برای یک اسکالر α . اگر این الگوریتم با استفاده از حساسیت شناور-نقطه شناور پیاده سازی شود ، باید α علامت مخالف را به عنوان مختصات k -th از\ mathbf {x ، جایی که x_ {k}این است که به محور مختصات و پس از آن تمام پست های 0 در ماتریس ، بازدید کنندگان نهایی شکل مثلثی بالا، برای جلوگیری از از دست دادن اهمیت . در مورد پیچیده ، مجموعه

\ displaystyle \ alpha = -e ^ {i \ arg x_ {k}} \ | \ mathbf {x} \ |

Stoer & Bulirsch 2002 ، p. 225) و جابجایی پیوند مزدوج را در ساخت و ساز Q در زیر جایگزین کنید

بعد ، کجا \ mathbf {e} _ {1}وکتور است (1 0… 0) T ، || · || است هنجار اقلیدسی ومنیک IS متر -by- متر ماتریس، مجموعه ای

\ displaystyle {\ شروع {تراز شده} \ mathbf {u} & = \ mathbf {x} - \ alpha \ mathbf {e} _ {1}، \\\ mathbf {v} & = {\ mathbf {u} \ over \ | \ mathbf {u} \ |}، \\ Q& = I-2 \ mathbf {v} \ mathbf {v} ^ {\ متنff {T}}. \ end {تراز شده}}}

یا اگر آ پیچیده است

\ displaystyle Q = I-2 \ mathbf {v} \ mathbf {v} ^ {*}.

{\ نمایشگر Q}سیک متر -by- متر سرپرست خانوار ماتریس و

\ displaystyle Q \ mathbf {x} = {\ fill {pmatrix} \ alpha & 0 & \ cdots & 0 \ end {pmatrix}} ^ {\ Texff {T}}. \،

این را می توان به تدریج تبدیل یک استفاده متر -by- N ماتریس به بالا مثلثی شکل. ابتدا ، A را با ماتریس 1 که در اولین ستون ماتریس برای x انتخاب می کنیم ضرب می کنیم . این منجر به یک ماتریس A با صفرهای در ستون سمت چپ (به جز ردیف اول) می شود.

\ displaystyle Q_ {1} A = {\ fill bmatrix} \ alpha _ {1} & \ star & \ dots & \ star \\ 0 &&&&=* vdots && A '& \\ 0&&&& end / mat bmatrix}}

این می تواند برای A repeated تکرار شود ( با حذف ردیف اول و ستون اول از A بدست می آید ) ، و در نتیجه یک ماتریس Householder Q ′ 2 حاصل می شود . توجه داشته باشید که Q ، 2 کوچکتر از 1 . از آنجا که ما می خواهیم آن را واقعا به در عمل 1 جای "ما نیاز به گسترش آن را به سمت چپ بالا، پر کردن یک 1 و یا به طور کلی:

\ displaystyle Q_ {k} = {\ fill pmatrix} I_ {k-1} & 0 \\ 0 & Q_ {k} '\ end {pmatrix}.

بعد از تی تکرار این روند ،\ displaystyle t = \ دقیقه (m-1 ، n)،

{\ displaystyle R = Q_ {t} \ cdots Q_ {2} Q_ {1} A

یک ماتریس مثلثی فوقانی است. بنابراین ، با

\ displaystyle Q = Q_ {1} ^ {\ Texff {T}} Q_ {2} ^ {\ Texff {T}} \ cdots Q_ {t} ^ {\ textf T}}،

A = QR تجزیه QR استآ.

این روش از ثبات عددی بیشتری نسبت به روش گرام-اشمیت در بالا برخوردار است.

در جدول زیر تعداد عملیات در مرحله k -th QR- تجزیه QR با تبدیل خانه دار آورده شده است ، با فرض یک ماتریس مربع با اندازه n .

عملتعداد عملیات در مرحله k -th
ضربات\ displaystyle 2 (n-k + 1) ^ {2}
موارد اضافی\ displaystyle (n-k + 1) ^ {2} + (n-k + 1) (nk) +2}
بخش1
ریشه دوم1

با جمع بندی این اعداد در مرحله n  - 1 (برای یک ماتریس مربع از اندازه n ) ، پیچیدگی الگوریتم (از نظر ضرب های نقطه شناور) توسط

\ displaystyle {\ frac {2} {3}} n ^ {3} + n ^ {2} + {\ frac {1} {3}} n-2 = O \ left (n ^ {3} \ Right .

مثال ویرایش ]

بگذارید تجزیه را محاسبه کنیم

\ displaystyle A = {\ fill {pmatrix} 12 & -51 & 4 \\ 6 & 167 & -68 \\ - 4 & 24 & -41 \ end {pmatrix}}.

ابتدا باید بازتابی پیدا کنیم که اولین ستون ماتریس A ، وکتور را دگرگون کند\ displaystyle \ mathbf {a _ {1} = {\ fill {pmatrix} 12 & 6 & -4 \ end {pmatrix}} ^ {\ Texsf {T}}}، به \ displaystyle \ left \ | \ mathbf {a} _ {1} \ Right \ | \؛ \ mathbf {e} _ {1} = {\ fill pmatrix} 1 & 0 & 0 \ end {pmatrix}} ^ {\ متنf T}}.

اکنون،

\ mathbf {u} = \ mathbf {x} - \ alpha \ mathbf {e} _1،

و

\ displaystyle \ mathbf {v} = {\ mathbf {u} \ over \ | \ mathbf {u} \ |}.}

اینجا،

\ displaystyle \ alpha = 14 و\ displaystyle \ mathbf {x} = \ mathbf {a _ {1} = {\ fill {pmatrix} 12 & 6 & -4 \ end {pmatrix} ^ {\ Texff {T}}}

از این رو

\ displaystyle \ mathbf {u} = {\ fill {pmatrix} -2 & 6 & -4 \ end {pmatrix} ^ {\ Texff {T}} = {\ fill pmatrix 2 \ end {pmatrix}} {\ pmatrix} -1 & 3 & -2 \ end {pmatrix} ^ {\ textf T}}} و\ displaystyle \ mathbf {v} = {1 \ over {\ sqrt {14}}} {\ fill {pmatrix} -1 & 3 & -2 \ end {pmatrix} ^ {\ Texff {T}}}و بعد

\ displaystyle {\ شروع {تراز شده} Q_ {1} = {} & I- {2 \ {\ sqrt {14}} {\ sqrt {14}}} {\ آغاز {pmatrix} -1 \\ 3 \\ -2 \ end {pmatrix}} {\ fill {pmatrix} -1 & 3 & -2 \ end {pmatrix}} \\ = {} & I- {1 \ over 7 {\ fill pmatrix 1 & -3 & 2 \\ - 3 & 9 & -6 \\ 2 & -6 & 4 \ end {pmatrix}} \\ = {} & {\ fill pmatrix} 6/7 & 3/7 & -2 / 7 \\ 3/7 & -2 / 7 & 6/7 \\ - 2 / 7 و 6/7 و 3/7 \ پایان \ {pmatrix}}.

اکنون مشاهده کنید:

\ displaystyle Q_ {1} A = {\ fill pmatrix} 14 & 21 & -14 \\ 0 & -49 & -14 \\ 0 & 168 & -77 \ end {pmatrix}}،}

بنابراین ما در حال حاضر تقریبا یک ماتریس مثلثی داریم. فقط باید ورودی (3 و 2) را صفر کنیم.

(1 ، 1) جزئی را بگیرید و دوباره این روند را روی آن اعمال کنید

\ displaystyle A '= M_ {11} = {\ fill pmatrix 49 -49 & -14 \\ 168 & -77 \ end {pmatrix}.}

با همان روشی که در بالا ذکر شد ، ماتریس تحول Householder را بدست می آوریم

\ displaystyle Q_ {2} = {\ fill {pmatrix} 1 & 0 & 0 \\ 0 & -7 / 25 & 24/25 \\ 0 & 24/25 & 7/25 \ end pmatrix}}

پس از انجام یک مبلغ مستقیم با 1 تا اطمینان حاصل کنید که مرحله بعدی روند صحیح کار می کند.

اکنون ، ما می یابیم

\ displaystyle Q = Q_ {1} ^ {\ Texff {T}} Q_ {2} ^ {\ Texff {T}} = {\ fill pmatrix} 6/7 & -69 / 175 & 58/175 \\ 3/7 & 158 / 175 & -6 / 175 \\ - 2/7 & 6/35 & 33/35 \ end {pmatrix}}

یا به چهار رقم اعشاری ،

\ displaystyle {\ fill {تراز شده} Q & = Q_ {1} ^ {\ Texff {T}} Q_ {2} ^ {\ Texff {T}} = {\ fill pmatrix 0.8571 & -0.3943 & 0.3314 \ \ 0.4286 & 0.9029 & -0.0343 \\ - 0.2857 & 0.1714 & 0.9429 \ end {pmatrix} \\ R & = Q_ {2} Q_ {1} A = Q ^ {\ Texff {T}} A = {\ pmatrix} 14 & 21 & -14 \\ 0 & 175 & -70 \\ 0 & 0 & -35 \ end {pmatrix}}. \ end {تراز وسط}}

ماتریس Q بصورت متعامد و R مثلثی فوقانی است ، بنابراین A = QR تجزیه QR مورد نیاز است.

منبع

https://en.wikipedia.org/wiki/QR_decomposition

قضیه گرشگورین

در تجزیه و تحلیل عددی ، قضیه گرشگورین نتیجه ای است که اجازه می دهد پیش زمینه های ویژه یک ماتریس مربع را محدود کند. این کتاب در سال 1931 توسط ریاضیدان بلاروس Semion Gerschgorin Note 1 منتشر شد . این نتیجه به ویژه در موارد خاص ماتریس تصادفی استفاده می شود.

 

خلاصه

قضیه ویرایش تغییر کد ]

بیانیه ویرایش تغییر کد ]

اجازه دهید فرضکنید A پیچیده ماتریس اندازه N × N ، از اصطلاح کلی ( IJ ). برای هر شاخص خط iبین 1 و N معرفی می کنیم مربوط دیسک گرشگورین

\ displaystyle D_ {i} = \ left \ {z \ in \ mathbb {C}، | a_ {ii} -z | \ leq \ sum _ {j \ neq i} | a_ {ij} | \ Right \ = D (a_ {ii} ، R_ {i}) ~ ،}

که به طور موثر دیسک را در صفحه پیچیده تشکیل می دهد ، شعاع R i = Σ j ≠ i | ij |.

قضیه  : هر مقدمه ویژه A حداقل به یکی از دیسک های گرشگورین تعلق دارد.

با استفاده از قضیه به ماتریس منتقل از ، اطلاعات جدید در محل مقادیر ویژه داده می شود: آنها در این اتحادیه از دیسک های گرشگورین مرتبط با ستون یافت

\ displaystyle \ tilde {D}} _ {j} = \ left \ {z \ in \ mathbb {C}، | a_ {jj} -z | \ leq \ sum _ {i \ neq j} | a_ ij} | \ Right \} = D (a_ {jj}، {\ tilde {R}} _ {j}) ~.}

تظاهرات ویرایش تغییر کد ]

بگذارید λ یک مقدمه مهم A و (x = ( 1 ، ... ، n  یک مجرای وابسته باشد. برای iبین 1 تا n داریم

(\ lambda -a _ {{ii}}) x_ {i} = \ sum _ {{j \ neq i}} a _ {{ij}} x_ {j

بگذارید یک فهرست i را انتخاب کنیم که مدول i حداکثر باشد. از آنجا که x یک ویژه ویژه است ، | x i | nonzero است و شکل دهی به آن امکان پذیر است

| a _ {{ii}} - \ lambda | = \ left | \ sum _ {{j \ neq i}} a _ {j ij}} {\ frac {x_ {j}} {x_ {i}} right \ درست | \ leq \ sum _ {{j \ neq i}} | a _ {{ij}} {\ frac {x_ {j}} {x_ {i}}} | \ leq \ sum _ {{j \ neq i } | a _ {{ij}} |

یک نوع تظاهرات این است که توجه کنید 0 ارزش مقدماتی است A- \ lambda I_ {n و از لیم Hadamard استفاده کنید .

منبع

https://fr.wikipedia.org/wiki/Th%C3%A9or%C3%A8me_de_Gerschgorin

ماتریس غالب مورب

ر ریاضیات عددی، ماتریس غالب مورب نشان یک کلاس از درجه دوم ماتریس را با شرط اضافه در خود اصلی عناصر مورب . اصطلاح مورب تک قطبی غالباً متناقض در ادبیات استفاده می شود ، گاهی اوقات برای غالب کاملاً مورب و گاه غالب مورب ضعیف . [1] [2] [3] هر دو عبارت در زیر با جزئیات بیشتری توضیح داده شده است.

 

فهرست

ماتریس کاملاً مورب غالب ویرایش ویرایش منبع ]

تعریف ویرایش ویرایش منبع ]

(n \ n n)-ماتریکسA = (a_ {ij})به معنای دقیق (همچنین: به شدت یا به شدت) مورب مسلط است ، اگر مقادیر عناصر مورب آنها باشدa _ {{ii}} هر کدام از تعداد مبالغ ورودی های خط مربوطه بیشتر هستندa_ {ijد. یعنی اگر برای همه باشدi \ in \ {1، \ ldots، n \اعمال می شود [4]

\ sum _ {j = 1 \ atop j \ neq i} ^ {n} | a_ {ij} | <| a_ {ii} |.

این معیار همچنین معیار جمع ردیف قوی نامیده می شود و معادل معیار ستون مربوطه نیست ، اما با تعریف آن معادل معیار ستون ماتریس منتقل شده است .

برنامه ها ویرایش ویرایش منبع ]

ماتریسهای پیچیده و کاملاً مورب غالب به دلیل محافل Gerschgorin معمولاً مرتب هستند ، همانطور که ماتریسهای مثلثی فوقانی و تحتانی نیز با صفر کردن ورودی های خاص از آنها به دست می آیند. در بعضی از روشها برای حل سیستم معادلات (مثلاً روشهای گاوس-سییدل ، ژاکوبی یا SOR ) ، تسلط مورب ماتریس سیستم ، به ویژه خاصیت دوم ، معیار کافی برای همگرایی روش ارائه می دهد.

ماتریس ضعیف مورب غالب ویرایش ویرایش منبع ]

تعریف ویرایش ویرایش منبع ]

n \ n n-ماتریکسA = (a_ {ij})نامیده می شود ضعیف مورب غالب اگر مقدار عناصر موربa _ {{ii}} در هر حالت بیشتر یا مساوی با مبالغ مقدار ورودی های خط مربوطه باقی مانده است a_ {ijد ، یعنی اگر برای همه باشدi \ in \ {1، \ ldots، n \اعمال می شود [1]

\ sum _ {j = 1 \ atop j \ neq i} ^ {n} | a_ {ij} | \ leq | a_ {ii} |.

خصوصیات ویرایش ویرایش منبع ]

  • مجموعه ای از ماتریس های غالب مورب ضعیف بنابراین مجموعه ای از ماتریس های غالب به طور مورب مورب را شامل می شود.
  • ماتریس های واقعی ، متقارن ، ضعیف مورب مسلط با ورودی های مورب غیر منفی semidefinite مثبت هستند .

ماتریس غوطه ور غیر قابل برگشت غالب ویرایش ویرایش منبع ]

در عددی معادلات دیفرانسیل جزئی ، اصطلاح دیگری نیز برای ملاحظات پایداری استفاده می شود:

آ n \ n n-ماتریکس A = (a_ {ij})نامیده می شود غیر قابل تقلیل مورب غالب آن است که اگر غیر قابل تقلیل و ضعیف مورب غالب و برای حداقل یکi \ in \ {1، \ ldots، n \ نابرابری

\ sum _ {j = 1 \ atop j \ neq i} ^ {n} | a_ {ij} | <| a_ {ii} |

اعمال میشود. [5]

منبع

https://de.wikipedia.org/wiki/Diagonaldominante_Matrix

ایزومورفیسم

 

ریشه های پنجم وحدت

چرخش های پنج ضلعی

گروه از پنجم ریشه وحدت تحت عمل ضرب ریخت به گروه چرخش پنج ضلعی منظم تحت ترکیب است.

در ریاضیات ، ایزومورفیسم نقشه برداری بین دو ساختار از یک نوع است که می تواند توسط یک نقشه برعکس معکوس شود . اگر یک ایزومورفیسم بین آنها وجود داشته باشد ، دو ساختار ریاضی ایزومورفیک هستند . هم ریختی کلمه، از کلمه مشتق شده یونان باستان : ἴσος ISO های "برابر"، و μορφή morphe به «شکل» یا «شکل».

علاقه به ایزومورفیسم در این واقعیت نهفته است که دو جسم ایزومورفیک دارای خصوصیات یکسان هستند (به استثنای اطلاعات بیشتر مانند ساختار اضافی یا نام اشیاء). بنابراین ساختارهای ایزومورفیک فقط از نظر ساختار قابل تشخیص نیستند و می توانند شناسایی شوند. در ژارگون ریاضی ، یکی می گوید که دو شیء یکسان هستند تا یک ایزومورفیسم .

های automorphism ریخت از یک ساختار به خود است. ایزومورفیسم بین دو ساختار یک ایزومورفیسم معمولی است اگر تنها یک ایزومورفیسم بین این دو ساختار وجود داشته باشد (همانطور که در مورد راه حلهای یک خاصیت جهانی وجود دارد ) ، یا اگر ایزومورفیسم بسیار طبیعی تر (به تعبیری) از دیگر ایزومورفیسم هاست. به عنوان مثال ، برای هر عدد اولیه p ، تمام زمینه های دارای عناصر p بطور عادی ایزومورفیک و دارای ایزومورفیسم منحصر به فرد هستند. قضایا isomorphism isomorphisms متعارف که منحصر به فرد نیست فراهم می کند.

اصطلاح ایزومورفیسم عمدتا برای ساختارهای جبری استفاده می شود . در این حالت ، نگاشت ها همو مورفیسم نامیده می شوند ، و یک همگورفیسم ایزومورفیسم است اگر و فقط اگر از نظر زیبایی شناختی باشد.

در زمینه های مختلف ریاضیات ، ایزومورفیسم ها بسته به نوع ساختار مورد نظر ، اسامی تخصصی دریافت کرده اند. مثلا:

نظریه مقوله ، که می تواند به عنوان رسمی کردن مفهوم نقشه برداری بین ساختارها مورد بررسی قرار گیرد ، زبانی را فراهم می کند که ممکن است برای متحد کردن رویکرد به این جنبه های مختلف ایده اصلی مورد استفاده قرار گیرد.

در هندسه ، ایزومورفیسم ها و اتومبیل سازی ها معمولاً دگرگونی نامیده می شوند ، به عنوان مثال دگرگونی های سفت و سخت ، دگرگونی های پیوستگی ، تحولات پروژکتور .

 

فهرست

مثالها ویرایش ]

لگاریتم و نمایی ویرایش ]

اجازه دهید \ mathbb {R} ^ {+شود گروه ضربی از اعداد حقیقی مثبت ، و اجازه دهید\ mathbb {R  گروه افزودنی اعداد واقعی باشید.

تابع لگاریتم \ log \ colon \ mathbb {R} ^ {+} \ to \ mathbb {R  ارضا می کند\ log (xy) = \ log x + \ log y برای همه^ {+}x ، y \ in \ mathbb {R} ^ {+بنابراین یک همجنسگرایی گروهی است . تابع نمایی\ exp \ colon \ mathbb {R} \ to \ mathbb {R} ^ {+} ارضا می کند\ exp (x + y) = (\ exp x) (\ exp y) برای همهx ، y \ in \ mathbb {R بنابراین ، این همجنسگرایی است.

هویت \ log \ exp x = x و \ exp \ log y = y نشان می دهد که \ ورود  \ exp می وارون از یکدیگر. از آنجا که\ ورود  یک همجنسگرایی است که وارونه است که همجنسگرایی است ،  \ ورود  ایزومورفیسم گروه ها است.

زیرا  log\ ورود ایزومورفیسم است ، ضرب اعداد واقعی مثبت را به جمع اعداد واقعی ترجمه می کند. این تسهیلات امکان ضرب اعداد واقعی را با استفاده از خط کش و جدول لگاریتم ها یا استفاده از یک قانون اسلاید با مقیاس لگاریتمی امکان پذیر می کند.

interes modulo 6 ویرایش ]

گروه را در نظر بگیرید (\ mathbb {Z} _ {6} ، +)، اعداد صحیح از 0 به 5 با ماژول اضافی  6. گروه را نیز در نظر بگیرید(\ mathbb {Z} _ {2} \ بار \ mathbb {Z} _ {3} ، +)، جفتهای مرتب شده در جایی كه مختصات x می توانند 0 یا 1 باشند و مختصات y می توانند 0 ، 1 یا 2 باشند ، در حالی كه علاوه بر این در x- coordinate modulo 2 و اضافه شدن در y- koordinate modulo 3 است.

علاوه بر این ، این سازه ها تحت طرح زیر ایزومورفیک هستند:

(۰)) ↦ ۰

(1،1) ↦ 1

(۰ 2 ۲) ↦ ۲

(1،0) 3 پوند

(۰ 1 ۱) ↦ ۴

(1،2) 5 ↦

یا به طور کلی ( a ، b ) ↦ (3 a + 4 b ) mod 6.

به عنوان مثال ، (1،1) + (1،0) = (0،1) که در سیستم دیگر به صورت 1 + 3 = 4 ترجمه می شود .

حتی اگر این دو گروه از نظر متفاوت به نظر برسند ، این مجموعه ها عناصر مختلفی دارند ، اما در واقع ایزومورفیک هستند : ساختار آنها دقیقاً یکسان است. به طور کلی ، محصول مستقیم دو گروه چرخه ای\ mathbb {Z} _ {m و \ mathbb {Z} _ {n ایزومورفیسم است به (\ mathbb {Z} _ {mn} ، +)اگر و فقط اگر m و coprime هستند ، در قضیه باقی مانده چینی ها .

ایزومورفیسم حفظ رابطه ویرایش ]

اگر یک شیء از مجموعه ای X با یک رابطه باینری R تشکیل شده باشد و جسم دیگر شامل یک مجموعه Y با یک رابطه باینری S باشد ، یک ایزومورفیسم از X به Y یک عملکرد بیولوژیکی است: X → Y به گونه ای که: [1]

 \ operatorname {S} (f (u)، f (v)) \ iff \ operatorname {R} (u، v)

S است بازتابی ، irreflexive ، متقارن ، پادمتقارن ، نامتقارن ، متعدی ، کل ، سه قسمت ، یک ترتیب جزئی ، کل سفارش ، خوشترتیب ، سفارش ضعیف دقیق ، پیش فروش کل (سفارش ضعیف)، یک رابطه هم ارزی ، یا رابطه با هر نوع دیگر خصوصیات خاص ، اگر و فقط اگر R باشد.

به عنوان مثال ، R سفارش دادن و سفارش S است\ scriptstyle \ sqsubseteq، پس از آن ریخت از X به Y یک تابع bijective است ƒ: X → Y به طوری که

f (u) \ sqsubseteq f (v) \ iff u \ le v.

چنین ایزومورفیسم ایزومورفیسم نظم یا (معمولاً کمتر) ایزومورفیسم ایزوتون نامیده می شود .

اگر X = Y ، پس از این رابطه حفظ است های automorphism .

برنامه ها ویرایش ]

در جبر انتزاعی ، دو ایزومورفیسم اساسی تعریف شده است:

درست همانطور که اتومبیل های سازه از یک ساختار جبری یک گروه را تشکیل می دهند ، ایزومورفیسم بین دو جبر که دارای یک ساختار مشترک هستند یک پشته تشکیل می دهد . اجازه دادن به یک ایزومورفیسم خاص برای شناسایی دو ساختار ، این پشته را به یک گروه تبدیل می کند.

در تجزیه و تحلیل ریاضی ، تبدیل لاپلاس یک ایزومورفیسم است که معادلات دیفرانسیل سخت را به معادلات جبری آسانتر نگاشت .

در تئوری نمودار ، یک ایزومورفیسم بین دو نمودار G و H یک نقشه بیولوژیکی f از رئوس G تا رأس H است که "ساختار لبه" را حفظ می کند به این معنی که یک لبه از vertex u تا vertex v در G وجود دارد. اگر و فقط در صورتی که در H حاشیه ای از ƒ ( u ) تا ƒ ( v ) باشد. ایزومورفیسم نمودار را مشاهده کنید .

در تجزیه و تحلیل ریاضی ، یک ایزومورفیسم بین دو فضای هیلبرت یک حفظ حیات علاوه بر این ، ضرب مقیاس و محصول درونی است.

در تئوری های اولیه اتمیسم منطقی ، رابطه رسمی بین واقعیت ها و گزاره های واقعی توسط برتراند راسل و لودویگ ویتگنشتاین نظریه پردازی شد تا ایزومورفیک باشد. نمونه ای از این خط تفکر را می توان در مقدمه راسل در فلسفه ریاضی یافت .

در سایبرنتیک ، تنظیم کننده خوب یا قضیه Conant-Ashby بیان شده است: "هر تنظیم کننده خوب یک سیستم باید الگویی از آن سیستم باشد". چه تنظیم شده و چه خود تنظیم کننده ، یک ایزومورفیسم بین تنظیم کننده و قسمتهای پردازش سیستم لازم است.

نمای تئوری رده ویرایش ]

در تئوری دسته بندی ، بگذارید دسته C از دو طبقه تشکیل شود ، یکی از اشیاء و دیگری مورفیزها . سپس یک تعریف کلی از ایزومورفیسم که موارد قبلی و بسیاری موارد دیگر را در بر می گیرد این است که ایزومورفیسم یک مورفیز است ƒ: a → b که دارای یک مورفیزم معکوس g : b → a ، یعنی ƒg = 1 b و  = 1 a . به عنوان مثال ، یک نقشه خطی بیولوژیکی یک ایزومورفیسم بین فضاهای بردار و یک عملکرد مداوم بیولوژیکی استوارونگی آن نیز پیوسته است ایزومورفیسم بین فضاهای توپولوژیکی ، به نام هومومورفیسم .

ایزومورفیسم و ​​مورفیزم زیست شناختی ویرایش ]

در یک دسته بتونی (یعنی دسته ای که اشیاء آن مجموعه ها هستند (شاید با ساختار اضافی) و مورفیزم ها عملکردهای نگهدارنده ساختار هستند) مانند دسته فضاهای توپولوژیکی یا دسته ای از اشیاء جبری مانند گروه ها ، حلقه ها و ماژول ها ، ایزومورفیسم باید در مجموعه های زیرین زنده باشد . در مقولات جبری (به طور خاص ، دسته بندی انواع به معنای جبر جهانی ) ، ایزومورفیسم همان هومورفیزمی است که در مجموعه های زیرین حیاتی است. با این حال ، دسته بندی های مشخصی وجود دارند که در آنها مورفیزم های زیبایی شناسی لزوماً ایزومورفیزم نیستند (مانند دسته فضاهای توپولوژیکی).

رابطه با برابری ویرایش ]

همچنین ببینید: برابری (ریاضیات)

در مناطقی خاص از ریاضیات ، به ویژه نظریه مقوله ، تفکیک برابری از یک سو و ایزومورفیسم از سوی دیگر بسیار ارزشمند است . [2] برابری وقتی است که دو شیء دقیقاً یکسان هستند و هر آنچه که در مورد یک جسم صحیح است در مورد دیگری صادق است ، در حالی که ایزومورفیسم دلالت بر همه چیزهایی دارد که در مورد یک قسمت مشخص شده از ساختار یک شیء صحیح است در مورد دیگری. به عنوان مثال ، مجموعه ها

A = \ {x \ in \ mathbb {Z} \ mid x ^ 2 <2 \ و B = \ {- 1 ، 0 ، 1 \} \ ،

برابر هستند ؛ آنها نمایندگی-صرفا متفاوت است برای اولین بار یک intensional یک (در نماد سازنده مجموعه ای )، و دوم کششی (با شمارش صریح) استون زیر مجموعه همان اعداد صحیح است. در مقابل ، مجموعه های { A ، B ، C } و 1،2،3 { برابر نیستند ؛ در ابتدا عناصر دارای حروف هستند ، در حالی که دوم دارای عناصر عددی است. اینها به عنوان مجموعه ایزومورفیک هستند ، از آنجا که مجموعه های محدود تا ایزومورفیسم توسط کاردینالیت بودن آنها (تعداد عناصر) تعیین می شوند و این هر دو سه عنصر دارند ، اما انتخاب های زیادی برای ایزومورفیسم وجود دارد - یکی از ایزومورفیسم.

\ text A} \ mapsto 1، \ text {B} \ mapsto 2، \ text {C} \ mapsto 3، در حالی که دیگری است \ text A} \ mapsto 3، \ text {B} \ mapsto 2، \ text {C} \ mapsto 1،

و هیچ کس ایزومورفیسم ذاتاً بهتر از سایرین نیست. [توجه 1] [توجه 2] از این نظر و به این معنا ، این دو مجموعه مساوی نیستند زیرا نمی توان آنها را یکسان دانست : فرد می تواند یک ایزومورفیسم بین آنها را انتخاب کند ، اما این یک ادعای ضعیف تر از هویت است - و معتبر فقط در زمینه ایزومورفیسم انتخاب شده.

بعضی اوقات ایزومورفیسم ها می توانند آشکار و قانع کننده به نظر برسند ، اما هنوز برابر نیستند. به عنوان نمونه ساده ، روابط تبارشناسانه میان جو ، جان و بابی کندی به معنای واقعی مشابه روابط میان چهارچوب فوتبال آمریکایی در خانواده منینگ است: آرچی ، پیتون و الی . جفت شدن پدر و پسر و جفت شدن برادر بزرگتر-جوانتر برادر کاملاً مطابقت دارند. این شباهت بین دو ساختار خانوادگی نشانگر منشاء کلمه ایزومورفیسم (یونانی iso - ، "همان" ، و - morph است.، "فرم" یا "شکل"). اما از آنجا که کندی ها همان قوم مانینس نیستند ، این دو ساختار شجره نامه صرفاً ایزومورفیک و یکسان نیستند.

مثال دیگر رسمی تر و مستقیم تر انگیزه تمایز برابری از ایزومورفیسم را نشان می دهد: تمایز بین یک وکتور محدود محدود ابعادی V و فضای دوتایی آن V * = {φ: V → K } از نقشه های خطی از V به میدان آن اسکالرهای K . این فضاها از همان ابعاد برخوردار هستند ، و به همین ترتیب به عنوان فضاهای بردار انتزاعی ایزومورفیک هستند (از آنجا که از نظر جبری ، فضاهای برداری براساس بعد طبقه بندی می شوند ، همانطور که مجموعه ها توسط کاردینالیتی طبقه بندی می شوند) ، اما انتخاب "طبیعی" ایزومورفیسم وجود ندارد.\ scriptstyle V \، \ overset {\ sim} {\ to} \، V ^ *. اگر کسی پایه ای برای V انتخاب کند ، این یک ایزومورفیسم ایجاد می کند: برای همه شما . v ∈ V ،

v \ \ overset {\ sim} {\ mapsto \ \ phi_v \ in V ^ * \ quad \ text {به گونه ای که} \ quad \ phi_v (u) = v ^ \ mathrm {T} u.

این مربوط به تبدیل یک بردار ستون (عنصر V ) به یک بردار ردیف (عنصر V *) با انتقال است ، اما انتخاب متفاوت مبنا ایزومورفیسم متفاوتی می دهد: ایزومورفیسم "به انتخاب مبنا بستگی دارد". بیشتر ماهرانه، وجود دارد است یک نقشه از یک فضای برداری V به آن دو دو V ** = { X : V * → K } که در انتخاب بر اساس بستگی ندارد: برای همه V ∈ V و φ ∈ V *،

\ phi (v)v \ \ overset {\ sim} {\ mapsto \ x_v \ in V ^ {**} \ quad \ text {به گونه ای که} \ quad x_v (\ phi) = \ phi (v).

این منجر به یک مفهوم سوم ، یعنی یک ایزومورفیسم طبیعی می شود : در حالی که V و V ** مجموعه های مختلفی هستند ، یک انتخاب طبیعی "ایزومورفیسم" بین آنها وجود دارد. این مفهوم شهودی "یک ایزومورفیسم که به انتخاب خودسرانه وابسته نیست" در مفهوم تحول طبیعی رسمی می شود . به طور خلاصه ، ممکن است شخص به طور مداوم ، یا به طور کلی تر نقشه را از یک فضای بردار ابعاد محدود به دوتایی دوگانه خود ، شناسایی کند ،\ scriptstyle V \، \ overset {\ sim} {\ to} \، V ^ {**}، برای هر فضای برداری به روشی مداوم رسمیت این شهود انگیزه ای برای توسعه تئوری مقوله است.

با این حال ، موردی وجود دارد که معمولاً تمایز بین ایزومورفیسم طبیعی و برابری صورت نمی گیرد. این برای اشیاء است که ممکن است با یک خاصیت جهانی مشخص شود . در حقیقت ، یک ایزومورفیسم منحصر به فرد ، لزوماً طبیعی ، بین دو جسم مشترک با یک خاصیت جهانی وجود دارد. یک نمونه معمولی مجموعه اعداد واقعی است که می تواند از طریق گسترش اعشاری نامحدود ، گسترش باینری نامتناهی ، توالی های کوشی ، برش ددکیند تعریف شود.و بسیاری از روش های دیگر به طور رسمی این سازه ها اشیاء مختلفی را تعریف می کنند که همگی راه حل های یک خاصیت جهانی یکسان هستند. از آنجا که این اشیاء دقیقاً دارای همان خصوصیات هستند ، ممکن است روش ساخت را فراموش کرده و آنها را برابر بدانیم. این چیزی است که هر کسی در هنگام صحبت کردن از " مجموعه ای از اعداد حقیقی". همین اتفاق در مورد فضاهای بزرگ نیز رخ می دهد : آنها معمولاً به عنوان مجموعه کلاس های هم ارزی ساخته می شوند . با این حال ، صحبت کردن در مورد مجموعه ها ممکن است ضد انعطاف پذیر باشد ، و فضاهای بزرگ معمولاً به عنوان یک جفت مجموعه ای از اشیاء مشخص نشده که اغلب به آنها "نقاط" گفته می شود ، و یک نقشه surjective روی این مجموعه قرار می گیرند.

اگر کسی بخواهد جلب تمایز بین یک ریخت دلخواه (که بستگی به انتخاب) و یک isomorphism طبیعی (که می تواند به طور مداوم انجام می شود)، یکی ممکن است ارسال  برای ریخت غیر طبیعی و  برای isomorphism طبیعی، همانطور که در V ≈ V * و ≅ V **. این کنوانسیون به طور جهانی دنبال نمی شود ، و نویسندگانی که مایل به تفکیک بین ایزومورفیسم های غیر طبیعی و ایزومورفیسم های طبیعی هستند ، عموماً به صراحت این تمایز را بیان می کنند.

به طور کلی ، گفتن اینکه دو شیء برابر هستند ، زمانی محفوظ است که یک مفهوم از فضای بزرگتر (محیط) که این اشیاء در آن زندگی می کنند محفوظ باشد. بیشتر اوقات ، یکی از برابری دو زیر مجموعه از یک مجموعه معین صحبت می کند (مانند نمونه مجموعه صحیح در بالا) ، اما نه از دو شیء که بطور انتزاعی ارائه شده است. به عنوان مثال ، کره واحد 2 بعدی در فضای 3 بعدی

S ^ 2: = \ {(x، y، z) \ in \ mathbb {R} ^ 3 \ mid x ^ 2 + y ^ 2 + z ^ 2 = 1 \و کره ریمان \ widehat \ mathbb {C}

که می تواند به عنوان جمع و جور تک نقطه ای از هواپیمای پیچیده C ∪ {∞ } یا به عنوان یک خط پروژکتور پیچیده (یک فضای بزرگ) ارائه شود

\ mathbf {P} _ {\ mathbb {C}} ^ 1: = (\ mathbb {C} ^ 2 \ setminus \ {(0،0) \}) / (\ mathbb {C} ^ *)

سه توصیف های مختلف برای یک شی ریاضی، همه از آن ریخت هستند، اما نه می برابر زیرا آنها تمام زیر مجموعه های یک فضای واحد: اولین زیر مجموعه ای از است 3 ، دوم این است C ≅ R 2 [توجه داشته باشید 3] به علاوه یک نقطه اضافی، و سوم است subquotient از 2

در زمینه نظریه طبقه بندی ، اشیاء معمولاً در بیشتر ایزومورف قرار دارند. در واقع ، انگیزه ای برای پیشرفت نظریه مقوله نشان می دهد که سازه های مختلف در تئوری هومولوژی ، گروه های معادل (ایزومورفیک) را به همراه آورده اند. با توجه به نقشه های بین دو شی X و Y ، با این حال ، یک نفر می پرسد که آیا آنها برابر هستند یا نه (هر دو عنصر مجموعه Hom ( X ،  Y ) هستند ، از این رو برابری رابطه مناسب است) ، به ویژه در نمودارهای ترافیکی .

منبع 

https://en.wikipedia.org/wiki/Isomorphism

پشتیبانی و مقاومت

در تجزیه و تحلیل فنی بورس اوراق بهادار ، پشتیبانی و مقاومت ، سطوح از پیش تعیین شده ای از قیمت امنیتی است که تصور می شود قیمت متوقف و معکوس خواهد شد. [1] این سطوح با لمس های متعدد قیمت بدون دستیابی به موفقیت در سطح مشخص می شوند.

 

فهرست

پشتیبانی در مقابل مقاومت ویرایش ]

سطح حمایت یک سطح که در آن قیمت تمایل به پیدا کردن حمایت عنوان آن می افتد است. این بدان معنی است که قیمت به احتمال زیاد "از گزاف" خارج می شود تا اینکه از آن عبور کند. با این حال ، هنگامی که قیمت این سطح را نقض کرده است ، با یک مقدار بیش از برخی از سر و صداها ، احتمالاً تا رسیدن به سطح پشتیبانی دیگری ، روند نزولی را ادامه خواهد داد. [2]

سطح مقاومت در مقابل از یک سطح حمایت است. اینجاست که با افزایش قیمت ، تمایل به مقاومت پیدا می کند. باز هم ، این بدان معنی است که قیمت به احتمال زیاد "از گزاف" خارج می شود تا اینکه از آن عبور کند. با این حال ، هنگامی که قیمت این سطح را نقض کرد ، با مقدار بیش از برخی سر و صدا ، احتمالاً تا رسیدن به یک سطح مقاومت دیگر ادامه خواهد یافت.

واکنشی در مقابل پشتیبانی و مقاومت فعال ویرایش ]

حمایت و فعال سازی روش های مقاومت "پیش بینی کننده" است زیرا اغلب مناطقی را توصیف می کنند که در واقع قیمت نبوده است. [3] آنها براساس قیمت کنونی قیمت پایه گذاری شده اند که از طریق تجزیه و تحلیل نشان داده شده است که می تواند پیش بینی کننده قیمت آینده باشد [ نیاز به استناد ] . پشتیبانی و مقاومت روشهای فعال شامل حرکات اندازه گیری شده ، پیش بینی نسبت / نوسانات متغیر (استاتیک (مربع نه) ، دینامیکی (فیبوناچی)) ، محورهای محاسبه شده ، نوسانات بر اساس ، روندهای متوسط ​​و میانگین متحرک ، VWAP ، نمایه بازار (VAH ، VAL و POC) . [3]

پشتیبانی و مقاومت واکنشی برعکس است: آنها به طور مستقیم در نتیجه عمل یا رفتار حجم رفتار می شوند. آنها شامل نمایه جلد ، نرخ پایین نوسانات قیمت ، اوج تعادل اولیه ، شکاف های باز ، الگوهای خاص شمع (به عنوان مثال Engulfing ، Tweezers) و OHLC می باشند. [3]

یک هیستوگرام قیمت برای نشان دادن اینکه در چه قیمتی زمان نسبی بیشتری را صرف کرده است مفید است. سطح روانی نزدیک به تعداد دور اغلب به عنوان حمایت و مقاومت عمل می کند. [3]

شناسایی سطح پشتیبانی و مقاومت ویرایش ]

سطح پشتیبانی و مقاومت را می توان با استفاده از خطوط روند (تجزیه و تحلیل فنی) مشخص کرد . [4] برخی از معامله گران به استفاده از محاسبات نقطه محوری اعتقاد دارند . [5]

هرچه سطح پشتیبانی / مقاومت بیشتر مورد آزمایش قرار می گیرد (از طریق قیمت لمس می شود و از حالت خاموش خارج می شود) ، اهمیت بیشتری به آن سطح خاص داده می شود. [6]

اگر قیمت از سطح حمایت فراتر رود ، آن سطح حمایت اغلب به یک سطح مقاومت جدید تبدیل می شود. نقطه مقابل نیز صادق است. اگر قیمت سطح مقاومت را بشکند ، اغلب در آینده پشتیبانی در این سطح پیدا می کند. [7]

سطح حمایت روانی و مقاومت بخش مهمی از تحلیل فنی معامله گر را تشکیل می دهد. [8] با افزایش قیمت در 50 (به عنوان مثال 1.2050) یا 00 (به عنوان مثال 1.3000) ، مردم اغلب این سطح را به عنوان یک پتانسیل قوی برای وقفه در حرکت فعلی می دانند. قیمت ممکن است به خط برسد و برعکس باشد ، می تواند به سطح صعود بپردازد زیرا Bulls و Bears برای برتری می جنگند ، یا ممکن است مستقیماً از آن عبور کنند. یک تاجر همیشه باید در هنگام رسیدن به سطح 00 به طور کلی و در 50 سطح نیز اگر قبلاً به عنوان پشتیبانی یا مقاومت عمل کرده است ، احتیاط کنید.

استفاده از سطوح پشتیبانی و مقاومت ویرایش ]

این مقاله احتمالاً شامل تحقیقات اصلی است . لطفاً با تأیید ادعاهای مطرح شده و افزودن استناد به خط ، آن را بهبود بخشید . اظهارات متشکل از تحقیقات اصلی باید حذف شود. ( آگوست 2014 ) یاد بگیرید که چگونه و چه زمانی این پیام الگوی را حذف کنید )

این نمونه ای از پشتیبانی تعویض نقش ها با مقاومت است و بالعکس:

PaychexSupportResistanceChart.JPG

اگر قیمت سهام بین سطح حمایت و مقاومت در حال حرکت باشد ، بنابراین یک استراتژی اساسی سرمایه گذاری که معمولاً توسط معامله گران استفاده می شود ، این است که سهام را در حمایت خریداری کرده و در مقاومت بفروشید ، سپس در برابر مقاومت کوتاه و پوشش کوتاه مدت در حمایت [9] . مثال زیر:

MicrosoftSupportResistanceTradingChannelChart.JPG

هنگام قضاوت زمان ورود و خروج سرمایه گذاری با استفاده از سطح پشتیبانی یا مقاومت ، مهم است که نمودار را بر اساس یک بازه زمانی قیمت که با بازه زمانی استراتژی تجاری شما همسو است انتخاب کنید. معامله گران کوتاه مدت تمایل دارند از نمودارها بر اساس دوره های بازه زمانی ، مانند 1 دقیقه استفاده کنند (یعنی قیمت امنیت هر 1 دقیقه در نمودار ترسیم می شود). معامله گران بلند مدت به طور معمول از نمودارهای قیمت بر اساس دوره های ساعتی ، روزانه ، هفتگی یا ماهانه استفاده می کنند. معمولاً معامله گران هنگام تصمیم گیری نهایی در مورد زمان سرمایه گذاری ، از نمودارهای فاصله زمانی کوتاهتر استفاده می کنند ، مانند مثال زیر بر اساس 1 هفته اطلاعات تاریخی با قیمت ترسیم هر 15 دقیقه. در این مثال ، علائم اولیه مبنی بر بیرون آمدن سهام از روند نزولی ، زمانی بود که شروع به تشکیل حمایت از $ 30.48 کرد و سپس شروع به تشکیل رده های بالاتر و پایین تر کرد.[ نیاز به استناد ]

BiometSupportLevelInvestmentTimingChart.JPG

منبع

https://en.wikipedia.org/wiki/Support_and_resistance

شکل گسترده بازی

 

نظریه بازی ها در فرم استاندارد مربوطه، اشکال گسترش (گسترده فرم بازی) از طریق درخت توصیف بازی. هر گره (به نام گره تصمیم گیری ) بیانگر هر وضعیت ممکن در بازی است. بازی از یک گره اولیه منحصر به فرد شروع می شود و از طریق مسیری که توسط شرکت کننده تعیین می کند بهگره پایانه می رسد.در این مرحله بازی به پایان می رسد و شرکت کننده از مزیت مربوطه برخوردار می شود. هر گره غیر ترمینال فقط به یک شرکت کننده تعلق دارد ؛ شرکت کننده اقدامات احتمالی خود را در آن گره انتخاب می کند و هر عملکرد ممکن از آن گره به گره دیگری از لبه عبور می کند .

بر خلاف فرم معمولی ، فرم گسترده الگویی صریح از تعامل را امکان پذیر می سازد.در یک تعامل ، یک شرکت کننده می تواند چندین بار در یک بازی عمل کند و می تواند در حالت های مختلف رفتارهای متفاوتی انجام دهد.

 

دایرکتوری

بیان ویرایش ]

نمایندگی کامل فرم شامل:

  1. شرکت کنندگان در بازی
  2. هر فرصتی برای هر شرکت کننده برای اقدام.
  3. انتخاب هر یک از شرکت کنندگان در عمل
  4. آنچه که هر شرکت کننده هنگام عمل می داند چیست
  5. هر یک از شرکت کنندگان پس از اقدامات مختلف احتمالی ، درآمد را منتقل می کند.

فرم گسترده ای از بازی

تصویر سمت راست یک بازی دو نفره است: 1 و 2. عدد روی هر گره غیر ترمینال مشارکت کننده ای است که گره به آن تعلق دارد. عدد موجود در نقطه پایانی نشان دهنده درآمد شرکت کننده است (برای مثال: 2 ، 1 بدین معنی است که قسمت 1 2 می شود و قسمت 2 به 1 می رسد). نمادی که در هر طرف تصویر وجود دارد ، نام عملی است که توسط این طرف نشان داده شده است.

گره اولیه متعلق به شرکت کننده 1 است ، که نشان می دهد اول شرکت کننده در حال حرکت است.ترتیب بازی به شرح زیر است: شرکت کننده 1 U یا D را انتخاب می کند ؛ شرکت کننده 2 انتخاب شرکت کننده 1 را مشاهده می کند ، سپس U ' یا D را انتخاب می کند و در نهایت سود نهایی را کسب می کند. چهار گره پایانه چهار نتیجه را نشان می دهد: (U، U ')، (U، D')، (D، U ') و (D، D'). بازده حاصل از هر نتیجه (0) ، (2،1) ، (1،2) و (3،1) است.

اگر شرکت کننده 1 D را انتخاب کند ، شرکت کننده 2 برای به حداکثر رساندن بازده ، U را انتخاب می کند و در نهایت شرکت کننده 1 فقط 1 را کسب می کند. اما ، اگر شرکت کننده 1 U را انتخاب کند ، شرکت کننده 2 برای به حداکثر رساندن مزیت ، D " را انتخاب می کند ، در این مرحله شرکت کننده 1 2 می شود. بنابراین شرکت کننده 1 U را انتخاب می کند و شرکت کننده 2 D را انتخاب می کند .که است زیر بازی تعادل کامل

فضای عمل نامحدود ویرایش ]

شرکت کنندگان ممکن است تعداد بیشماری از اقدامات ممکن را برای انتخاب در یک گره تصمیم خاص داشته باشند. نمایندگی استفاده از قوس برای اتصال دو لبه است که از گره تصمیم امتداد دارند. اگر فضای عمل یک پیوستار بین دو عدد باشد ، دو عدد نشان دهنده مرزهای بالا و پایین به ترتیب در بالا و زیر قوس قرار می گیرند و از یک متغیر برای نشان دادن پرداخت آنها استفاده می شود. در این مرحله ، تعداد نامحدودی از گره های تصمیم گیری می تواند با یک گره در مرکز قوس جایگزین شود. این نمایندگی همچنین می تواند در یک فضای محدود از عمل مورد استفاده قرار گیرد ، تا زمانی که فضای آن به اندازه کافی بزرگ باشد که امکان نمایش هر عمل با لبه ها امکان پذیر نباشد.

بازی توسط فضای اکشن بی نهایت به صورت گسترده نمایش داده می شود

درخت در سمت چپ یک بازی را نشان می دهد که در آن بازی یا فضای اکشن نامتناهی (هرعدد واقعی از 0 تا 5000 ) دارد یا فضای عمل زیادی دارد (احتمالاً هر عدد صحیحی بین 0 تا 5000 ). اگر فرض کنیم در اینجا این دو شرکت هستند که در رقابت استاکلبرگ شرکت می کنند. پرداخت شرکت در سمت چپ نشان داده شده است ، جایی که q1 و q2 بیانگر استراتژی اتخاذ شده توسط شرکت پیشگام و شرکت دنبال کننده است ، به ترتیب ، c1 و c2 ثابت هستند (نمایانگر هزینه فرصت شرکت). تعادل بازی فرعی Nash بازی می تواند با پیدا کردن مشتق جزئی مرتبه اول متغیر استراتژی دنبال کننده (q2) عملکرد پرداخت ، سود خود را به حداکثر برساند و عملکرد پاسخ بهینه خود را پیدا کند.Q2 (q1) = (5000-q1-c2) / 2. از همان روش برای محاسبه عملکرد پاسخ بهینه پیشرو استفاده کنید ، و فرض کنید که اولین حرکت دهنده می داند که پیرو عمل فوق را انتخاب کرده و توسط مشتقات جزئی مرتبه اول آن را حل می کند.Q1 * = (5000 + c2-2c1) / 2. جایگزینی q1 * به عملکرد پاسخ بهینه پیروان ،Q2 * = (5000 + 2c1-3c2) / 4در این زمان (q1 * ، q2 *) فرعی تعادل نش عالی است. اگر فرض کنیم که c1 = c2 = 1000 است ، آنگاه راه حل تعادل کامل نش در زیر نام (2000 ، 1000) است.

اطلاعات ناقص ویرایش ]

نمودار درخت به وضوح نشان می دهد که شرکت کننده 1 در حال حرکت است و شرکت کننده 2 عملکرد شرکت کننده 1 را مشاهده می کند. با این حال ، برخی از بازی ها مانند این نیستند. شرکت کنندگان همیشه نمی توانند انتخاب های شخص دیگری را رعایت کنند (برای مثال ، اقدامات یا اعمال همزمان پنهان هستند). مجموعه اطلاعات ترکیبی از گره های تصمیم گیری است:

  1. هر گره متعلق به یک شرکت کننده است.
  2. شرکت کنندگان نمی توانند بین گره های متعدد در یک مجموعه اطلاعات تمایز قائل شوند. یعنی: اگر مجموعه اطلاعات دارای گره های مختلف باشد ، شرکت کنندگان که مجموعه اطلاعات را به آن تعلق دارند نمی دانند کدام گره را به سمت آن حرکت کند.

اطلاعات ناقص به صورت گسترده

بازی اطلاعات کامل به این معنی است که در هر مرحله از بازی ، هر یک از شرکت کنندگان تمام اقدامات پیش از بازی را می دانند ، یعنی هر مجموعه اطلاعات یک مجموعه عنصر واحد است . یک بازی بدون اطلاعات کامل دارای اطلاعات ناقص است.

در بازی در تصویر سمت چپ ، شرکت کننده 2 هنگام حرکت حرکت انتخاب شرکت کننده 1 را نمی داند و در غیر اینصورت مانند بازی اول است. بازی اول اطلاعات کاملی دارد ؛ بازی دیگری که در تصویر سمت چپ وجود ندارد. اگر هر دو شرکت کننده عقلانی باشند و بدانند که طرف مقابل نیز فرد منطقی است ، اطلاعاتی که طرف مقابل می داند می تواند توسط خود او بدست آید (یعنی شرکت کننده 1 بداند که شرکت کننده 2 می داند که شرکت کننده 2 می داند که شرکت کننده 1 عقلانی است و شرکت کننده 2 نیز می داند ، بنابراین چرخه پایین) ،

تدوین اصول ویرایش ]

تئوری بازی یک تئوری ریاضی است ، بنابراین ساختار درخت بازی فوق می تواند به بیان فرمول تبدیل شود.

یک شکل گسترده از درخت محدود ، چنین ساختاری است \ گاما = \ langle \ mathcal {K}} ، {\ mathbf {H}} ، [({\ mathbf {H}} _ {i}) _ {{i \ in {\ mathcal {I}}} ]، \ {A (H) \} _ {{H \ in {\ mathbf {H}}}}]، a، \ rho، u \ rangle  کجا:

  • {\ mathcal {K}} = \ langle V، v ^ {0}، T، p \ rangle یک درخت محدود را نشان می دهد.Vهمه گره های درخت ،V ^ {0} \ در Vیک گره اولیه منحصر به فرد را نشان می دهد ، زیرمجموعه Vزیر مجموعه T \تمام گره های ترمینال را نشان می دهد (D = V \ setminus Tگره تصمیم گیری است) و عملکرد{\ صفحه نمایش صفحه نمایش: p: V \ rightarrow Dقوانینی که نمایانگر بازی هستند ،
  • \ mathbf {Hاکسپرسداطلاعات موجود در آن ،
  • {\ نمایشگر A (H)الف (ح)مجموعه اطلاعاتH \ in \ mathbf {H}اقدامات ممکن مجاز است. همه اقدامات به صورت بیان شده است{\ ریاضی {A}.

 

ادامه نوشته

بازی متوالی

در تئوری بازی ، یک بازی دنباله ای ، همچنین یک بازی پویا خوانده می شود ، بدین معنی است که یک بازیکن قبل از دیگری در بازی حرکت می کند.شایان ذکر است که دومی حداقل باید برخی از اطلاعات رفتاری حرکت اول را بدست آورد ، در غیر این صورت زمان رفتار هیچ تاثیری نخواهد داشت.

بازی ترکیبی عموماً یک بازی پویا است.

ماتریس بازی نمی تواند نمایانگر فرایندهای پویا باشد و توسط درخت بازی (نمایندگی گسترده) نمایش داده می شود . بازی های پویا معمولاً با القای معکوس حل می شوند.

بسیاری از بازی های هیئت مدیره بازی پی در پی، از جمله ایکس او ، شطرنج ، شطرنج ، چکرز و غیره. اندازه درخت تصمیم گیری بسته به پیچیدگی بازی ، از یک درخت بازی کوچک و دقیق گرفته تا tic-tac-toe می تواند متفاوت باشد ، و درخت تصمیم Go به اندازه ای است که حتی یک درخت بازی بسیار پیچیده است که کامپیوتر نمی تواند کاملاً نقشه برداری کند.

ادامه نوشته

بازی متقارن

در تئوری بازی ، اگر درآمد بازی فقط به استراتژی انتخاب شده بازیکن بستگی داشته باشد و به بازیکنی که بازی می کند بستگی ندارد ، به این نوع بازی یک بازی متقارن گفته می شود. به عنوان مثال ، در بازی معضل زندانی ، زندانیان تصمیم به ادعای گناه گرفتند و آنها را به پنج سال زندان محكوم كردند .هر دو تصمیم گرفتند كه گناهی را اعلام نكنند و آنها را به یك سال زندان محكوم كنند.یكی گناه را اعلام كرد و دیگری ادعا كرد كه گناه 10 ساله نیست و آزاد می شود. در این بازی ، حکم اعدام زندانی تا زمانی که او تصمیم به ادعای مقصر بودن یا عدم تصمیم گیری کند و هیچ ارتباطی با هویت وی ندارد ، این یک بازی متقارن است. برای مشخص کردن موارد زیر از جدول استفاده کنید.

 گناهکارالف گناه نمی داند
ب اعتراف کرد5 سال ، 5 سال101010 سال
ب ادعا نمی کند که گناهکار است10 سال ، 0 سال1 سال ، 1 سال

 

ادامه نوشته

حاصل جمع صفر بازی

حاصل جمع صفر بازی ( انگلیسی: ZERO-SUM بازی )، همچنین به عنوان شناخته شده بازی مجموع صفر یا یک نوبت با حاصل جمع صفر ، بایک بازی غیر حاصل جمع صفر نسبی است، نظریه بازی یک مفهوم، یک است بازی غیر تعاونی . بازی با مبلغ صفر به این معنی است که جمع منافع همه بازیکنان صفر یا ثابت است ، یعنی یک طرف درآمد دارد و طرف مقابل باید از دست بدهد. در بازی با جمع صفر ، بازیکنان این بازی همکاری نمی کنند. بازی مبلغی بدون صفر نشان می دهد که مجموع مزایای هر بازیکن تحت ترکیب های مختلف استراتژی ها متغیر نامشخص است ، بنابراین به آن تغییر و بازی نیز گفته می شود. اگر انتخاب استراتژی های خاص بتواند مجموع منافع همه طرفین را بزرگتر کند و در عین حال منافع همه طرفین را افزایش دهد ، ممکن است شرایطی پیش آید که شرکت کنندگان با یکدیگر همکاری کنند. بنابراین ، در بازی جمع غیر صفر ، امکان همکاری بین طرفین در بازی وجود دارد. بسیاری از مشکلات در اقتصاد بین المللی مشکلات بازی بدون جمع است ، یعنی منافع همه طرفین در اقتصاد بین المللی لزوماً متناقض نیست.

همچنین می توان گفت خوشبختی خود او بر رنج دیگران بنا شده است و اندازه آن دو کاملاً برابر است از این رو ، هر دو طرف برای دستیابی به "آسیب رساندن به دیگران" سعی کرده اند از هر ابزاری استفاده کنند. نمونه هایی از بازی های صفر عبارتند از قمار ، آینده و انتخابات .

 

دایرکتوری

تعریف ویرایش ]

در صفت جمع صفر (اگر یک طرف منافع داشته باشد و طرف مقابل نیز از دست بدهد) ، به این معنی است که پدیده مطلوب پارتو وقتی نتیجه حاصل می شود مبلغ صفر است [1] . برعکس ، وضعیتی که در آن همه شرکت کنندگان می توانند از مزایای آن استفاده کرده یا آسیب ببینند ، یک بازی با مبلغ غیر صفر نامیده می شوند. اگر یک کشور از موزهای اضافی خود برای تجارت با بقیه سیب ها در کشور دیگری استفاده کند ، زیرا هر دو طرف از معامله بهره مند می شوند ، این یک نمونه غیر صفر است.

این مفهوم برای اولین بار در تئوری بازی ها (استفاده شد بازی توسعه در نظریه)، و در نتیجه یک وضعیت با حاصل جمع صفر معمولا به عنوان یک بازی با حاصل جمع صفر (ZERO-SUM اشاره بازی ).

راه حل ویرایش ]

در یک بازی با جمع صفر محدود ، تئوری های مختلف بازی مانند Nash EQ و Minimax راه حل یکسانی را ارائه می دهند. بازیکنان باید از یک استراتژی ترکیبی استفاده کنند .

مثال ویرایش ]

یک مثال بازی با جمع صفر
 الفبج
130 ، -30-10 ، 1020 ، -20
210 ، -1020 ، -20-20 ، 20

بازی با فرم معمولی یکی از راه های توضیح بازی صفر است. در سمت راست نمونه ای از یک بازی صفر دو نفره است.

جریان بازی به شرح زیر است: بازیکن اول (حزب قرمز) عمل 1 یا اکشن 2 را انتخاب می کند ، و بازیکن دوم (طرف آبی) عمل A ، اکشن B یا اکشن C را بدون دانستن انتخاب بازیکن اول انتخاب می کند. یکی سپس ، انتخاب بازیکن نمایش داده می شود و امتیاز هر بازیکن با توجه به نتایج این انتخاب ها افزایش یا کاهش می یابد.

به عنوان مثال ، حزب قرمز عمل 2 را انتخاب می کند و حزب آبی عمل B را انتخاب می کند. در نتیجه ، تیم قرمز 20 امتیاز کسب کرد و تیم آبی ها 20 امتیاز از دست داد.

اکنون در این مثال ، هر دو بازیکن در تلاش هستند تا نمره خود را بهبود بخشند.

حرکت احتمالی حزب سرخ به شرح زیر است: "اگر اکشن 2 را انتخاب کنم ، تا 20 امتیاز را از دست می دهم ، اما می توانم تنها 20 امتیاز کسب کنم. اگر اکشن 1 را انتخاب کنم ، فقط 10 امتیاز را از دست می دهم ، اما من شانس کسب 30 امتیاز را دارم ، بنابراین عمل 1 مطلوب تر به نظر می رسد. "آبی از استدلال مشابه استفاده می کند و او عمل C را انتخاب می کند. اگر این دو بازیکن از همین استراتژی استفاده کنند ، قرمز موفق به کسب 20 امتیاز خواهد شد. با این حال ، اگر طرف آبی انتظار دارد از قرمز گزینه استراتژی اکشن 1 را انتخاب کند و برای کسب 10 امتیاز اقدام B را انتخاب کنید. یا اگر انتظار می رود قرمز از این تاکتیک استفاده کند و برای کسب 20 امتیاز اقدام 2 را انتخاب کند. نتیجه چیست؟

جان فون نویمان ، ریاضیدان معتقد است که احتمالاً می تواند این معضل را برطرف کند. این دو بازیکن باید پیروزی خود را در برابر اقدامات اختیاری خود محاسبه کنند ، و سپس از یک مؤلفه منطقی تصادفی برای انتخاب اقدامات خود بر اساس این احتمالات استفاده کنند. هر بازیکن احتمال را محاسبه می کند. این الگوریتم به حداقل رساندن می تواند بهترین استراتژی را برای همه بازی های جمع صفر دو نفره محاسبه کند.

با توجه به مثال بالا ، احتمال اینکه حزب قرمز اقدام 1 را انتخاب كند 4/7 است و عمل 2 احتمال 3/7 دارد ، در حالی که احتمال وجود حزب آبی انتخاب اقدامات 0 ، 4/7 و 3/7 است که مربوط به A ، B و C است. سه عمل پس از آن ، تیم قرمزها به طور میانگین 20/7 امتیاز در هر بازی کسب می کنند.

برای مثال مثالی تر: یانگ یولین و لین ییچن هر کدام دو کارت بازی دارند ، کارت های یانگ یولین Spades A و Red Hearts 10 و کارتهای لین Yichen جعبه A و Plum 10 هستند که هر کدام کارت دارند:

(1) اگر قانون این است: اگر همان رنگ ، پس از آن یانگ یولین برنده می شود ، در غیر این صورت لین ییچن برنده می شود ، برنده می تواند طرف دیگر 1 یوان را به دست آورد ، سپس ماتریس درآمد آنها :

 بلوک Aآلو 10
نخ های الف-1 ، 11 ، -1
قلب قرمز 101 ، -1-1 ، 1

در این مرحله ، فقط تعادل نش استراتژی مختلط وجود دارد ، اما هیچ تعادل نش استراتژی خالص وجود ندارد.

(2) اگر قاعده چنین باشد: لین ییچن باید پول یانگ یولین را بپردازد ، و مبلغ پول مجموع امتیازاتی است که این دو بازی کرده اند ، سپس ماتریس درآمد آنها:

 بلوک Aآلو 10
نخ های الف2 ، -211 ، -11
قلب قرمز 1011 ، -1120 ، -20

بدیهی است ، یانگ لانلین امیدوار است که بتواند کمی بیشتر پول بدست آورد ، بنابراین 10 امتیاز را به او می دهد ، و لین ییچن امیدوار است که بتواند مبلغ کمتری بپردازد ، بنابراین او را A می دهد ، به طوری که مربع در گوشه پایین سمت چپ نقطه تعادل نش است . در آن زمان ، تعادل نش استراتژی ناب وجود دارد.

(3) اگر قاعده چنین باشد: اگر همان رنگ ، یانگ یولین برنده شود ، در غیر این صورت لین ییچن برنده می شود ، برنده با توجه به امتیازات خود طرف مقابل را برنده می شود ، پس ماتریس درآمد آنها:

 بلوک Aآلو 10
نخ های الف-1 ، 11 ، -1
قلب قرمز 1010 ، -10-10 ، 10

برای یانگ یولین ، فقط قلب قرمز 10 شانس کسب حداکثر (10 یوان) را دارد ، اما بدیهی است که این برای او ریسک پذیرتر است ، زیرا ، فارغ از اینکه کارت یانگ لانلین است ، انتظار او 0 یوان است. اما برای لین ییچن این طور نیست .اگر لین ییچن از جعبه A خارج شود ، مقدار مورد انتظار -4.5 یوان و شکوفه آلو 10 است و مقدار مورد انتظار آن 4/4 یوان است. بنابراین ، لین ییچن "باید" از آلو 10 خارج شود ، یانگ لانلین به این فکر کرده است ، قلب قرمز 10 وجود نخواهد داشت و خطر نسبتاً کمی از لکه های A در برابر آن وجود خواهد داشت ، اما لین ییچن دوباره به این موضوع فکر خواهد کرد. با این حال ، برای لین ییچن ، اگر یانگ یولین از لکه های A ، دو کارت Lin Yichen تنها 2 اختلاف یوان کسب کند! به مراتب کمتر از 20 یوان که یانگ لانلین در ساعت 10 قلب قرمز ایجاد کرد. بنابراین ، خارج از جعبه A خطرناک تر است ، به هر حال لین ییچن از آلو 10 خارج خواهد شد. اگر یانگ لانلین دارای قلب قرمز 10 باشد ، به احتمال زیاد به بدترین نتیجه سقوط می کند - او 10 یوان را از دست داد ، بنابراین آخرین تمرین یانگ یولین بیرون کشیدن از لکه های A است. در پایان ، یانگ یولین 1 یوان به دست آورد. در این حالت ، تعادل نش استراتژی خالص و تعادل نش استراتژی ترکیبی وجود دارد.

بازی جمع غیر صفر ویرایش ]

مقاله اصلی: بازی جمع صفر

اقتصاد ویرایش ]

بسیاری از شرایط اقتصادی بازی های جمع صفر نیستند. هر یک از شرایط فوق می تواند ضرر یا سود خالص ایجاد کند زیرا کالاها و خدمات با ارزش می توانند ایجاد شوند ، از بین بروند و توزیع شوند. با فرض اینکه رفتار حریف معقول باشد ، هر معامله تجاری یک بازی غیر صفر است ، زیرا هر طرف باید در نظر بگیرد کالاهایی که می پذیرد از کالاهایی که تحویل می دهد با ارزش تر است. مبادلات اقتصادی باید برای هر دو طرف معامله سودمند باشد و نمی تواند یک بازی با مبلغ صفر باشد تا هرکدام از طرفین بتوانند بر هزینه های معاملاتی خود غلبه کنند .

روانشناسی ویرایش ]

متداول ترین نمونه است روانشناسی اجتماعی از تله های اجتماعی ، در برخی موارد، ممکن است منافع شخصی را دنبال کنند، برای تقویت جمعی ما خوب بودن.

پسوند ویرایش ]

در طنز دسته، بازی با حاصل جمع صفر "را به عنوان تمدید شد قانون حفاظت خوشحال " (حفاظت از شادی)، که به معنی "کسی شاد، آن را به کسانی که از دست داده باشد"، که "خوشحال به ساخت و ساز در بدن درد شخص دیگری" است.

 

ادامه معضل زندانی

مثال واقع گرایانه ویرایش ]

مثالهای فوق ممکن است طبیعی به نظر نرسد ، اما در واقعیت ، هم جامعه بشری و هم طبیعت می توانند نمونه ای از معضلات زندانی را پیدا کنند و نتایج به همان ماتریس درآمد تقسیم می شود . علوم اجتماعی در اقتصاد ، علوم سیاسی و جامعه شناسی ، و همچنین علوم طبیعی ازرفتارشناسی ، زیست شناسی تکاملی و رشته های دیگر، می توان تجزیه و تحلیل وضعیت دشوار زندانی، شبیه سازی از بازی معضل صورت بیولوژیکی زندانی بی پایان استفاده می شود. معضل زندانی می تواند بسیار مورد استفاده قرار گیرد و این نشانگر اهمیت این بازی است. در زیر نمونه هایی از حلقه های مختلف:

مثال علوم سیاسی: مسابقه تسلیحاتی ویرایش ]

در علوم سیاسی ، مسابقه تسلیحاتی بین دو کشور را می توان در معضل زندانی توصیف کرد. هر دو کشور می توانند ادعا کنند که دو گزینه دارند: افزایش تسلیحات (خیانت) یا دستیابی به توافق کاهش سلاح (همکاری). هیچ یک از کشورها اطمینان ندارند که طرف دیگر به توافق نامه عمل کند ، بنابراین دو کشور در نهایت تمایل به افزایش تسلیحات خود خواهند داشت. به نظر می رسد متناقض است که اگرچه افزایش تسلیحات یک عمل "عقلانی" از دو کشور است ، اما نتیجه "غیر منطقی" است (به عنوان مثال آسیب به اقتصاد و غیره). این ممکن است در نظر گرفته می شود که شامل تئوری از استنتاج ، آن را به یک قوی است نیروی نظامی برای مهار حمله دیگر، به منظور دستیابی به صلح است.

مثال اقتصادی: جنگ تعرفه ای ویرایش ]

در دو کشور ، دو گزینه برای تعرفه وجود دارد :

  1. برای محافظت از کالاهای خود تعرفه را افزایش دهید. (خیانت)
  2. رسیده با دیگر توافقات تعرفه به کاهش تعرفه به منظور تسهیل در خود کالا گردش است. (همکاری)

هنگامی که یک کشور با توجه به برخی از شرایط عوامل تعرفه منطبق نیست، در حالی که بالا بردن تعرفه تنهایی (خیانت)، یک کشور دیگر در حال ساخت همان واکنش (همچنین خیانت) است، که به موجب جنگ تعرفه بین دو کشور در کالاها یکدیگر از دست داده بازار همچنین باعث خسارت به اقتصاد خود (نتیجه خیانت مشترک) می شود. سپس دو کشور توافق نامه تعرفه را دوباره برقرار کردند . ( نتیجه بازی های مکرر این است که مزایای همکاری متقابل بزرگترین آنها خواهد بود.)

مثال تجاری: جنگ تبلیغاتی ویرایش ]

نمونه هایی از معضلات زندانیان نیز در فعالیت های تجاری ظاهر می شوند. به عنوان نمونه از رقابت تبلیغاتی استفاده کنید.

این دو شرکت با یکدیگر به رقابت می پردازند و تبلیغات این دو شرکت بر یکدیگر تأثیر می گذارد ، یعنی اگر تبلیغات یک شرکت توسط مشتری پذیرفته شود ، بخشی از درآمد طرف مقابل را به خود جلب می کند. با این حال ، اگر این دو انتشار همزمان تبلیغات مشابه داشته باشند ، افزایش درآمد اندک است اما هزینه افزایش می یابد. اما اگر کیفیت تبلیغات خود را ارتقا ندهید ، تجارت شما توسط طرف دیگر از بین می رود.

این دو شرکت می توانند دو انتخاب داشته باشند:

  1. توافق نامه های متقابل برای کاهش هزینه های تبلیغات. ( همکاری )
  2. هزینه تبلیغات را افزایش دهید ، سعی کنید کیفیت تبلیغات را بهبود بخشید ، بر یکدیگر غلبه کنید. ( خیانت )

اگر دو شرکت به یکدیگر اعتماد ندارند ، نمی توانند همکاری کنند ، خیانت به یک استراتژی غالب تبدیل می شود ، شرکت دوم وارد جنگ تبلیغات می شود و افزایش در هزینه های تبلیغاتی به درآمد دو شرکت آسیب می زند ، که این معضل زندانی است. در واقعیت ، دستیابی به توافق نامه همکاری با دو شرکت رقیب دشوارتر است و بیشتر آنها در معضل زندانی قرار می گیرند.

مثال مسابقه دوچرخه ویرایش ]

استراتژی رقابت مسابقه دوچرخه سواری نیز یک بازی است و می توان نتایج تحقیقات معضل زندانی را توضیح داد. به عنوان مثال، برگزار می شود هر سال تور دو فرانس در موارد زیر: بازیکنان اغلب "راه رفتن در پایان مقابل تیم های بزرگ " (به فرانسوی: peloton ) راه رو به جلو، آنها را این استراتژی این است که خود را نه در پشت کنید، و بازده متوسط. مهمترین بازیکن در زمین باد پر تلاش ترین است ، بنابراین انتخاب سمت راست بدترین استراتژی است. معمولاً این اتفاق می افتد که در ابتدا همه مایل به پیشروی نیستند ( خیانت رایج ) که باعث می شود سرعت کلی بسیار کند شود و سپس معمولاً دو یا چند بازیکن سوار جبهه می شوند و سپس برای یک دوره زمانی اصلی ترین موقعیت را با یکدیگر مبادله می کنند. به اشتراک گذاشتنمقاومت در برابر باد ( همکاری ) باعث افزایش سرعت کل می شود و اگر یکی از افراد جلوی آن تلاش کند که موقعیت را در جلو نگه دارد ( خیانت ) ، سایر بازیکنان و تیم های بزرگ گیر می آیند ( خیانت مشترک ). و اغلب مورد، بیشترین تعداد بازیکنان در بالا ( همکاری ) معمولا در پشت بازیکن آخرین توان به گرفتن ( خیانت )، به دلیل پشت پخش سواری در مقابل بازیکنان جریان در، گردیده است.

وقایع مربوط به معضل زندانی ویرایش ]

Whimsy ویرایش ]

ویلیام پوندستون در کتاب خود از مثال نیوزیلند برای نشان دادن معضل زندانی استفاده می کند. یک خواننده صادقانه در نیوزیلند وجود دارد. این کیوسک نه مدیر دارد و نه قفل. افرادی که روزنامه می خرید پول خود را می گذارند و روزنامه را می گیرند. البته ممکن است برخی افراد بدون پرداخت ( خیانت )روزنامه را بگیرند ، اما این بندرت به ندرت اتفاق می افتد زیرا همه می دانند که اگر همه روزنامه را بدزدند ( خیانت مشترک ) در آینده منجر به نتایج ناخوشایند و مضر خواهد شد. آنچه در این مثال خاص است این است که نیوزیلندی ها تحت تأثیر هیچ عامل دیگری نیستند و می توانند از معضل زندانی فرار کنند. هیچ کس توجه خاصی به روزنامه نمی کند مردم برای جلوگیری از عواقب خیانت مشترک از قوانین پیروی می کنند . با این روش معضل زندانی است استدلال و ایده های مشترک به نام " فانتزی (تفکر جادویی)". [3]

"مجازات گناه و کاهش حکم" عملی نیست ویرایش ]

نتیجه گیری معضل زندانی یکی از دلایلی است که جنایتکاران گروهی در بسیاری از کشورها نسبت به اعتراف به گناه اعتراف کرده اند (انگلیسی: plea pazgain). نتیجه گیری معضل زندانی این است که اگر دو مجرم وجود داشته باشد ، یکی از آنها مرتکب جرم و دیگری بی گناه می شود ، مرتکب به منظور کاهش حکم ( خیانت فردی ) به همه چیز و حتی بی گناه اعتراف می کند . در بدترین حالت ، اگر هر دوی آنها به زندان محکوم شوند ، متخلفین اعتراف شده احکام کمتری دارند و مجرمان بی گناه احکام بیشتری دارند.

تراژدی کالاهای عمومی ویرایش ]

در بازی واقعی بیش از یک مهمانی وجود دارد و معضل زندانی وجود خواهد داشت که شامل چندین مهمانی باشد. تراژدی کالاهای عمومی گارنتجیمز هاردین به عنوان نمونه ای است: "تراژدی کالاهای عمومی به این معنی است که اموال عمومی متعلق به بیشترین تعداد افراد ، اغلب کمترین مراقبت از آنها" ، مانند شیلات ، در دریاهای بلند است . ماهی عمومی است و طبق این عقیده که به طور غیرقابل تفریحی توسط دیگران دستگیر نشود ، صیادان در ماهیگیری بی بند و باری می شوند و در نتیجه محیط زیست دریایی از بین می رود و وضعیت معیشت صیادان تحت تأثیر قرار می گیرد ( نتیجه خیانت مشترک ). با این وجود ، مراجعه به معضل چند زندانی قابل سؤال نیست زیرا همواره می توان آن را به گروهی از زندانیان کلاسیک دو طرفه تقسیم کرد. یعنی فقط زندانیان دو طرف در وضعیت دشواری قرار دارند. معضل زندانی به اصطلاح چند حزبی فقط توهمی است که با اختلاط چندین زندانی دو طرفه ایجاد شده است.

معضل زندانی مکرر (چندین نفر) ویرایش ]

دانشمند آمریکایی سیاسی رابرت اکسلراد ( رابرت مارشال اکسلراد ) در کتاب خود " تکامل از همکاری " ( در تکامل از همکاری )، اکتشاف یک صحنه طولانی معمای زندانی های کلاسیک، و آن را "تکرار معضل زندانیان »(IPD). در این بازی ، شرکت کنندگان باید بارها و بارها استراتژی های مربوط به یکدیگر را انتخاب کرده و تقابل قبلی خود را به خاطر بسپارند. Axelrod از همسالان دانشگاهی در سراسر جهان برای طراحی استراتژی های رایانه ای دعوت می کند و در معضل تکراری زندانی ، با یکدیگر رقابت می کند . تفاوت در رویه های شرکت در مسابقه به طور گسترده در این زمینه ها وجود دارد: پیچیدگی الگوریتم ، رویارویی اولیه ، توانایی بخشش و غیره.

آکسلرود دریافت که وقتی این رویارویی ها برای هر یک از شرکت کنندگان که استراتژی های مختلفی را انتخاب می کردند ، مدت طولانی تکرار شد ، با قضاوت از دیدگاه خود علاقه مند ، استراتژی نهایی "حریص" نهایی کاهش می یابد و استراتژی " نوعدوست " مقایسه می شود. بیشتر به تصویب رسید. او از این بازی استفاده می کند تا نشان دهد از طریق انتخاب طبیعی ، مکانیسم رفتار نوع دوستانه ممکن است از مکانیسم خودخواهانه خالص اصلی تکامل یابد.

بهترین استراتژی تعیین کننده " دندان برای دندان " در نظر گرفته می شود ، روشی که توسط روانشناس ریاضی روسی-آمریکایی آناتول رپوپورت طراحی و اعمال شده است. این ساده ترین حالت از تمام ورودی ها است ، فقط شامل چهار خط BASIC است و بازی را به دست آورد. این استراتژی صرفاً همکاری در ابتدای بازی تکراری و سپس اتخاذ استراتژی دور قبلی حریف خود است. استراتژی بهتر این است که "دندان ها را ببخشید". هنگامی که حریف شما خیانت کرد ، به هر حال در دور بعدی با احتمال کمی (حدود 1٪ -5٪) همکاری خواهید کرد. این برای در نظر گرفتن بهبودی گاه به گاه از فریب چرخه خیانت است. وقتی سوءاستفاده وارد بازی شد ، "بخشش بهترین است". این بدان معنی است که گاهی اوقات اقدامات شما به اشتباه به طرف مقابلتان ابلاغ می شود: شما همکاری می کنید اما طرف مقابل شما می شنود که خیانت کرده اید.

Axelrod با تجزیه و تحلیل استراتژی نمره بالا چندین شرط لازم را برای موفقیت استراتژیک مشخص کرده است.

دوستانه: مهمترین شرط این است که استراتژی باید "دوستانه" باشد ، به این معنی که قبل از خیانت به حریف خیانت نکنید. تقریباً همه استراتژی های نمره بالا دوستانه هستند. بنابراین ، یک استراتژی کاملاً خودخواهانه فقط به دلایل خودخواهانه است و هرگز در ابتدا به مخالفان خود نخواهید رسید.

قصاص: با این حال ، اکسلد استدلال می کند که استراتژی موفقیت نباید خوش بینانه کور باشد. همیشه انتقام بگیر. نمونه ای از یک استراتژی غیر انتقام جویانه همیشه در کنار هم کار می کنند. این یک انتخاب بسیار بد است ، زیرا استراتژی "پایین دست" به طرز وحشیانه ای از چنین احمق ها سوءاستفاده می کند.

بخشش: یکی دیگر از کیفیتهای استراتژی موفقیت ، نیاز به بخشش است. اگرچه آنها تلافی نمی کنند ، اگر حریف به خیانت ادامه ندهد ، آنها به همکاری عقب می روند. این امر قصاص طولانی مدت و ضد تلافی را متوقف کرد و امتیازات را به حداکثر رساند.

عجیب نیست: آخرین کیفیت ارزش ندارد ، یعنی تلاش برای گرفتن امتیاز بالاتر از حریف (این نیز برای یک استراتژی "دوستانه" غیرممکن است ، به این معنی که استراتژی "دوستانه" هرگز نمی تواند بالاتر از حریف باشد. امتیاز)

بنابراین ، اکسلرود به این نتیجه رسید که تصورات اتوپیایی را به وجود آورد که نشان می دهد افراد خودخواه برای داشتن منافع خودخواهانه دوستانه ، بخشنده و ناعادلانه هستند. یکی از نتیجه گیری های مهم تحقیقات Axelrod در مورد تکرار معضل زندانی این است که بچه های دوست می توانند ابتدا معامله را انجام دهند.

تجدید معضل زندانی کلاسیک یک داده نژاد مدل: این نتیجه رسیدند که تنها استراتژی عقلانی به منظور افزایش نظامی، به نظر می رسد که این دو کشور ترجیح می دهند به صرف خود تولید ناخالص داخلی در اسلحه به جای کره. جالب توجه است، در واقع، تلاش برای توضیح این کشور در این راه (بین "معضل زندانی تکرار است فرض" در زمان های مختلف هزینه های نظامی در "بالا" و "پایین" در برابر تکرار تلاش برای رقابت)، اما اغلب آن را نشان می دهد که قلمداد مسابقه تسلیحات همانطور که انتظار می رفت ظاهر نمی شد. (به عنوان مثال ، به نظر نمی رسد که مخارج نظامی یونانی ها وترک ها دنبال مسابقه اسلحه معضل زندانی باشند ، اما به احتمال زیاد توسط سیاست های داخلی آنها هدایت می شوند.) این ممکن است یک بازی یک بار و تکرار باشد. نمونه های مختلف رفتار منطقی در بازی های جنسی.

برای یک بازی معضل یک بار زندانی ، بهترین استراتژی (حداکثر امتیاز) صرفاً خیانت است ؛ همانطور که در ابتدا توضیح داده شد ، این مهم است که مهم نیست اقدامات طرف مقابل چیست. اما ، در یک بازی معضل زندانی مکرر ، بهترین استراتژی به استراتژی های مخالفان احتمالی و نحوه واکنش آنها به خیانت و همکاری متکی است. به عنوان مثال ، جمعیتی را در نظر بگیرید که هرکس هر بار به آن خیانت می کند ، به جز اینکه یک نفر از یک راهبرد دندان به انگشتان پا پیروی کند. این فرد به دلیل از دست دادن دور اول در یک نقطه ضعف قرار دارد. در چنین جمعیتی ، بهترین استراتژی برای این شخص خیانت در هر زمان است. در جمعیتی که درصد مشخصی از کل افراد خیانتکار و بقیه افرادی که دندان شیری دارند ، بهترین استراتژی برای افراد به این درصد و طول بازی بستگی دارد.

به طور کلی دو روش برای به دست آوردن بهترین استراتژی وجود دارد:

  1. تعادل نشانی بیزی: اگر توزیع آماری استراتژی های رویارویی مشخص شود (به عنوان مثال 50٪ دندان ها ، 50٪ با هم کار می کنند) ، بهترین استراتژی نسبی را می توان از لحاظ ریاضی بدست آورد [4] .
  2. در حال حاضر شبیه سازی مونت کارلو از جمعیت وجود دارد ، که در آن افراد با امتیاز کم ناپدید می شوند و افراد با نمره بالا به طور مکرر تولید می شوند (الگوریتمی نبوغ که بهترین استراتژی را بدست می آورد). سنتز الگوریتم در جمع نهایی معمولاً بستگی به ترکیب الگوریتم در مسابقه مقدماتی دارد.

اگرچه دندان در برابر دندان همواره استراتژی اساسی قابل اطمینان ترین در نظر گرفته شده است، اما معضل زندانی تکرار است سالگرد 20th باشد از مسابقه است، از بریتانیا دانشگاه ساوتهمپتون، یک گروه (از نیکلاس جنینگز رهبری (نیکلاس جنینگز) [1] ، از جمله Rajdeep Dash ، Sarvapali Ramchurn ، الکس راجرز و Perukrishnen Vytelingum ) استراتژی جدیدی را ارائه داد که ثابت کرد که موفقیت بیشتری نسبت به دندان برای دندان دارد. این استراتژی برای دستیابی به بیشترین تعداد امتیاز در یک برنامه واحد ، به همکاری بین برنامه ها متکی است. دانشگاه ساوتهمپتون 60 برنامه برای شرکت در این مسابقه ارسال کرده است.در آغاز این برنامه ها برای شناسایی یکدیگر از طریق مجموعه 5 تا 10 عمل طراحی شده است. پس از شناسایی این شناسنامه ها ، همیشه یک برنامه همکاری خواهد کرد و سایر برنامه ها همیشه خیانت می کنند ، و اطمینان می دهند که خیانتکار حداکثر امتیاز را کسب می کند. اگر برنامه تشخیص دهد كه مشاركت كننده غیر ساوتهمپتون را اجرا می كند ، در تلاش برای به حداقل رساندن نمره فرایند رقابت ، این خیانت ادامه خواهد یافت. نتیجه [5] ، این استراتژی برای به دست آوردن 3 نفر برتر به رقابت پایان داد ، همچنین موقعیتهای بسیاری نزدیک به پایین داشت. اگرچه این استراتژی به طور قابل توجهی نشان داده است که از دندان موثرتر است ، اما به این دلیل است که چندین کانال در این رقابت خاص مجاز است. در مسابقه ای که یک طرف فقط می تواند یک شرکت کننده را کنترل کند ، در واقع یک راه حل بهتر برای ساختن دندان است.

اگر معضل زندانی تکراری دقیقاً N بار تکرار شود ، دانستن اینکه N ثابت است ، پس یک واقعیت جالب دیگر بوجود می آید. تعادل نش هر بار خیانت است. این با القاء آسان است. همچنین می توانید در دور نهایی خیانت کنید ، زیرا حریف شما هیچ فرصتی برای مجازات شما نخواهد داشت. بنابراین ، شما در دور نهایی خیانت خواهید کرد. در این زمان ، شما می توانید در دور مقدماتی خیانت کنید ، زیرا آخرین بار مهم نیست که چه کاری انجام می دهید ، حریف شما خیانت خواهد کرد. و غیره برای همکاری برای حفظ درخواست ، آینده برای هر دو شرکت نامشخص است. یک راه حل این است که تعداد کل بازی های N را نامحدود یا غیرقابل پیش بینی کنید. انتظارات برای آینده باید از پیش تعیین نشده باشد.

مورد جداگانه دیگر معضل زندانی در مورد "هرگز متوقف" نیست. این بازی بارها و بارها تکرار می شود ، و نمره شما به طور متوسط ​​(البته توسط کامپیوتر محاسبه می شود).

بازی معضلات زندانیان اساس برخی از تئوری های همکاری انسانی و اعتماد است. با فرض اینکه معضل زندانی می تواند ارتباطات بین دو نفر را که باید به آنها اعتماد کرد ، شبیه سازی کند ، رفتار مشارکتی این گروه را می توان با انواع مختلفی از بازیکنان با بازی های مکرر مدل کرد. این امر باعث شده است که علاقه مندی پایدار بسیاری از دانشمندان وجود داشته باشد. در سال 1975 ، گروفمن و استول تخمین زدند که بیش از 2،000 مقاله علمی به تحقیقات در این زمینه اختصاص یافته است.

روانشناسی یادگیری و نظریه بازی ویرایش ]

هنگامی که شرکت کنندگان در بازی می توانند یاد بگیرند که احتمال خیانت توسط سایر شرکت کنندگان را تخمین بزنند ، رفتار خودشان تحت تأثیر تجربه آنها با دیگران قرار می گیرد. آمارهای ساده نشان می دهد که ، به طور کلی ، تعامل شرکت کنندگان بی تجربه با سایر شرکت کنندگان یا به طور معمول خوب است یا به طور معمول بد است. اگر براساس این تجربیات عمل کنند (از طریق خیانت بیشتر یا همکاری ، در غیر این صورت) ممکن است در معاملات آینده آسیب ببینند. با تجربه به دست آمده ، آنها تصور واقع بینانه تری از احتمال خیانت به دست آوردند و در بازی موفق تر شدند. تأثیر معاملات اولیه که توسط شرکت کنندگان نابالغ در مشارکت آینده آنها تجربه شده ممکن است بسیار بیشتر از تأثیر این معاملات بر شرکت کنندگان بالغ باشد. این اصول تا حدودی توضیح می دهند که چرا تجربیات رشد جوانان اینقدر تأثیرگذار است و چرا به ویژه در مقابل زورگویی آسیب پذیر هستند ، و گاهی خود آنها قلدر می شوند.

احتمال خیانت در گروه می تواند با تجربه همکاری تضعیف شود [6] ، زیرا بازی قبلی اعتماد ایجاد کرد . بنابراین ، رفتار فداکارانه می تواند مثلاً خصوصیات اخلاقی گروه را تقویت کند. اگر گروه كوچك باشد ، رفتار مثبت احتمالاً بازخورد را به روشی مثبت با هم خواهد گرفت - افراد گروه را ترغیب می كنند كه به همكاری خود ادامه دهند. این مربوط به یک معضل مشابه است: به کسانی که از آنها کمک می شود تشویق شوند که از رفتارهایی که ممکن است آنها را در معرض خطر قرار دهد ، راضی شوند. چنین روشهایی در درجه اول در مطالعه نوع دوستی متقابل ، انتخاب گروه ، انتخاب خون و فلسفه اخلاقی نقش دارند .

بازی مرتبط ویرایش ]

معامله کیف بسته ویرایش ]

هافستادتر 2 سوالاتی مانند معضل زندانی را مطرح کرده است. او پیشنهاد "معامله کیسه ای بسته" را داد که به عقیده وی به افراد کمک می کند تا با این سوال بازی ساده این موضوع را درک کنند.

"معامله کیسه های بسته شده": A و B کیسه های بسته بندی شده رو در رو مبادله می کنند. اجماع هر دو طرف این است که یک کیف پول می گذارد و B کالا را قرار می دهد . هر طرف می تواند صادقانه چیزهایی را در کیسه قرار داده و سپس آنها را مبادله کند ؛ یا آنها می توانند کیسه را به طرف مقابل خالی کنند و خیانت کنند.

در این بازی به دلیل فواید بسیار زیاد خیانت ، افراد زیادی وجود دارند که خیانت را انتخاب می کنند. این به این معنی است که تاجر عقلانی نیست که انجام این معاملات، در نتیجه "بستن یک معامله کیسه" با توجه به انتخاب نامساعد و از دست دادن بازار .

آیا دشمن است یا دوست؟ ویرایش ]

"دوست یا دشمن؟" آیا اجرای مسابقه، 2002 تا 2005 در ایالات متحده آمریکا رقابت های شبکه پخش نشان می دهد (بازی نمایش شبکه). این نمونه ای از بازی معضل زندانی با افراد واقعی است ، اما صحنه مصنوعی است. سه جفت نفر در این مسابقه شرکت می کنند. وقتی هر جفت از بین رفت ، آنها بازی معضل زندانی را انجام می دهند و تصمیم می گیرند که چگونه جوایز خود را تقسیم کنند. اگر همه آنها همکاری کنند ("دوستان") ، جوایز آنها به طور مساوی تقسیم می شود. اگر یکی همکاری کند و دیگری خیانت کند ("دشمن") ، خائن همه جوایز را می گیرد ، و همکاران نمی توانند چیزی بدست آورند. اگر دو طرف به یکدیگر خیانت کنند ، آنگاه هردو هیچی ندارند. توجه داشته باشید که این ماتریس پرداخت با ماتریس پرداخت استاندارد فوق الذکر متفاوت است ، زیرا از بین رفتن وضعیت "خیانت متقابل" و پرونده "من با حریف خیانت می کنم همکاری می کنم" یکسان است. در مقایسه با تعادل پایدار معضل زندانی استاندارد ، "خیانت متقابل" یک تعادل ضعیف است. اگر بدانید که حریف شما به "دشمن" تبدیل می شود ، پس انتخاب شما تاثیری در جایزه شما نخواهد داشت. به تعبیری ، "دشمن است یا دوست" الگوی درآمد بین "معضل زندانی" و "مرغ" دارد.

این ماتریس درآمد:

  • اگر شرکت کنندگان با هم کار کنند ، هر 1+ می شود.
  • اگر به آنها خیانت شود ، هر یک 0 می شود.
  • اگر A همکاری کند و B خیانت کند ، A 0 می شود و B +2 می شود.

این دشمن و دوستی است که برای کسانی که می خواهند یک تحلیل واقع بینانه از معضل زندانی انجام دهند ، مفید خواهد بود. خاطرنشان كرد: شركت كنندگان فقط یك بار می توانند این كار را انجام دهند ، بنابراین تمام ایده هایی كه شامل بازی های مكرر هستند كاربردی ندارند و استراتژی "دندان به دندان" قابل توسعه نیست.

در مورد دشمنان و دوستان ، هر یک از شرکت کنندگان مجاز به اظهارنظر هستند ، به طوری که یک رفیق دیگر اطمینان دارد که قبل از اینکه دو طرف مخفیانه تصمیم به همکاری یا خیانت بگیرند ، دوستانه دوست هستند. راه "شکستن سیستم" این خواهد بود که یک شرکت کننده به طرف مقابل خود می گوید: "من دشمن را انتخاب می کنم. اگر فکر می کنید بعدا به شما پاداش می دهم ، دوست را انتخاب می کنم. در غیر اینصورت ، اگر شما دشمن را انتخاب می کنید ، ما این دست خالی خواهد بود. "یک نسخه حریص تر خواهد بود:" من دشمن را انتخاب خواهم کرد. من به شما درصد X را می دهم و درصد باقیمانده (100-X) مال من خواهد بود. بنابراین ، اگر می خواهید یا نه ، یا همه ما مقداری بدست می آوریم ، یا چیزی برای به دست آوردن نداریم. "(در بازی Ultimatum ). این ترفند اکنون تلاش برای کاهش آن X٪ و نگه داشتن رقیب دیگر است که هنوز هم دوست خود را انتخاب می کند. اصولاً این شرکت کننده باید این مرز را بشناسد ، جایی که ابزار حریف وی از دیدن او چیزی بیش از آن چیزی نیست که بتواند در صورت موفقیت ، از پولی که بدست می آورد ، کسب کند.

این روش هرگز در رقابت آزمایش نشده است ؛ ممکن است به این دلیل باشد که داوران اجازه نمی دهند و حتی در صورت اجازه ، نابرابری به دلیل استفاده از این قانون منجر به بازده مورد انتظار کمتر می شود (آخرین بازی تلاش شده در بازی یک شبه ) نتیجه ، رد پیشنهادهای زیاد و نابرابر است ، در بعضی موارد ، معادل دو هفته دستمزد با توجه به اینكه جوایز هر دو شركت كننده در اولویت قرار ندارند ، در اولویت قرار دارد.

 

معضل زندانی



برای جستجویپرش به ناوبری بروید

اگر زندانیان با یکدیگر همکاری نکنند ، نمی توانند از مخمصه فرار کنند.

وضعیت دشوار زندانی ( انگلیسی: وضعیت دشوار زندانی ) است نظریه بازی از غیر حاصل جمع صفر بازی نماینده نمونه، منعکس کننده انتخاب فردی است که بهترین گروه انتخاب نیست. یا در یک گروه ، افرادی که انتخاب منطقی می کنند ، اغلب منجر به غیر منطقی جمعی می شوند. اگرچه این معضل فقط یک ماهیت الگو است ، اما اوضاع مشابه اغلب به لحاظ رقابت قیمت و حفاظت از محیط زیست در واقعیت رخ می دهد.

معضل یک زندانی تنها با معضل مکرر زندانی نخواهد بود.

در معضل زندانی مکرر ، بازی تکرار می شود . بنابراین هر یک از شرکت کنندگان این فرصت را دارد که رفتار غیرقابل همکاری شرکت کننده دیگر را در دور قبل "مجازات" کند. در این زمان ، ممکن است همکاری در نتیجه تعادل پدیدار شود. اکنون انگیزه فریب ممکن است با تهدید مجازات غلبه کند ، که ممکن است منجر به یک نتیجه بهتر ، همکاری شود. به عنوان تعداد تکرار نزدیک به بی نهایت ،تعادل نش تمایل به بهینه پارتو دارد .

هدف اصلی معضل زندانی این است که زندانیان با یکدیگر همکاری کنند و حقیقت را فاش نکنند ، این می تواند بهترین منافع را برای همه به همراه آورد (کوتاه کردن حکم) ، اما در صورت برقراری ارتباط ، ذینفع می تواند برای خود مزایایی به همراه آورد (هیچ گناهی آزاد نشود). و از آنجا که همدستان خود که استخدام شده اند می توانند مزایایی برای او به همراه داشته باشند ، بنابراین فروش یکدیگر ، بهترین منافع مشترک را نقض می کند ، اما این بهترین منافع آنهاست. اما در حقیقت ، برای سازمان های انتظامی غیرممکن است چنین وضعیتی را ایجاد کنند که همه زندانیان را به اعتراف مجبور کنند ، زیرا زندانیان باید عواملی جز مجازات را در نظر بگیرند (فروشندگان هم تلافی می شوند و غیره) ، اما کاملاً به نفع مجریان قانون نیست (مجازات ها). این را در نظر بگیرید ، بنابراین این یک موضوع علمی مرجع است.

 

دایرکتوری

معضل زندانی کلاسیک ویرایش ]

در سال 1950 مریل فریدر و ملوین درایزر که در شرکت رند مشغول به کار بودند ، تئوری معضلات مربوطه را تدوین کردند که بعدا توسط مشاور آلبرت تاکربه عنوان یک زندانی توصیف و نامگذاری شد. معضل زندانی. " معضل زندانی کلاسیک به شرح زیر است:

پلیس دو مظنون به نام های الف و ب را دستگیر کرد ، اما شواهد و مدارک کافی برای متهم کردن این دو فرد به عنوان مقصر وجود نداشت. سپس پلیس مظنونان را از هم جدا كرد و با آن دو ملاقات كرد و هر دو طرف را با هم انتخاب كرد:

  • اگر یک مرد اعتراف و شهادت پیگرد قانونی دیگر (قوانین و مقررات مربوط شناخته شده به عنوان "خیانت" در سمت دیگر)، در حالی که دیگر سکوت، که بلافاصله منتشر خواهد شد، سکوت به حبس به مدت 10 سال محکوم کرد.
  • اگر هر دوی آنها ساکت باشند (گفته می شود این شرایط "همکاری" با یکدیگر دارند) ، این دو نفر نیز به شش ماه محکوم می شوند.
  • اگر هردو آنها به یکدیگر گزارش دهند ("به یکدیگر خیانت كنید") ، این دو نفر نیز به پنج سال زندان محكوم می شوند.

جدول به شرح زیر خلاصه می شود:

 ب سکوت (همکاری)اعتراف B (خیانت)
سکوت (همکاری)دو نفر به مدت نیمی از سال حکم مشابه را داشتند10 سال زندان ؛ B بلافاصله آزاد شد
اعتراف (خیانت)الف بلافاصله آزاد می شود ؛ ب به 10 سال زندان محکوم می شوددو نفر به مدت 5 سال در زندان به سر بردند

تفسیر ویرایش ]

مانند سایر نمونه های تئوری بازی ، معضل زندانی فرض می کند که هر یک از شرکت کنندگان ("زندانی") به خود علاقه دارند ، یعنی هر دو به دنبال بیشترین منافع شخصی هستند و نه منافع شخص دیگر. فایده استراتژی یک شرکت کننده اگر در هر شرایطی کمتر از هر استراتژی دیگری باشد ، "ضرر جدی" خوانده می شود و شرکت کنندگان منطقی هرگز انتخاب نخواهند کرد. علاوه بر این ، هیچ نیروی دیگری در تصمیمات فردی دخالت نمی کند و شرکت کنندگان می توانند استراتژی ها را دقیقاً مطابق میل خود انتخاب کنند.

زندانی کدام راهبرد را باید انتخاب كند تا حكم شخصی خود را به حداقل برساند؟ این دو زندانی به دلیل انزوا حبس از انتخاب طرف مقابل خبر نداشتند و حتی اگر می توانستند صحبت کنند ، شاید نتوانند باور کنند که طرف مقابل تلافی نمی کند. در مورد انتخاب عقلانی فرد ، پیگرد قانونی خیانت به حكم طرف مقابل همواره كمتر از سكوت است. سعی کنید تصور کنید که چگونه دو زندانی عقلانی در معضل تصمیم گیری می کنند:

  • اگر طرف مقابل ساکت باشد ، خیانت من به من اجازه می دهد آزاد شود ، بنابراین من خیانت را انتخاب خواهم کرد.
  • اگر طرف مقابل به من خیانت کرده باشد ، من باید طرف مقابل را متهم کنم که حکم کمتری بدست آورد ، بنابراین خیانت را انتخاب خواهم کرد.

وضعیتی که این دو با آن روبرو هستند یکسان است ، بنابراین تفکر منطقی این دو به یک نتیجه می رسند - خیانت را انتخاب کنید. خیانت استراتژیغالب در بین دو استراتژی است . بنابراین ، تنها تعادل نش که می توان در این بازی به دست آورد این است که هر دو شرکت کننده به یکدیگر خیانت می کنند و این دو همچنین به مدت پنج سال در زندان به سر می برند.

تعادل نش در این بازی بدیهی است که یک راه حل بهینه Pareto نیست که منافع گروه را در نظر بگیرد . از نظر همه علایق ، اگر هر دو شرکت کننده همکاری کنند تا سکوت کنند ، هر دو نفر فقط به شش ماه حبس محکوم می شوند و کلیه علایق نیز بیشتر خواهد بود. نتیجه بهتر از این خواهد بود که دو نفر به یکدیگر خیانت کنند و به پنج سال محکوم شوند. اما طبق فرضیات فوق ، هر دو نفر افراد منطقی هستند و فقط منافع شخصی خود را دنبال می کنند. وضعیت تعادل به این صورت خواهد بود که هر دو زندانی خیانت را انتخاب می کنند و نتیجه این است که دو قاضی بالاتر از همکاری هستند و منافع کلی از همکاری کمتر است. اینجاست که "معضل" نهفته است. مثال به طور مؤثر اثبات می کند که در بازی جمع غیر صفر ، بهینه پارتو وتعادل نش در تضاد هستند.

معضل زندانی ثابت ویرایش ]

لحن یا سبک این نوشته ممکن است برای سبک نوشتن دائرopالمعارف مناسب نباشد. ( 27 فوریه 2010 ) 
لطفاً با توجه به راهنما به بهبود این مطلب کمک کنید . لطفاً در مورد بحث صحبت کنید و آن را در صفحه بحث بهبود دهید.

به طور خلاصه ، دو مورد اول معضل زندانی در دو وضعیت زیر رخ می دهد:

الف) بار اول توسط ب متهم شد و این امر منجر به اتهام دوم ب. سرانجام ، الف بلافاصله آزاد شد ، ب به 10 سال یا دو سال حبس 5 سال محكوم شد.

هر دو طرف سکوت می کنند ، یعنی رابطه ای با اعتماد متقابل برقرار می کنند که درنهایت منجر به این خواهد شد که دو مرد به مدت شش ماه در یک حکم یکسان باشند.

با این وجود ، رابطه اعتماد متقابل غیرقابل تجزیه نیست ، این هم می تواند مورد سوء استفاده قرار بگیرد یعنی: الف و ب به طور مشترک سکوت را برای اولین بار به دست می آورند تا اعتماد طرف مقابل را جلب کنند ، اما یکی از الف یا ب اعتماد طرف مقابل را بدست می آورد و طرف مقابل را متهم می کند. بزرگترین فایده این است که وی بلافاصله آزاد می شود ، اما طرف مقابل 10 سال زندان خواهد داشت. این یک استراتژی برای به دست آوردن بهترین منافع خود با هزینه دیگری است.

فرض کنید که هر دو زندانی می خواهند از این استراتژی استفاده کنند و تعداد دفعات را به ده نفر کسر کنند ، در این صورت وضعیت زیر وجود خواهد داشت: در فرایند از بازی اول تا بازی نهم ، هر دو طرف به امید برقراری رابطه اعتماد متقابل ، ساکت خواهند ماند. و یکدیگر را در دهمین دوره متهم متهم کردند که درنهایت منجر به این دو نفر خواهد شد که به مدت پنج سال حکم یکسان را تحمل می کنند.

بار دیگر ، هر دو طرف مشخص است که طرف مقابل از همان استراتژی خود استفاده خواهد کرد ، یعنی دانستن اینکه طرف مقابل خود را در بازی دهم متهم می کند ، به طوری که برقراری رابطه اعتماد بین این دو در بازی نهم بی معنی است. به طور قیاس ، برقراری رابطه اعتماد در بازی هشتم به بازی اول نیز بی معنی است ، یعنی ده مسافرخانه به یکدیگر خیانت می کنند ، یعنی تعادل نش. همچنین می توان استنباط کرد که در چنین شرایطی ، تنها درصورتی که تعداد معضلات زندانیان مشخص نباشد (یعنی هر دو طرف تعداد دور را نمی دانند) ، پدیده سکوت متقابل برای به دست آوردن یک رابطه اعتماد ایجاد می شود.

فرم عمومی ویرایش ]

از ساختار بازی اساسی معضل زندانی می توان برای تحلیل دقیق تر معضل زندانی استفاده کرد. اقتصاد تجربی اغلب از یک شکل کلی این بازی برای تحلیل موضوعات مختلف استفاده می کند. در زیر مثالی از نحوه اجرای فرم کلی آورده شده است:

دو شرکت کننده و یک کتابفروش وجود دارند. هر شرکت کننده دو کارت دارد که هر کدام "همکاری" و "خیانت" دارند. شرکت کنندگان هرکدام یک کارت را به صورت رو به پایین قرار دادند و آن را در مقابل فروشنده قرار دادند. متن رو به پایین امکان شرکت کنندگان در انتخاب طرف مقابل 1 را از بین نمی برد .سپس فروشنده دو کارت شرکت کننده را باز کرده و طبق قوانین زیر مزایا را پرداخت می کند:

  • یک نفر خیانت کرد ، یک نفر همکاری کرد: خائن 5 امتیاز (وسوسه خیانت) ، همکار 0 امتیاز (تصادف پرداخت شده) کسب کرد.
  • هر دو با هم همکاری می کنند: هر کدام 3 امتیاز دارند (جبران تعاونی).
  • هر دو خیانت کردند: هر کدام 1 امتیاز (مجازات خیانت).

با ماتریس بازده جدول نشان می دهد پرداخت به شرح زیر (با رنگ قرمز و آبی نمایندگی از دو نفر):

فرم کلی ماتریس پرداخت برای معضلات زندانیان
 همکاریخیانت
همکاری3 ، 30 ، 5
خیانت5 ، 01 ، 1
بیان شده با نماد "T، R، P، S"
 همکاریخیانت
همکاریر ، رS ، T
خیانتT ، Sپ ، پ
بیان شده در اصطلاح "منفی-برد"
 همکاریخیانت
همکاریبرنده شوید، پیروزشویدمنفی بزرگ ،برد بزرگ
خیانتپیروزی بزرگ ،منفی بزرگمنفی ،منفی

تعداد امتیازات به دست آمده توسط یک بازی ساده می تواند منجر به نتیجه گیری کلی شود.

نمادامتیازانگلیسیچینی (غیر اصطلاحات)توضیح دهید
جدول نمادهای T ، R ، P ، S
تی5وسوسهوسوسه خیانتخیانت فردی به دستاوردهای موفق.
ر3پاداشجبران تعاونیدرآمد تعاونی
پ1مجازاتمجازات خیانتدرآمد خیانت مشترک
س0مکنده هاپرداخت تقلبوسواس تنها بودن خیانت است

اگر T (وسوسه) = وسوسه خیانت ، R (پاداش) = پاداش تعاونی ، P (مجازات) = مجازات خیانت ، S (Suckers) = پرداخت فریب خورده ، از نظر نمره انتخاب شخصی ، از نابرابری زیر حاصل می شود .

T> R> P> S

(راه حل: نابرابری فوق را از 5> 3> 1> 0 بدست آورید)

در صورت کسب نمره کلی ، نابرابری زیر حاصل می شود .

2R> T + S یا 2R> 2P

(راه حل: 2 × 3> 5 + 0 یا 2 × 3> 2x1 ؛ همکاری 2 نفر 6 امتیاز را کسب کرد که این رقم 2 امتیاز بالاتر از خیانت متقابل و 5 امتیاز برای خیانت فردی است. بدیهی است که نمره همکاری بالاتر از خیانت است. همکاری استراتژی غالب در گروه است.)

بازی های مکرر یا معضلات زندانی مکرر ، شرکت کنندگان را از تمرکز روی T> R> P> S به تمرکز روی 2R> T + S تغییر می دهد. یعنی شرکت کنندگان از جنگل بیرون بیایند. نظریه فوق توسط داگلاس هافستادتر ایجاد شده است.

مثال واقع گرایانه 

ادامه نوشته

تئوری بازی

نظریه بازی ها ( انگلیسی: تئوری بازی )، همچنین به عنوان ترجمه نظریه بازی و یا نظریه بازی ،اقتصاد یک شاخه، در سال 1944 فون نویمان و اسکار مورگنسترن همکاری نویسنده "تئوری بازی ها و رفتار اقتصادی" این نشانه شکل گیری اولیه تئوری بازی مدرن سیستم است ، بنابراین او را "پدر نظریه بازی" می نامند. نظریه بازی یکی از بزرگترین دستاوردهای اقتصاد در قرن بیستم به حساب می آید. در حال حاضر در طیف گسترده ای از برنامه های کاربردی در زمینه های زیست شناسی ،اقتصاد ، روابط بین الملل ، علوم رایانه ، علوم سیاسی ، استراتژی نظامی و بسیاری از رشته های دیگر مورد استفاده قرار می گیرد. این به طور عمده مطالعه تعامل بین ساختار تشویقی فرموله شده ( بازی یا بازی ) است. این یک تئوری و روش ریاضی برای مطالعه پدیده مبارزه یا رقابت است.همچنین موضوع مهمی در تحقیقات عملیات است .

 

دایرکتوری

بررسی اجمالی ویرایش ]

تئوری بازی رفتار پیش بینی و رفتار واقعی افراد را در بازی در نظر گرفته و استراتژی های بهینه سازی آنها را مورد مطالعه قرار می دهد. فعل و انفعالات مختلف بر روی سطح ممکن است ساختارهای تشویقی مشابهی از خود نشان دهند ، بنابراین آنها یک مورد خاص از همان بازی هستند. یکی از نمونه های معروف و جالب برنامه های کاربردی معضل زندانی است .

عمل رقابت یا تقابل رفتار رفتار نامیده می شود. در چنین اقداماتی ، طرفهای درگیر در مبارزه یا رقابت هر کدام اهداف یا علایق مختلفی دارند. برای دستیابی به اهداف و علایق خود ، همه طرفین باید برنامه های مختلف اقدام احتمالی طرف مقابل را در نظر بگیرند و سعی کنند بهترین یا مناسب ترین راه حل را برای خود انتخاب کنند. به عنوان مثال بازی شطرنج در زندگی روزمره ، کارت بازی و غیره. نظریه بازی این است که بررسی کند که آیا معقول ترین برنامه های رفتاری در احزاب مبارزه در رفتار بازی وجود دارد و چگونه می توان نظریه و روش ریاضی این طرح رفتاری معقول را یافت.

زیست شناسان از تئوری بازی برای درک و پیش بینی نتایج خاص تکامل استفاده می کنند. به عنوان مثال ، مفهوم "استراتژی پایدار تحول" که توسط جان مینارد اسمیت و جورج آر. پریس در مقاله ای منتشر شده در Nature در سال 1973 ارائه شده است ، استفاده از تئوری بازی است. همچنین بهنظریه بازی های تکاملی و بوم شناسی رفتاری مراجعه کنید.

تئوری بازی همچنین در سایر شاخه های ریاضیات مانند احتمالات ، آمار و برنامه نویسی خطی اعمال می شود .

تعریف ریاضی ویرایش ]

چند تعریف قابل تعویض برای "بازی" وجود دارد. در اینجا مقدمه ای مختصر و توضیحی از رابطه ارائه شده است.

بازی فرم عادی ویرایش ]

بازی پارادایم به یک بازی معمولی ، یک بازی استراتژی یا یک بازی استاندارد ترجمه می شود.

تنظیم\ ریاضی {N}مجموعه ای از "بازیکنان" است. برای هر "شرکت کننده"من \ در \ ریاضی {N}}مجموعه ای از "خط مشی"\ سیگما \ ^ {من}بازی (بازی) است تابع ، تعریف می شود:

\ pi \: \ prod _ {\ i \ in {\ mathrm {N}}}} \ Sigma \ ^ {i} \ to {\ mathbb {R}} ^ {{\ mathrm {N}}}

یعنی اگر بدانیم که استراتژی شرکت کننده چیست ، پس می توانیم یک مقدار واقعی متناسب با آن داشته باشیم. ما می توانیم با شکستن معادلهفوق به دو معادله آن را تعمیم دهیم. معادله یک معادله شرکت کننده از بازی فرم عادی است که چگونگی مشخص شدن استراتژی نتیجه را توضیح می دهد. معادله دیگر ترجیح شرکت کننده را برای مجموعه نتایج توصیف می کند. یعنی:

\ pi \: \ prod _ {{i \ in {\ mathrm {N}}}} \ Sigma \ ^ {i} \ به \ گاما \

اینجا{\ صفحه نمایش \ گاما \\ گاما \ بازی (بازی) از مجموعه نتیجه (مجموعه ای نتیجه). برای هر شرکت کنندهمن \ در \ ریاضی {N}}دارای یک تابع ترجیح ( تابع ترجیح )

\ nu \ ^ {i}: \ گاما \ \ به {\ mathbb {R}.

بازی فرم گسترده ویرایش ]

بازی با فرم توسعه یافته می تواند به شکل گسترده ای از بازی ، یک بازی توسعه یافته یا یک بازی توسعه یافته ترجمه شود.

تعریف یک فرم منظم عبارتی آسان برای استفاده در ریاضیدانان برای بررسی مسئله تعادل فراهم می کند. زیرا از مشکل نحوه محاسبه "استراتژی" ، یعنی نحوه کار بازی جلوگیری می کند.

برای در نظر گرفتن چگونگی عملکرد بازی ، بازی از فرم گسترش یافته بیان راحت تری است. این فرم از نزدیک با تئوری بازی ترکیبی مرتبط است . این تعریف در قالب یک درخت آورده شده است . در هر گره درخت (راس) شرکت کنندگان مختلف لبه ای را انتخاب می کنند.

تاریخچه مختصری از تئوری بازی ویرایش ]

مطالعه تئوری بازی با ارنست زملو (1913) ، امیل بورل (1921) و فون نویمان (1928) آغاز شد ، بعداً توسط فون نویمان و اسکار مورگانشتاین ( 1944 ، 1947) برای اولین بار سیستماتیک و رسمی شد (به مایرسون ، 1991) مراجعه کنید. پس از آن ، جان فوربس نش (1950 ، 1951) برای اثبات وجود تعادل ، از قضیه نقطه ثابت استفاده کرد ، که پایه و اساس محکمی برای عمومی سازی نظریه بازی ها ایجاد کرد.

جان فوربز نش ، جان سی. هایسانی و راینهارد زلتن برای کمک های برجسته خود در تئوری بازی جایزه اقتصاد بانکی سوئد در سال 1994 را دریافتکردند . رابرت جی عمان ، کن بینگمور ، دیوید کرپس و آریل روبینشتاین نیز نقش مهمی در تئوری بازی داشتند.

طبقه بندی بازی ویرایش ]

طبقه‌بندی بازی طبق طبق معیارهای مختلف ، طبقه‌بندی‌های مختلفی نیز دارد. به طور کلی اعتقاد بر این است که بازی ها را می توان به طور عمده به بازی های تعاونی و بازی های غیر تعاونی تقسیم کرد . تفاوت بین آنها در این است که آیا بین طرفین که با یکدیگر تعامل دارند ، یک توافق نامه الزام آور وجود دارد ، اگر وجود داشته باشد ، این یک بازی تعاونی است .اگر نه ، این یک بازی غیر تعاونی است.

از سری زمانی رفتار ، تئوری بازی بیشتر به دو دسته تقسیم می شود: بازی استاتیک به این معنی است که در بازی ، شرکت کنندگان به طور همزمان یا نه همزمان انتخاب می کنند اما بازیگر نمی داند بازیگر چه اقدامات خاصی را انجام داده است ؛ بازی پویا این بدان معناست که در بازی ، عملکرد شرکت کنندگان در نظم است و بازیگران دوم می توانند اعمال انتخاب شده توسط بازیگران اول را مشاهده کنند. درک عمومی: " معضل زندانی " یک تصمیم همزمان است ، که متعلق به بازی استاتیک است ؛ در حالی که تصمیم گیری یا اقدامی مانند بازی های شطرنج دنباله ای دارد ، اما متعلق به بازی پویا است.

با توجه به میزان درک شرکت کنندگان نسبت به سایر شرکت کنندگان ، آنها به یک بازی اطلاعات کامل و یک بازی اطلاعاتی ناقص تقسیم می شوند .بازی کامل به این معنی است که در فرایند بازی ، هر شرکت کننده اطلاعات دقیقی در مورد خصوصیات ، فضای استراتژی و عملکرد درآمد سایر شرکت کنندگان دارد. اگر شرکت کنندگان درمورد خصوصیات ، فضای استراتژی و اطلاعات عملکرد عملکرد سایر شرکت کنندگان صحیح نمی دانند یا اطلاعات دقیقی و دقیقی در مورد خصوصیات ، فضای استراتژی و عملکرد درآمد کلیه شرکت کنندگان ندارند ، بازی در این حالت بازی می شود. این یک بازی اطلاعاتی ناقص است.

در حال حاضر ، نظریه بازی که اکنون اقتصاددانان در مورد آن صحبت می کنند ، عموماً به بازی غیر تعاونی اشاره دارد ، زیرا تئوری بازی تعاونی پیچیده تر از تئوری بازی غیر تعاونی است ، بلوغ نظری به مراتب کمتر از تئوری بازی غیر تعاونی است. بازی غیر تعاونی نیز به موارد زیر تقسیم می شود: یک بازی استاتیک با اطلاعات کامل ، یک بازی پویا با اطلاعات کامل ، یک بازی استاتیک با اطلاعات ناقص و یک بازی پویا با اطلاعات ناقص. و بالاتر از چهار بازی برای مفهوم تعادل مربوطه: تعادل نش ، زیر بازی کامل تعادل نش ، تعادل نش بیزی ، مناسب تعادل بیزی نش (کامل تعادل نش بیزی).

طبقه بندی های زیادی در تئوری بازی وجود دارد به عنوان مثال ، تعداد یا مدت زمان یک بازی را می توان به یک بازی محدود و یک بازی نامتناهی تقسیم کرد ؛ شکل بیان را می توان به یک نوع کلی (نوع استراتژیک) یا یک نوع توسعه یافته و غیره نیز تقسیم کرد.

مفاهیم مرتبط با تئوری بازی ویرایش ]

کتابشناسی ویرایش ]

  1. هارولد WK (ویرایشگر) ، 1997 ، Classics in the نظریه بازی ، پرینستون ، نیویورک: انتشارات دانشگاه پرینستون ISBN 0-691-01193-1
  2. مایرسون ، ر. ، 1991 ، تئوری بازی: تجزیه و تحلیل تعارض . کمبریج و لندن: انتشارات دانشگاه هاروارد.
  3. Osborne ، M. and A. Rubinstein، 1994، Course in Theory Theory ، Cambridge and London: The MIT Press.
  4. اوکادا ، 1996 ، "ゲ ー ム تئوری" توکیو: ISBN 4-641-06794-5 وجود دارد فیجی.
  5. طلا 守 "ゲ ー ム تئوری と 蒟 蒻 پرسش و پاسخ" آژانس بررسی ژاپن ، آوریل 2003. شابک 4-535-55288-6
  6. Chuanxi 谕 "روش تفکر نظریه ゲ ー" "در سپتامبر 2009 در چین منتشر شد. شابک 978-4-8061-3470-1
  7. اکسلرود ، رابرت: تکامل همکاری ، 1985 ، ISBN 0-465-02121-2
  8. اکسلرود ، رابرت: پیچیدگی همکاری - مدلهای رقابت و همکاری مبتنی بر عوامل ، 1997 ، ISBN 0-691-01567-8
  9. Dixit، K. Avinash / Skeath، Susan: Games of Strategy، 1999، ISBN 0-393-97421-9
  10. ایگن ، منفرد / وینکلر ، روتایلد: داس اسپیل ، 1976 ، ISBN 3-492-02151-4
  11. Hargreaves Heap، Shaun P. / Varoufakis، Yanis: Theory Game - متن بحرانی ، 2004 ، ISBN 0-415-25095-1
  12. کلی ، آنتونی: تصمیم گیری با استفاده از تئوری بازی - مقدمه ای برای مدیران ، 2003 ، ISBN 0-521-81462-6
  13. شلی ، ولتر: Einführung in die Spieltheorie، 2004، ISBN 3-528-03214-6
ادامه نوشته

جیمز سرین



پرش به ناوبریپرش به جستجو

جیمز سرین

بدنیا آمدن1 نوامبر 1926

شیکاگو، ایالت ایلینویز

فوت کرد23 آگوست 2012 (85 سالگی)

مینیاپولیس ، مینسوتا

آلما مادهدانشگاه ایندیانا
شناخته شده برایمکانیک پیوسته ، آنالیز غیر خطی ، معادلات دیفرانسیل جزئی
حرفه علمی
زمینه هایریاضیدان
موسساتدانشگاه مینسوتا
مشاور دکترادیوید گیلبرگ

جیمز برتون سرین (1 نوامبر 1926 ، شیکاگو ، ایلینویز - 23 اوت 2012 ، مینیاپولیس ، مینه سوتا ) یک ریاضیدان آمریکایی و استاددانشگاه مینسوتا بود . [1]

 

فهرست

زندگی ویرایش ]

وی دکترای خود را از دانشگاه ایندیانا در سال 1951 تحت نظارت دیوید گیلبرگ دریافت کرد . [2] از سال 1954 تا 1995 در دانشکده دانشگاه مینسوتا بود . [2] [3] [4]

کار ویرایش ]

او به دلیل مشارکت در مکانیک پیوسته ، آنالیز غیرخطی ، [5] و معادلات دیفرانسیل جزئی شناخته شده است . [6] [7] [8]

جوایز و افتخارات ویرایش ]

وی در سال 1980 به عضویت آکادمی ملی علوم انتخاب شد.

آثار منتخب ویرایش ]

ادامه نوشته

چندجمله‌ای‌های متعامد

از ویکی‌پدیا، دانشنامهٔ آزاد

 

چندجمله‌ای‌های متعامد (Orthogonal polynomials) به دنباله‌هایی نامتناهی متشکل از چندجمله‌ای‌های حقیقی عمود بر هم اطلاق می‌شود. در فضاهای برداری گوناگون، شکل گیری مفاهیم هندسی از قبیل طول (نرم)، زاویه، و تعامد از چگونگی تعیین و تعریف ضرب داخلی بردارها در آن جا آغاز می‌شود.

 

محتویات

تاریخچه[ویرایش]

مطالعات مربوط به چندجمله‌ای‌های متعامد از اواخر قرن نوزدهم (م) آغاز گردید.

تعریف[ویرایش]

بازهٔ بستهٔ {\displaystyle [x_{1},x_{2}]} و توابع چندجمله‌ای f و g را بر روی آن در نظر می‌گیریم. ضرب داخلی این دو چندجمله‌ای را می‌شود به صورت زیر در نظر گرفت:

{\displaystyle \langle f,g\rangle =\int _{x_{1}}^{x_{2}}f(x)g(x)\;dx.}

توابع چندجمله‌ای f و g را متعامد می‌نامیم چنانچه {\displaystyle \langle f,g\rangle =0} باشد.

مثال[ویرایش]

چندجمله‌ای‌های لژاندر[ویرایش]

نوشتار اصلی: چندجمله‌ای‌های لژاندر

چندجمله‌ای‌های لژاندر به مفهوم بالا، در بازه [۱٫۱-] و برای تابع وزن ۱ بر یکدیگر عمود هستند.

{\displaystyle P_{0}(x)=1,\,}

{\displaystyle P_{1}(x)=x,\,}

{\displaystyle P_{2}(x)={\frac {3x^{2}-1}{2}},\,}

{\displaystyle P_{3}(x)={\frac {5x^{3}-3x}{2}},\,}

{\displaystyle P_{4}(x)={\frac {35x^{4}-30x^{2}+3}{8}},\,}

{\displaystyle \vdots }

همگی این چندجمله‌ای‌ها دو به دو متعامد هستند، وقتی که از هم متمایز باشند ({\displaystyle m\neq n}).

{\displaystyle \int _{-1}^{1}P_{m}(x)P_{n}(x)\,dx=0.}

ادامه الگوریتم بهینه سازی کلون مورچه

پردازش تصویر ویرایش ]

الگوریتم ACO در پردازش تصویر برای تشخیص لبه تصویر و اتصال لبه استفاده می شود. [73] [74]

  • تشخیص لبه:

گراف در اینجا تصویر دو بعدی است و مورچه ها از یک پیکسل رسوب فرومون عبور می کنند. حرکت مورچه ها از یک پیکسل به دیگری با تغییرات محلی مقدار شدت تصویر انجام می شود. این جنبش باعث می شود که بیشترین تراکم فرومون در لبه ها قرار گیرد.

مراحل مربوط به تشخیص لبه با استفاده از ACO زیر است: [75] [76] [77]

مرحله 1: راه اندازی:
به طور تصادفی محلکی مورچه ها در تصویر I_ {M_ {1} M_ {2}} جایی که K = (M_ {1} * M_ {2}) ^ {\ tfrac {1} {2}}. ماتریکس فرومون\ tau _ {(i، j)}با مقدار تصادفی مقدار دهی اولیه می شوند. چالش اصلی در فرایند آغازین تعیین ماتریس اکتشافی است.

روش های مختلفی برای تعیین ماتریس اکتشافی وجود دارد. برای مثال زیر، ماتریس اکتشافی بر اساس آمار محلی محاسبه شد: آمار محلی در موقعیت پیکسل (i، j).

\ eta _ {(i، j)} = {\ tfrac {1} {Z}} * Vc * I _ {(i، j)}

جایی که من تصویر از اندازه است M_ {1} * M_ {2}
Z = \ sum_ {i = 1: M_ {1}} \ sum_ {j = 1: M_ {2}} Vc (I_ {i، j})، که یک عامل عادی است

{\ displaystyle {\ begin {aligned} Vc (I_ {i، j}) = & f \ left (\ left \ vert I_ {(i-2، j-1)} - I_ {(i + 2، j + 1 )} \ right \ vert + \ left \ vert I_ {(i-2، j + 1)} - I_ {(i + 2، j-1)} \ right \ vert \ right. \\ & + \ left \ I_ {(I-1، J-2)} - I_ {(I + 1، J + 2)} \ Right \ vert + \ left \ vert I_ {(I-1، J-1)} - I_ { (i + 1، j + 1)} \ right \ vert \\ و + \ left \ vert I_ {(i-1، j)} - I_ {(i + 1، j)} \ right \ vert + \ left \ vert I_ {(i-1، j + 1)} - I_ {(i-1، j-1)} \ right \ vert \\ و + \ left. \ left \ vert I_ {(i-1، j + 1)} - I _ {(i-1، j-2)} \ right \ vert + \ left \ vert I_ {(i، j-1)} - I_ {(i، j + 1)} \ right \ vert \ right) \ end {aligned}}}

f (\ cdot) می تواند با استفاده از توابع زیر محاسبه شود:
f (x) = \ lambda x، \ quad {\ text {برای x ≥ 0؛  (1)}}
f (x) = \ lambda x ^ {2}، \ quad {\ text {برای x ≥ 0؛  (2)}}
f (x) = {\ begin {cases} \ sin {{\ frac {\ pi x} {2 \ lambda}}) و {\ text {for 0 ≤ x ≤}} \ lambda {\ text {؛  (3)}} \\ 0، & {\ text {else}} \ end {cases}}
f (x) = {\ begin {cases} \ pi x \ sin {{\ frac {\ pi x} {2 \ lambda}}) و {\ text {برای 0 ≤ x ≤}} \ lambda {\ text {؛  (4)}} \\ 0، & {\ text {else}} \ end {cases}}
پارامتر \ lambda در هر یک از توابع فوق، اشکال مربوط به توابع را تنظیم می کند. 
مرحله 2 روند ساخت و ساز:
جنبش مورچه بر اساس 4-متصل پیکسل یا 8-متصل پیکسل . احتمالاتی که مورچه ها از طریق معادله احتمال داده می شوندP _ {{x، y}}
مرحله 3 و مرحله 5 فرآیند به روز رسانی:
ماتریکس فرومون دوبار به روز می شود. در مرحله 3 دنباله ای از مورچه (با توجه به\ tau _ {(x، y)} ) به روز شده است جایی که در مرحله 5 نرخ تبخیر دنباله به روز شده است که توسط معادله زیر داده شده است.
\ tau _ {new} \ leftarrow (1- \ psi) \ tau _ {old} + \ psi \ tau _ {0}، جایی که \ psi  ضریب فرونشینی فرومون است {0 <\ tau <1

مرحله 7 فرآیند تصمیم گیری:
هنگامی که کمانها یک فاصله ثابت L را برای تکرار N حرکت داده اند، تصمیم بر این است که آیا آن یک لبه یا نه بر اساس A آستانه T در ماتریس فرومون است. آستانه برای مثال زیر بر اساس روش اوسو محاسبه می شود .

لبه تصویر با استفاده از ACO تشخیص داده شده است: 
تصاویر زیر با استفاده از توابع مختلف داده شده توسط معادله (1) تا (4) تولید می شوند. [78]

(الف) تصویر اصلی (ب) تصویر تولید شده با استفاده از معادله (1) (ج) تصویر تولید شده با استفاده از معادله (2) (د) تصویر تولید شده با استفاده از معادله (3) (الف) تصویر تولید شده با استفاده از معادله (4)

  • پیوند لبه: [79] ACO نیز در الگوریتم های اتصال لبه نیز اثبات شده است.

برنامه های کاربردی دیگر ویرایش ]

دشواری تعریف ویرایش ]

aco shortpath.svg

با یک الگوریتم ACO، کوتاه ترین مسیر در یک گراف، بین دو نقطه A و B، از ترکیبی از چندین مسیر ساخته شده است. [101] تعریف دقیق از الگوریتمی که به صورت مستعمره یا مورچه نیست، آسان نیست، زیرا تعریف ممکن است بر اساس نویسندگان و کاربردها متفاوت باشد. به طور کلی، الگوریتم های کلونی مورچه به عنوان متهوریستی جمعیت شناخته می شوند و هر راه حل ارائه شده توسط یک مورچه در فضای جستجو است. [102] مورچه ها بهترین راه حل ها را نشان می دهند و از مارک های قبلی برای بهینه سازی جستجوی خود استفاده می کنند. آنها را می توان به عنوان الگوریتم های احتمال چند عامل با استفاده از توزیع احتمالی به منظور انتقال بین هر تکرار مشاهده کرد . [103] در نسخه های خود برای مشکلات ترکیبی، از ساختار تکراری راه حل استفاده می کنند. [104]بر طبق برخی از نویسندگان، چیزی که الگوریتم های ACO را از دیگر بستگان (مانند الگوریتم برای برآورد توزیع یا بهینه سازی ذرات چرخشی) متمایز می کند دقیقا جنبه سازنده آنها است. در مشکلات ترکیبی، ممکن است که بهترین راه حل در نهایت پیدا شود، حتی اگر هیچ مورچه اثبات مؤثر نباشد. بنابراین، در مثال مشکل فروشنده مسافر، ضروری نیست که یک مورچه در واقع کوتاهترین مسیر را طی کند: کوتاهترین مسیر را می توان از قوی ترین بخش های بهترین راه حل ها ساخت. با این حال، این تعریف می تواند در مورد مشکلات در متغیرهای واقعی مشکل ساز باشد، جایی که هیچ ساختار "همسایگان" وجود ندارد. رفتار جمعی حشرات اجتماعیهمچنان یک منبع الهام بخش برای محققان است. طیف گسترده ای از الگوریتم ها (برای بهینه سازی یا نه) به دنبال خودسازگاری در سیستم های بیولوژیکی منجر به مفهوم " هوش تازه " شده است، [9] که یک چارچوب بسیار کلی است که در آن الگوریتم های کلونی مورچه مناسب هستند.

الگوریتم های Stigmergy ویرایش ]

در عمل تعداد زیادی الگوریتم وجود دارد که ادعا می کنند "مستعمرات مورچه" هستند، و همیشه همیشه به اشتراک گذاری چارچوب کلی بهینه سازی توسط مستعمرات مورچه ای (COA) تقسیم می شوند. [105] در عمل، استفاده از تبادل اطلاعات بین مورچه ها از طریق محیط زیست (یک اصل به نام " نابسامانی ") به اندازه کافی برای الگوریتم متعلق به کلاس الگوریتم های کلونی مورچه مطرح می شود. این اصل برخی از نویسندگان را به ایجاد اصطلاح "ارزش" برای سازماندهی روش ها و رفتار مبتنی بر جستجوی غذا، مرتب سازی لارو، تقسیم کار و حمل و نقل تعاونی منجر شده است. [106]

روش های مرتبط ویرایش ]

  • الگوریتم های ژنتیکی (GA) یک مجموعه ای از راه حل ها را جایگزین می کنند. فرآیند یافتن راه حل های برتر، تکامل را نشان می دهد، با راه حل هایی ترکیب شده یا جهش می کند تا مجموعه ای از راه حل ها را تغییر دهد، با راه حل هایی که کیفیت پایین تر آنها را از بین می برد.
  • برآورد الگوریتم توزیع (EDA) یک است الگوریتم تکاملی است که جایگزین اپراتورهای تولید مثل سنتی توسط اپراتورهای مدل هدایت می شود. چنین مدل هایی از طریق استفاده از تکنیک های یادگیری ماشین آموخته شده و از مدل های گرافیکی احتمالی ارائه شده است که از آن می توان نمونه های جدید 107 [108] یا از طریق متقاطع هدایت شده تولید کرد. [109] [110]
  • آنالیز شبیه سازی شده (SA) یک روش بهینه سازی جهانی مرتبط است که فضای جستجو را با تولید راه حل های همسایه از راه حل فعلی بر میدارد. همسایه برتر همواره پذیرفته شده است. یک همسایه پایین تر به صورت احتمالی بر اساس تفاوت کیفیت و یک پارامتر دما پذیرفته می شود. پارامتر دما به عنوان الگوریتم پیشرفت می کند تا ماهیت جستجو را تغییر دهد.
  • بهینه سازی جستجوی واکنشی در ترکیب یادگیری ماشین با بهینه سازی، با اضافه کردن یک حلقه بازخورد داخلی به خود تنظیم پارامترهای آزاد الگوریتم به ویژگی های مشکل، نمونه و وضعیت محلی در اطراف راه حل فعلی متمرکز است.
  • جستجوی تابو (TS) شبیه سازی آنیلینگ است که در آن هر دو از راه حل فضایی عبور می کنند با آزمایش جهش های یک راه حل فردی. در حالی که انلینگ شبیه سازی تنها یک راه حل جهش یافته را تولید می کند، جستجوی tabu بسیاری از راه حل های جهش یافته را تولید می کند و به راه حل با پایین ترین تناسب تولید تولید می شود. برای جلوگیری از دوچرخه سواری و تشویق بیشتر حرکت از طریق فضای راه حل، لیست تابو از راه حل های جزئی یا کامل حفظ شده است. جابجایی به یک راه حل که حاوی عناصر لیست tabu است و به عنوان راه حل در فضای راه حل به روز می شود، ممنوع است.
  • الگوریتم های سیستم ایمنی مصنوعی (AIS) بر روی سیستم ایمنی بدن مهره دار مدل سازی می شوند.
  • بهینه سازی ازدحام ذرات (PSO)، یک هوش گروهی روش
  • قطره آب هوشمند (IWD)، یک الگوریتم بهینه سازی مبتنی بر رویارویی بر اساس قطرات آب طبیعی در رودخانه ها
  • الگوریتم جستجوی گرانشی (GSA)، یک هوش گروهی روش
  • روش خوشه بندي مورچه (ACCM)، روشي است که از روش خوشه بندي استفاده مي کند، گسترش ACO.
  • جستجوی توزیع تصادفی (SDS)، روش جستجو و بهینه سازی جهانی احتمال احتمالی مبتنی بر عامل، بهترین مناسب برای مشکلات که در آن تابع هدف را می توان به چندین توابع مستقل جزئی تقسیم کرد

تاریخچه ویرایش ]

مخترعان عبارتند از فرانس مایسون و برنارد مندریک . پیشگامان این زمینه عبارتند از: مارکو دوریگو ، لوکا ماریا گامباردلا . [111]

زمان سنجی الگوریتم های COA

الگوریتم بهینه سازی مورچه ها

  • 1959، پیر پل گراس اختراع نظریه نشانهورزی به توضیح رفتار ساختمان لانه در موریانه ؛ [112]
  • 1983، Deneubourg و همکارانش مورد مطالعه رفتار جمعی از مورچه ها ؛ [113]
  • 1988، و Moyson Mandeick یک مقاله در مورد خود سازمان دهی در میان مورچه ها؛ [114]
  • 1989، کار Goss، Aron، Deneubourg و Pasteels در رفتار جمعی مورچه های آرژانتین ، که ایده الگوریتم های بهینه سازی colony را ارائه می دهد؛ [115]
  • 1989، پیاده سازی یک مدل رفتار برای غذا توسط ایبلیگ و همکارانش؛ [116]
  • 1991، M. Dorigo پیشنهاد سیستم مورچه در پایان نامه دکترای خود (که در سال 1992 منتشر شد [6] ). یک گزارش تکنیکی که از پایان نامه استخراج شده و با همکاری نویسنده V. Maniezzo و A. Colorni [117] پنج سال بعد منتشر شد؛ [31]
  • اپلبی و استیوارد از شرکت مخابرات بریتانیا اولین کاربرد خود را در شبکه های مخابراتی منتشر کردند [118]
  • 1996، انتشار مقاله در سیستم مورچه؛ [31]
  • 1996 Hoos و Stützle اختراع سیستم حداکثر مین را نشان می دهند ؛ [24]
  • 1997 Dorigo و Gambardella سیستم مستعمرات مورچه را منتشر می کنند ؛ [25]
  • 1997 Schoonderwoerd و همکارانش یک برنامه بهبود یافته برای شبکه های مخابراتی را منتشر کردند؛ [119]
  • 1998، Dorigo اولین کنفرانس اختصاص داده شده به الگوریتم های ACO را راه اندازی کرد؛ [120]
  • 1998، Stützle پیشنهاد اجرای اولیه موازی ؛ [121]
  • 1999، Bonabau، Dorigo و Theraulaz کتابی را به طور عمده با مورچه های مصنوعی منتشر می کنند [122]
  • 2000، شماره خاصی از مجله سیستم های کامپیوتری نسل آینده در الگوریتم های مورچه [123]
  • 2000، برنامه های اولیه برای برنامه ریزی ، توالی برنامه ریزی و رضایت از محدودیت ها ؛
  • 2000، گوتهار اولین شواهد همگرایی برای الگوریتم مستعمرات مورچه را فراهم می کند [124]
  • 2001، اولین استفاده از الگوریتم های COA توسط شرکت ها ( Eurobios و AntOptima )؛
  • 2001، Iredi و همکارانش اولین الگوریتم چند هدفه را منتشر کردند [125]
  • 2002، اولین برنامه های کاربردی در طراحی برنامه، شبکه های بیزی؛
  • 2002، Bianchi و همکارانش اولین الگوریتم برای مشکل تصادفی را پیشنهاد کردند . [126]
  • 2004، Dorigo و Stützle کتاب "بهینه سازی قلم مویی" را با MIT Press [127] منتشر می کنند.
  • 2004، Zlochin و Dorigo نشان می دهد که برخی از الگوریتم ها معادل با تبادلات تصادفی تصادفی ، روش متقابل آنتروپی و الگوریتم برای تخمین توزیع [29]
  • 2005، برنامه های کاربردی برای مشکلات تاخیری پروتئینی .
  • 2012، Prabhakar و همکارانش تحقیقاتی راجع به عملیات مورچه ها در ارتباط با یک فروند بدون فرومون انجام دادند و به اصول سازمان شبکه کامپیوتری پاسخ دادند. مدل ارتباطی با پروتکل کنترل حمل و نقل مقایسه شده است . [128]
  • 2016، اولین برنامه کاربردی برای طراحی توالی پپتید. [93]
  • 2017، ادغام موفق چند روش تصمیم گیری PROMETHEE به الگوریتم ACO ( الگوریتم HUMANT ). [129]

بهینه سازی با قیود نامساوی

تصویر مرتبط

 

مثال :روش تندترین کاهش 1

تمرین :روش تندترین کاهش2

تمرین :روش تندترین کاهش

تمرین :روش تندترین کاهش

تمرین بهینه

ارزیابی متغیرها با MILP