توزیع های غیر مد ویرایش ]

در مورد توزیع های غیر مد ، می توان به فاصله تیزتر از حد متوسط ​​و میانگین پیوست:

{\ displaystyle \ left | {\ tilde {X}} - {\ bar {X}} \ right | \ leq \ left ({\ frac {3} {5}} \ right) ^ {1/2} \ sigma \ تقریباً 0.7746 \ سیگما}[18]

یک رابطه مشابه بین میانه و حالت برقرار است:

{\ displaystyle | {\ tilde {X}} - \ mathrm {mode} | \ leq 3 ^ {1/2} \ sigma \ تقریبی 1.732 \ sigma.}

نابرابری جنسن برای مدیانها ویرایش ]

نابرابری جنسن بیان می کند که برای هر متغیر تصادفی X با انتظار محدود E [ X ] و برای هر تابع محدب f

{\ displaystyle f [E (x)] \ leq E [f (x)]}

این نابرابری به میانه نیز تعمیم می یابد. ما می گوییم یک تابع f: ℝ → ℝ یک تابع C است اگر برای هر t ،

{\ displaystyle f ^ {- 1} \ left (\، (- - infty، t] \، \ right) = \ {x \ in \ mathbb {R} \ mid f (x) \ leq t \}}

یک فاصله بسته است (اجازه می دهد موارد منحط یک نقطه یا یک مجموعه خالی ). هر تابع C محدب است ، اما عکس آن ثابت نیست. اگر f یک تابع C است ، پس

{\ displaystyle f (\ operatorname {Median} [X]) \ leq \ operatorname {Median} [f (X)]}

اگر میانه ها منحصر به فرد نباشند ، این عبارت برای سوپرما مربوطه صدق می کند. [19]

پزشکیان نمونه ویرایش ]

در این بخش نظریه برآورد میانگین جمعیت از یک نمونه مورد بحث قرار می گیرد. برای محاسبه میانه یک نمونه "با دست" ، به بخش مجموعه متناهی اعداد بالا مراجعه کنید.

میانگین نمونه ویرایش ]

محاسبه کارآمد میانه نمونه ویرایش ]

حتی اگر مرتب سازی و مقایسه n مورد به عملیات Ω ( n log n ) نیاز داشته باشد ، الگوریتم های انتخاب می توانند کوچکترین k از n مورد را فقط با عملیات Θ ( n ) محاسبه کنند. این شامل میانه است که می باشدn/2آمار مرتبه هفتم (یا برای تعداد زوجی از نمونه ها ، میانگین حسابی دو آمار مرتبه میانی). [20]

الگوریتم های انتخاب هنوز منفی نیاز به حافظه Ω ( n ) را دارند ، به این معنی که آنها باید نمونه کامل (یا بخشی از آن را به اندازه خطی) در حافظه داشته باشند. از آنجا که این ، و همچنین نیاز به زمان خطی ، می تواند منع کننده باشد ، چندین روش تخمین برای متوسط ​​ساخته شده است. یک ساده ، میانه سه قاعده است که میانه را به عنوان میانه یک مثال فرعی سه عنصر تخمین می زند. این معمولاً به عنوان زیرروال در الگوریتم مرتب سازی quicksort استفاده می شود ، که از برآورد میانه ورودی خود استفاده می کند. محاسبه کننده قوی تر ، Tukey 's ninther است که میانگین سه قاعده اعمال شده با بازگشت محدود است: [21] اگر Aنمونه ای است که به صورت آرایه تنظیم شده است ، و

med3 ( A ) = متوسط ​​( A [1] ، A [n/2] ، A [ n ]) ،

سپس

ninther ( A ) = med3 (med3 ( A [1 ...1/3n ]) ، med3 ( A [1/3n ...2/3n ]) ، med3 ( A [2/3n ... n ]))

remedian یک برآوردگر برای میانه است که نیاز به زمان خطی اما حافظه زیر خطی، عامل در یک پاس تک بیش از نمونه است. [22]

توزیع نمونه ویرایش ]

توزیع هر دو میانگین و میانگین نمونه توسط لاپلاس تعیین شد . [23] توزیع میانگین نمونه از جمعیتی با عملکرد تراکمf (x) از نظر مجانبی با میانگین طبیعی است

مترو واریانس [24]

{\ frac {1} {4nf (m) ^ {2}}}

جایی کهمتر متوسط ​​است f (x) وnاندازه نمونه است یک مدرک مدرن در زیر آمده است. نتیجه لاپلاس اکنون به عنوان یک مورد خاص از توزیع مجانبی کوانتولهای دلخواه درک می شود .

برای نمونه های معمولی ، چگالی برابر است{\ displaystyle f (m) = 1 / {\ sqrt {2 \ pi \ sigma ^ {2}}}}، بنابراین برای نمونه های بزرگ واریانس میانه برابر است

{\ displaystyle ({\ pi} / {2}) \ cdot (\ sigma ^ {2} / n).}[7] (به بخش # کارایی در زیرنیز مراجعهکنید.)

استخراج توزیع مجانبی ویرایش ]

ما اندازه نمونه را عدد فرد در نظر می گیریم {\ displaystyle N = 2n + 1}و متغیر خود را مداوم فرض کنیم. فرمول مورد متغیرهای گسسته در زیر در § چگالی محلی تجربی آورده شده است . نمونه را می توان به صورت "زیر متوسط" ، "در متوسط" و "بالاتر از حد متوسط" خلاصه کرد ، که مربوط به توزیع مثلثی با احتمالات است

{\ displaystyle F (v-1)}{\ displaystyle f (v)} و {\ displaystyle 1-F (v)}. برای یک متغیر پیوسته ، احتمال اینکه مقادیر چند نمونه دقیقاً برابر با میانه باشد ، 0 است ، بنابراین می توان چگالی نقطه را محاسبه کردv مستقیماً از توزیع مثلث:

{\ displaystyle \ Pr [\ operatorname {Median} = v] \، dv = {\ frac {(2n + 1)!} {n! n!}} F (v) ^ {n} (1-F (v )) ^ {n} f (v) \، dv}.

اکنون تابع بتا را معرفی می کنیم. برای استدلال های عدد صحیحآلفا  و \ بتا ، این را می توان به صورت زیر بیان کرد{\ displaystyle \ mathrm {B} (\ alpha، \ beta) = {\ frac {(\ alpha-1)! (\ beta -1)!} {(\ alpha + \ beta -1)!}}}. همچنین ، به یاد داشته باشید که{\ displaystyle f (v) \، dv = dF (v)}. استفاده از این روابط و تنظیم هر دوآلفا  و \ بتا  مساوی با n + 1 اجازه می دهد تا آخرین عبارت به صورت

{\ displaystyle {\ frac {F (v) ^ {n} (1-F (v)) ^ {n}} {\ mathrm {B} (n + 1، n + 1)}} \، dF (v )}

از این رو تابع چگالی میانه یک توزیع بتا متقارن است که به جلو رانده می شودF. همانطور که انتظار داریم میانگین آن 0.5 و واریانس آن باشد{\ displaystyle 1 / (4 (N + 2))}. طبق قاعده زنجیره ای ، واریانس مربوطه از میانه نمونه است{\ displaystyle {\ frac {1} {4 (N + 2) f (m) ^ {2}}}}.

2 مورد اضافی در حد ناچیز است .

تراکم محلی تجربی ویرایش ]

در عمل ، توابع f و Fاغلب شناخته شده یا فرض نیستند. با این حال ، آنها را می توان از یک توزیع فراوانی مشاهده شده تخمین زد. در این بخش ، مثالی می زنیم. جدول زیر را در نظر بگیرید ، نمونه ای از 3800 مشاهده (با ارزش گسسته) را نشان می دهد:

v00.511.522.533.544.55
f (v)0.0000.0080.0100.0130.0830.1080.3280.2200.2020.0230.005
F (v)0.0000.0080.0180.0310.1140.2220.5500.7700.9720.9951.000

از آنجا که مشاهدات دارای ارزش گسسته هستند ، ساخت توزیع دقیق میانه ترجمه فوری عبارت فوق برای {\ displaystyle \ Pr (\ operatorname {Median} = v)}؛ ممکن است (و به طور معمول وجود داشته باشد) چندین نمونه از میانگین در نمونه خود داشته باشد. بنابراین ما باید تمام این احتمالات را جمع بندی کنیم:

{\ displaystyle \ Pr (\ operatorname {Median} = v) = \ sum _ {i = 0} ^ {n} \ sum _ {k = 0} ^ {n} {\ frac {N!} {i! ( نیک)! k!}} F (v-1) ^ {i} (1-F (v)) ^ {k} f (v) ^ {Nik}}

در اینجا ، من تعداد نقاط کاملاً کمتر از میانگین و k تعداد دقیقاً بیشتر است.

با استفاده از این مقدمات ، می توان تأثیر اندازه نمونه را روی خطاهای استاندارد میانگین و متوسط ​​بررسی کرد. میانگین مشاهده شده 3.16 ، متوسط ​​خام مشاهده شده 3 و متوسط ​​درونی شده مشاهده شده 3.174 است. جدول زیر برخی از آمار مقایسه را نشان می دهد.

اندازهی نمونه

آمار

391521
مقدار مورد انتظار میانه3.1983.1913.1743.161
خطای استاندارد میانه (فرمول بالا)0.4820.3050.2570.239
خطای استاندارد میانه (تقریب مجانبی)0.8790.5080.3930.332
خطای استاندارد میانگین0.4210.2430.1880.159

مقدار مورد انتظار میانه با افزایش اندازه نمونه اندکی کاهش می یابد در حالی که همانطور که انتظار می رود خطاهای استاندارد هر دو میانگین و میانگین متناسب با ریشه مربع معکوس اندازه نمونه است. تقریب مجانبی با بیش از حد ارزیابی کردن خطای استاندارد باعث احتیاط می شود.

منبع

https://en.wikipedia.org/wiki/Median#Efficiency