برآوردگر نسبت
برآوردگر نسبت است پارامتر آماری و تعریف شده است به نسبت از ابزار از دو متغیر تصادفی. تخمین نسبت مغرضانه است و هنگام استفاده از آنها در کارهای آزمایشی یا پیمایشی باید اصلاحاتی انجام شود. برآورد نسبت تست های نامتقارن و متقارن است مانند تست t نباید برای تولید فواصل اطمینان استفاده شود.
تعصب به ترتیب O (1 / n ) است (به نماد بزرگ O مراجعه کنید ) بنابراین با افزایش اندازه نمونه ( n ) ، تعصب به صورت غیرمتعارف به 0 نزدیک می شود.
فهرست
- 1تعریف
- 2خصوصیات آماری
- 3تخمین Jackknife
- 4برآورد از کل
- 5تخمین واریانس
- 6چولگی
- 7روشهای جایگزین کاهش تعصب
- 8رگرسیون حداقل مربعات معمولی
- 9استفاده می کند
- 10تاریخ
- 11همچنین ببینید
- 12منابع
تعریف [ ویرایش ]
فرض کنید دو ویژگی وجود دارد - x و y - که می تواند برای هر عنصر نمونه برداری در مجموعه داده ها مشاهده شود. نسبت R است
برآورد نسبت مقدار متغیر y ( θ y ) است
که θ x مقدار متناظر متغیر x است . θ y شناخته شده است که به صورت علامتی توزیع می شود. [1]
خصوصیات آماری [ ویرایش ]
همچنین مشاهده کنید: توزیع نسبت
نسبت نمونه ( r ) از نمونه برآورد می شود
این نسبت مغایر است با نابرابری جنسن به شرح زیر نشان داده می شود (با فرض استقلال بین x و y):
تحت نمونه گیری تصادفی ساده ، تعصب از ترتیب O است ( n -1 ). یک ضلع بالاتر بر روی تعصب نسبی برآورد با ضریب تغییر (نسبت انحراف استاندارد به میانگین ) ارائه می شود. [2] در نمونه گیری تصادفی ساده ، تعصب نسبی O است ( n-1 /2 ).
تصحیح سوگیری میانگین ( ویرایش )
روشهای تصحیح ، بسته به توزیع متغیرهای x و y ، در کارآیی آنها متفاوت است و پیشنهاد بهترین روش کلی را دشوار می کند. از آنجا که تخمین های r مغرضانه هستند ، یک نسخه اصلاح شده باید در تمام محاسبات بعدی استفاده شود.
اصلاح سوگیری دقیق به مرتبه اول [ نیاز به استناد ]
جایی که m x میانگین متغیر x و s ab است ، کواریانس بین a و b است .
برای ساده سازی نماد از ab بعداً استفاده می شود تا متغیرهای متغیرهای a و b را نشان دهند .
برآوردگر دیگر که مبتنی بر گسترش تیلور است ، است
در جایی که n اندازه نمونه است ، N اندازه جمعیت است ، m x میانگین متغیرهای x ، s x 2 و s y 2 به ترتیب واریانس های متغیرهای x و y به ترتیب و ρ همبستگی نمونه بین x است. و y متغیر است.
یک نسخه محاسباتی ساده اما کمی دقیق تر از این برآوردگر است
در جایی که N اندازه جمعیت است ، n اندازه نمونه است ، m x میانگین متغیر x است ، s x 2 و s y 2 به ترتیب واریانس های متغیرهای x و y و ρ همبستگی نمونه بین x است. و y متغیر است. این نسخه ها فقط در فاکتور مخرج تفاوت دارند ( N - 1). برای N بزرگ ، تفاوت ناچیز است.
اصلاح مرتبه دوم [3]
روش های دیگر اصلاح تعصب نیز ارائه شده است. برای ساده سازی نماد از متغیرهای زیر استفاده می شود
برآوردگر پاسکال: [4]
برآوردگر بیل: [5]
برآوردگر قلع: [6]
برآوردگر ساهو: [7]
Sahoo همچنین تعدادی تخمین دهنده اضافی را پیشنهاد کرده است: [8]
اگر متر X و متر Y هر دو بیشتر از 10، پس از آن تقریب زیر درست است به سفارش O ( N -3 ). [3]
یک برآوردگر بدون علامت درست است [9]
منبع