برآوردگر نسبت است پارامتر آماری و تعریف شده است به نسبت از ابزار از دو متغیر تصادفی. تخمین نسبت مغرضانه است و هنگام استفاده از آنها در کارهای آزمایشی یا پیمایشی باید اصلاحاتی انجام شود. برآورد نسبت تست های نامتقارن و متقارن است مانند تست t نباید برای تولید فواصل اطمینان استفاده شود.

تعصب به ترتیب O (1 / n ) است (به نماد بزرگ O مراجعه کنید ) بنابراین با افزایش اندازه نمونه ( n ) ، تعصب به صورت غیرمتعارف به 0 نزدیک می شود.

 

فهرست

تعریف ویرایش ]

فرض کنید دو ویژگی وجود دارد - x و y - که می تواند برای هر عنصر نمونه برداری در مجموعه داده ها مشاهده شود. نسبت R است

\ displaystyle R = {\ bar {\ mu}} _ {y} / {\ bar {\ mu}} _ {x}

برآورد نسبت مقدار متغیر y ( θ y ) است

\ displaystyle \ theta _ {y} = R \ theta _ {x}

که θ x مقدار متناظر متغیر x است . θ y شناخته شده است که به صورت علامتی توزیع می شود. [1]

خصوصیات آماری ویرایش ]

همچنین مشاهده کنید: توزیع نسبت

نسبت نمونه ( r ) از نمونه برآورد می شود

r = {\ frac {{\ bar {y}}} {bar \ bar {x}}}} = {\ frac {\ sum _ {{i = 1}} ^ {n} y} {\ sum _ {i = 1}} ^ {n} x}}

این نسبت مغایر است با نابرابری جنسن به شرح زیر نشان داده می شود (با فرض استقلال بین x و y):

{\ displaystyle E \ left ({\ frac {y} {x}} \ Right) = E \ left (y {\ frac {1} {x}} \ Right) = E (y) E \ left ({\ frac {1} {x}} \ درست) \ geq E (y) \ frac {1} {E (x)} = {\ frac {E (y) {E (x)}}}

تحت نمونه گیری تصادفی ساده ، تعصب از ترتیب O است ( -1 ). یک ضلع بالاتر بر روی تعصب نسبی برآورد با ضریب تغییر (نسبت انحراف استاندارد به میانگین ) ارائه می شود. [2] در نمونه گیری تصادفی ساده ، تعصب نسبی O است ( n-1 /2 ).

تصحیح سوگیری میانگین ویرایش )

روشهای تصحیح ، بسته به توزیع متغیرهای x و y ، در کارآیی آنها متفاوت است و پیشنهاد بهترین روش کلی را دشوار می کند. از آنجا که تخمین های r مغرضانه هستند ، یک نسخه اصلاح شده باید در تمام محاسبات بعدی استفاده شود.

اصلاح سوگیری دقیق به مرتبه اول [ نیاز به استناد ]

r _ {{\ mathrm {corr}}} = r - {\ frac {s _ {{[y / x] x}}} {m_ {x}}}

جایی که x میانگین متغیر x و ab است ، کواریانس بین a و b است .

برای ساده سازی نماد از ab بعداً استفاده می شود تا متغیرهای متغیرهای a و b را نشان دهند .

برآوردگر دیگر که مبتنی بر گسترش تیلور است ، است

r _ {{\ mathrm {corr}}} = r + {\ frac {1} {n}} (1 - {\ frac {n-1} {N-1}}) {\ frac {rs_ {x} ^ { 2} - \ rho s_ {x} s_ {y}} {m_ {x} ^ {2}}}

در جایی که n اندازه نمونه است ، N اندازه جمعیت است ، x میانگین متغیرهای x ، x 2 و y 2 به ترتیب واریانس های متغیرهای x و y به ترتیب و ρ همبستگی نمونه بین x است. و y متغیر است.

یک نسخه محاسباتی ساده اما کمی دقیق تر از این برآوردگر است

r _ {{\ mathrm {corr}}} = r - {\ frac {Nn} {N}} {\ frac {(rs_ {x} ^ {2} - \ rho s_ {x} s_ {y})} { nm_ {x} ^ {2}}}

در جایی که N اندازه جمعیت است ، n اندازه نمونه است ، x میانگین متغیر x است ، x 2 و y 2 به ترتیب واریانس های متغیرهای x و y و ρ همبستگی نمونه بین x است. و y متغیر است. این نسخه ها فقط در فاکتور مخرج تفاوت دارند ( N - 1). برای N بزرگ ، تفاوت ناچیز است.

اصلاح مرتبه دوم [3]

r _ {{\ mathrm {corr}}} = r \ left [1 + {\ frac {1} {n}} \ چپ ({\ frac {1} {m_ {x}}} - {\ frac {s_ xy}}} _ m_ {x} m_ {y}} right \ Right) + {\ frac {1} {n ^ {2}}} \ سمت چپ ({\ frac {2} {m_ {x} ^ { 2}}} - {\ frac {s _ {{xy}}} {m_ {x} m_ {y}} left \ left [2 + {\ frac {3} {m_ {x}}} \ Right] + \ frac {s _ {{x ^ {2} y}}} {m_ {x} ^ {2} m_ {y}}} \ Right) \ Right]

روش های دیگر اصلاح تعصب نیز ارائه شده است. برای ساده سازی نماد از متغیرهای زیر استفاده می شود

\ theta = {\ frac {1} {n}} - {\ frac {1} {N}

c_ {x} ^ {2} = {\ frac {s_ {x} ^ {2}} {m_{ x} ^ {2}}

c _ {y xy}} = {\ frac {s _ {{xy}}} {m_ {x} m_ {y}}}

برآوردگر پاسکال: [4]

r _ {{\ mathrm {corr}}} = r + {\ frac {N-1} {N}} {\ frac {m_ {y} -rm_ x}} {n-1}}

برآوردگر بیل: [5]

r _ {{\ mathrm {corr}}} = r {\ frac {1+ \ theta c _ {{xy}}} {1+ \ theta c_ {x} ^ {2}}}

برآوردگر قلع: [6]

r _ {{\ mathrm {corr}}} = r \ left (1+ \ theta \ left (c _ {{xy}} - c_ {x} ^ {2} \ Right) \ Right)

برآوردگر ساهو: [7]

r _ {{\ mathrm {corr}}} = {\ frac {r} {1+ \ theta (c_ {x} ^ {2} -c _ {y xy}})}}

Sahoo همچنین تعدادی تخمین دهنده اضافی را پیشنهاد کرده است: [8]

r _ {{\ mathrm {corr}}} = r (1+ \ theta c _ {{xy}}) (1- 1- theta c_ {x} ^ {2})

r _ {{\ mathrm {corr}}} = {\ frac {r (1- \ theta c_ {x} ^ {2})} {1- \ theta c _ {{xy}}}}

r _ {{\ mathrm {corr}}} = {\ frac {r} {(1+ \ theta c _ {{xy}}) (1+ \ theta c_ {x} ^ {2})}}

اگر متر X و متر Y هر دو بیشتر از 10، پس از آن تقریب زیر درست است به سفارش O ( -3 ). [3]

r _ {{\ mathrm {corr}}} = r \ left [1 - {\ frac {2} {n ^ {2} m_ {x}}} \ سمت چپ ({\ frac {1} {m_ {x} left - {\ frac {s _ {{xy}}} {m_ {x} m_ {y}}} \ Right) \ چپ (1 + {\ frac {13} {2n}} + {\ frac {8} nm_ {x}}} \ درست) \ درست]

یک برآوردگر بدون علامت درست است [9]

r _ {{\ mathrm {corr}}} = r + c_ {x} ^ {2} {\ frac {m_ {y}} _ m_ {x}}} - {\ frac {s _ {y xy}}} { m_ {x} ^ {2}}}

منبع

https://en.wikipedia.org/wiki/Ratio_estimator