مدل رگرسیون سانسور شده
مدل های رگرسیون سانسور شده دسته ای از مدل ها هستند که در آنها متغیر وابسته در بالای یا زیر آستانه خاصی سانسور می شود. عموما به استفاده مبتنی بر احتمال مدل به جای به یک نمونه سانسور است مدل توبیت ، [1] اما چندک و برآوردگرهای ناپارامتری نیز توسعه داده شده است. [2] [3] این مدلها و سایر مدلهای رگرسیون سانسور شده اغلب با مدلهای رگرسیون کوتاه شده اشتباه گرفته می شوند. مدل های رگرسیون کوتاه شده برای داده هایی مورد استفاده قرار می گیرند که مشاهدات کامل از بین رفته است به طوری که مقادیر مربوط به متغیرهای وابسته و مستقل ناشناخته هستند. مدل های رگرسیون سانسور شده برای داده هایی مورد استفاده قرار می گیرند که فقط مقدار متغیر وابسته ناشناخته است در حالی که مقادیر متغیرهای مستقل هنوز در دسترس هستند.
متغیرهای وابسته سانسور شده اغلب در اقتصاد سنجی بوجود می آیند . یک نمونه متداول عرضه نیروی کار است . داده ها اغلب در مورد ساعات کار شده توسط کارمندان در دسترس است ، و یک مدل عرضه نیروی کار رابطه بین ساعات کار و ویژگی های کارکنان مانند سن ، تحصیلات و وضعیت خانواده را تخمین می زند. با این حال ، چنین برآوردی که با استفاده از رگرسیون خطی انجام شده باشد ، این واقعیت را خواهد داشت که برای افرادی که بیکار هستند ، مشاهده تعداد ساعاتی که می توانستند کار کنند در صورت داشتن استخدام ، مغرضانه خواهد بود. هنوز سن ، تحصیلات و وضعیت خانواده را برای این مشاهدات می دانیم.
همچنین به [ ویرایش ] مراجعه کنید
منبع
https://en.wikipedia.org/wiki/Censored_regression_model