فرضیات مورد نیاز [ ویرایش ]
طراحی ناپیوستگی رگرسیون مستلزم این است که تمام متغیرهای بالقوه مربوطه علاوه بر متغیر درمان و متغیر نتیجه در نقطه ای که درمان و نتیجه ناپیوستگی رخ می دهد ، مداوم باشند. یک شرط کافی ، اگرچه ضروری نیست [10] این است که اگر انتصاب برای درمان "به اندازه تصادفی خوب باشد". [9] اگر چنین باشد ، تضمین می کند کسانی که به سختی تحت درمان قرار گرفته اند با کسانی که به سختی درمان نکرده اند قابل مقایسه هستند ، زیرا وضعیت درمان به طور تصادفی است.
اگر تصادفی در متغیر انتساب وجود داشته باشد و عوامل در نظر گرفته شده (افراد ، شرکت ها و غیره) نتوانند وضعیت درمانی آنها را کاملاً دستکاری کنند ، تعیین تکلیف در آستانه می تواند "به خوبی تصادفی" باشد. به عنوان مثال ، اگر درمان در حال گذراندن یک امتحان است ، جایی که نمره 50٪ مورد نیاز است ، بنابراین این مثال یک طرح ناپیوسته رگرسیون معتبر است تا زمانی که نمرات تا حدودی تصادفی باشند ، یا به دلیل تصادفی درجه بندی یا به دلیل تصادفی بودن عملکرد دانش آموز.
دانش آموزان همچنین نمی توانند نمره خود را کاملاً دستکاری کنند تا وضعیت درمانی خود را کاملاً مشخص کنند. دو مثال شامل دانش آموزان است که می توانند معلمان را ترغیب کنند تا "از آنها بگذرد" یا دانش آموزان مجاز به شرکت در امتحان مجدد تا زمان قبولی هستند. در حالت سابق ، آن دسته از دانش آموزانی که به سختی شکست می خورند اما قادر به گرفتن "پاس رحمت" هستند ، ممکن است با کسانی که به سختی شکست می خورند اما نمی توانند "برگ رحمت" را تأمین کنند ، متفاوت باشند. این امر منجر به سوگیری در انتخاب می شود ، زیرا گروه های درمانی و کنترل اکنون متفاوت هستند. در حالت اخیر ، برخی از دانش آموزان ممکن است تصمیم بگیرند که امتحان را دوباره برگزار کنند ، و پس از قبولی در این مرحله متوقف می شوند. این امر همچنین منجر به سوگیری در انتخاب می شود زیرا فقط برخی از دانشجویان تصمیم می گیرند که امتحان را مجددا برگزار کنند. [5]
آزمایش صحت فرضیات [ ویرایش ]
اگر عوامل بتوانند به طور کامل وضعیت درمان خود را تعیین کنند ، آزمایش قطعی اعتبار غیرممکن است. با این حال ، برخی آزمایشات وجود دارد که می تواند شواهدی را ارائه دهد که اعتبار طرح انقطاع رگرسیون را پشتیبانی یا تخفیف می دهد.
تست چگالی [ ویرایش ]
McCrary (2008) [12] تست چگالی داده های لی ، مورتی و باتلر (2004). [13]
مک کری (2008) پیشنهاد کرد که تراکم مشاهدات متغیر انتساب بررسی شود. [12] اگر ناپیوستگی در تراکم متغیر انتساب در آستانه درمان وجود داشته باشد ، این ممکن است نشان دهد که برخی از عوامل قادر به دستکاری کامل وضعیت درمان خود بوده اند.
به عنوان مثال ، اگر چندین دانش آموز بتوانند "برگه رحمت" را بدست آورند ، دانش آموزان بیشتری که فقط به سختی امتحان را قبول کرده اند بیشتر از کسانی هستند که به سختی شکست خورده اند. به همین ترتیب ، اگر دانش آموزان مجاز به امتحان مجدد تا زمان قبولی باشند ، نتیجه مشابهی حاصل می شود. در هر دو مورد ، این امر احتمالاً هنگام بررسی تراکم نمرات امتحان نشان داده می شود. "بازی در سیستم" به این روش می تواند تخمین اثر درمان را مغرضانه جلوه دهد.
تداوم متغیرهای مشاهده شده [ ویرایش ]
از آنجا که اعتبار طرح انقطاع رگرسیون متکی به افرادی است که به سختی تحت درمان قرار گرفته اند همان کسانی هستند که فقط به سختی درمان نشده اند ، بررسی منطقی بودن این گروه ها بر اساس متغیرهای قابل مشاهده منطقی است. برای مثال قبلی ، می توان آزمایش کرد که آیا کسانی که به سختی موفق به گذراندن دوره شده اند دارای ویژگی های متفاوت (جمعیتی ، درآمد خانواده و غیره) از کسانی هستند که به سختی شکست خورده اند. اگرچه برخی متغیرها ممکن است برای دو گروه براساس شانس تصادفی متفاوت باشند ، اما بیشتر این متغیرها باید یکسان باشند. [13]
آزمونهای جعل [ ویرایش ]
متغیرهای از پیش تعیین شده [ ویرایش ]
مشابه تداوم متغیرهای مشاهده شده ، انتظار می رود در متغیرهای از پیش تعیین شده در قطع درمان تداوم داشته باشد. از آنجا که این متغیرها قبل از تصمیم درمانی تعیین شده بودند ، وضعیت درمان نباید هیچ تأثیری بر آنها داشته باشد. مثال قبلی بورس تحصیلی مبتنی بر شایستگی را در نظر بگیرید. اگر نتیجه مورد علاقه نمرات آینده باشد ، بنابراین انتظار نداریم که بورس تحصیلی بر نمرات ابتدایی تأثیر بگذارد. اگر عدم وقفه در متغیرهای از پیش تعیین شده در قطع درمان وجود داشته باشد ، این امر اعتبار طرح انقطاع رگرسیون را زیر سوال می برد.
ناپیوستگی های دیگر [ ویرایش ]
اگر ناپیوستگی ها در سایر نقاط متغیر انتساب وجود داشته باشد ، جایی که این موارد انتظار نمی رود ، این ممکن است طراحی ناپیوستگی رگرسیون را مشکوک کند. مثال Carpenter and Dobkin (2011) را در نظر بگیرید که تأثیر دسترسی قانونی به الکل را در ایالات متحده مطالعه کردند. [8] همانطور که دسترسی به الکل در 21 سالگی افزایش می یابد ، این منجر به تغییر در نتایج مختلف مانند نرخ مرگ و میر و میزان بیماری می شود. اگر میزان مرگ و میر و مرگ و میر نیز در سنین دیگر به طور ناپیوسته افزایش یابد ، پس تفسیر عدم پیوستگی در 21 سالگی را زیر سوال می برد.
شمول و استثنا متغیرهای متغیر [ ویرایش ]
اگر برآوردهای پارامتر نسبت به حذف یا افزودن متغیرهای متغیر به مدل حساس باشند ، این امر ممکن است اعتبار طرح انقطاع رگرسیون را مورد تردید قرار دهد. یک تغییر قابل توجه ممکن است نشان دهد که کسانی که فقط به سختی تحت درمان قرار گرفتند در این افراد متغیر با کسانی که فقط به سختی درمان نشده اند متفاوت است. شامل کوواریارات برخی از این سوگیری را برطرف می کند. اگر مقدار زیادی تعصب وجود داشته باشد و متغیرها مقدار قابل توجهی از این مورد را توضیح دهند ، در نتیجه گنجاندن یا حذف آنها به طور قابل توجهی تخمین پارامتر را تغییر می دهد. [5]
کارهای اخیر نشان داده است که چگونه می توان متغیرهای متغیر را اضافه کرد ، در چه شرایطی این کار معتبر است و امکان افزایش دقت را دارد. [14]
مزایا [ ویرایش ]
- هنگامی که به درستی اجرا و تجزیه و تحلیل شود ، RDD یک برآورد بی طرفانه از اثر درمان محلی را ارائه می دهد. [15] RDD می تواند تقریباً به اندازه یک آزمایش تصادفی در اندازه گیری یک اثر درمانی خوب باشد.
- RDD ، به عنوان یک شبه آزمایش ، به تصادفی قبلی نیاز ندارد و مسائل اخلاقی انتساب تصادفی را دور می زند .
- مطالعات RDD که به خوبی اجرا شده اند می توانند تخمین اثر درمانی مشابه برآوردهای مطالعات تصادفی ایجاد کنند. [16]
معایب [ ویرایش ]
- اثرات برآورد شده تنها در صورتی بی طرفانه است که شکل عملکردی رابطه بین درمان و نتیجه به درستی مدل شود. مشهورترین اخطارها روابط غیرخطی است که به عنوان ناپیوستگی اشتباه گرفته می شود.
- آلودگی توسط سایر روشهای درمانی. اگر درمان دیگری در همان مقدار قطع از همان متغیر انتساب رخ دهد ، ممکن است ناپیوستگی اندازه گیری شده در متغیر نتیجه تا حدی به این روش درمانی دیگر نسبت داده شود. به عنوان مثال ، تصور كنید یك محقق می خواهد تأثیر دسترسی قانونی الكل بر سلامت روان را با استفاده از یك طرح انقطاع رگرسیون در حداقل سن شراب خواری مطالعه كند. تأثیر اندازه گیری شده می تواند با دسترسی قانونی به قمار اشتباه شود ، که ممکن است در همان سن رخ دهد.
برنامه های افزودنی [ ویرایش ]
RDD فازی [ ویرایش ]
شناسایی اثرات علی لولا بر این فرض بسیار مهم است که در واقع یک تیز برش، که در اطراف یک ناپیوستگی در احتمال انتساب از 0 تا 1. در واقعیت وجود دارد، با این حال، قطع اغلب نه به شدت اجرا ( برای دانش آموزانی که فقط در حین عبور از آستانه کوتاهی کرده اند از اختیار استفاده می کنند) و بنابراین تخمین ها مغرضانه خواهد بود .
در مقابل طرح انقطاع رگرسیون تیز ، طرح انقطاع رگرسیون فازی (FRDD) به احتمال زیاد تخصیص نیازی به انقطاع شدید ندارد اما تا زمانی که احتمال تخصیص متفاوت باشد ، قابل اجرا است. شهود پشت آن مربوط به استراتژی متغیر ابزاری و قصد درمان است .
طراحی پیچ رگرسیون [ ویرایش ]
وقتی متغیر انتساب مداوم باشد (به عنوان مثال کمک دانشجویی) و به طور قابل پیش بینی به متغیر مشاهده شده دیگری (به عنوان مثال درآمد خانواده) بستگی دارد ، می توان با استفاده از تغییرات شدید شیب عملکرد درمان ، اثرات درمانی را تشخیص داد. این روش با استفاده از نیکلسن ، سورنسن و تابه (2010) طراحی پیچ خوردگی رگرسیون ساخته شد ، اگرچه آنها به استناد به تجزیه و تحلیل های مشابه قبلی اشاره می کنند. [17] آنها می نویسند ، "این روش شبیه ایده ناپیوستگی رگرسیون است. به جای عدم ادامه در سطح تابع درآمد دریافتی ، ما در شیب تابع ناپیوستگی داریم." مبانی نظری دقیق توسط کارد و همکاران ارائه شد. (2012) [18] و یک برنامه تجربی توسط بوکرمن و همکاران. (2018) [19]
توجه داشته باشید که گره های رگرسیون (یا رگرسیون گره خورده ) همچنین می توانند به معنی نوعی رگرسیون تقسیم شده باشند که نوع دیگری از تحلیل است.
همچنین به [ ویرایش ] مراجعه کنید
منبع
https://en.wikipedia.org/wiki/Regression_discontinuity_design
در این وبلاگ به ریاضیات و کاربردهای آن و تحقیقات در آنها پرداخته می شود. مطالب در این وبلاگ ترجمه سطحی و اولیه است و کامل نیست.در صورتی سوال یا نظری در زمینه ریاضیات دارید مطرح نمایید .در صورت امکان به آن می پردازم. من دوست دارم برای یافتن پاسخ به سوالات و حل پروژه های علمی با دیگران همکاری نمایم.در صورتی که شما هم بامن هم عقیده هستید با من تماس بگیرید.