فرضیات ویرایش ]

بیشتر آمار آزمون فرم t = دارندز/s، جایی که Z و s توابع داده هستند.

Z ممکن است به فرضیه جایگزین حساس باشد (یعنی وقتی درست است که فرضیه جایگزین اندازه آن بیشتر شود) ، در حالی که s یک پارامتر مقیاس گذاری است که اجازه می دهد توزیع t تعیین شود.

به عنوان مثال ، در آزمون t یک نمونه

{\ displaystyle t = {\ frac {Z} {s}} = {\ frac {{\ bar {X}} - \ mu} {{\ widehat {\ sigma}} / {\ sqrt {n}}}} }

که در آن X است میانگین نمونه از یک نمونه 1 ، 2 ، ...، N ، اندازه N ، ها است خطای استاندارد از میانگین ،{\ textstyle {\ widehat {\ sigma}}}برآورد است انحراف استاندارد از جمعیت، و μ است میانگین جامعه .

فرضیات اساسی یک تست t در ساده ترین شکل آن این است

  • X از توزیع طبیعی با میانگین μ و واریانسپیروی می کندσ 2/n
  • ها 2 (N-1) / σ 2 به دنبال یک χ 2 توزیع با N  - 1 درجه آزادی . این فرض زمانی محقق می شود که مشاهدات مورد استفاده برای تخمین s 2 از توزیع نرمال حاصل شود (و برای هر گروه iid).
  • Z و s مستقل هستند.

در تست t با مقایسه میانگین دو نمونه مستقل ، فرضیات زیر باید برآورده شود:

  • میانگین دو جمعیت در مقایسه باید توزیع نرمال را دنبال کند . تحت فرضیات ضعیف ، این امر در نمونه های بزرگ از قضیه حد مرکزی دنبال می شود ، حتی اگر توزیع مشاهدات در هر گروه غیر طبیعی باشد. [18]
  • اگر با استفاده از تعریف اصلی دانشجویان از تی مستقل؛ دو جمعیت که در مقایسه باید واریانس یکسان (قابل آزمون با استفاده از اند F آزمون ، آزمون Levene ، آزمون بارتلت ، یا آزمون براون-فورسیت ؛ یا سنجش گرافیکی با استفاده از یک نمودار Q-Q ) اگر اندازه نمونه در دو گروه مورد مقایسه برابر، اصلی دانشجو هستند تی است آزمون بسیار قوی به حضور واریانس نابرابر است. [19] آزمون t Welch نسبت به برابري واريانسها بدون توجه به مشابه بودن اندازه نمونه حساس نيست.
  • داده های مورد استفاده برای انجام آزمون یا باید به طور مستقل از دو جمعیت مقایسه شده نمونه برداری شود یا به طور کامل جفت شود. این به طور کلی از طریق داده قابل آزمایش نیست ، اما اگر اطلاعات وابستگی شناخته شده باشند (مثلاً با طراحی آزمون جفت شوند) ، باید آزمون وابسته اعمال شود. برای داده های جفت شده تا حدی ، آزمون های t مستقل کلاسیک ممکن است نتایج نامعتبر داشته باشند زیرا ممکن است آمار آزمون از توزیع t پیروی نکند ، در حالی که t -test وابسته چون داده های جفت نشده را دور می اندازد ، بهینه نیست. [20]

اکثر آزمونهای t دو نمونه نسبت به همه انحراف از مفروضات بسیار قوی هستند. [21]

برای دقت ، آزمون t-test و Z- test به نرمال بودن میانگین نمونه نیاز دارد و آزمون t علاوه بر این نیاز دارد که واریانس نمونه از توزیع χ 2 مقیاس پذیر پیروی کند و میانگین نمونه و واریانس نمونه از نظر آماری مستقل باشند . در صورت تحقق این شرایط نرمال بودن مقادیر داده های فردی لازم نیست. با توجه به قضیه محدودیت مرکزی ، میانگین نمونه های نمونه های نسبتاً بزرگ اغلب با یک توزیع طبیعی تقریباً تقریب می شوند حتی اگر داده ها به طور عادی توزیع نشوند. برای داده های غیر طبیعی ، توزیع واریانس نمونه ممکن است به طور قابل توجهی از χ 2 منحرف شودتوزیع با این حال ، اگر اندازه نمونه زیاد باشد ، قضیه اسلوتسکی نشان می دهد که توزیع واریانس نمونه تأثیر چندانی در توزیع آمار آزمون ندارد.

جفت نشده و زوج دو نمونه تی -tests ویرایش ]

خطای نوع I آزمون های t دو نمونه ای جفت نشده و جفت شده به عنوان تابعی از همبستگی. اعداد تصادفی شبیه سازی شده از یک توزیع نرمال متغیر با واریانس 1 سرچشمه می گیرند. سطح معنی داری 5٪ و تعداد موارد 60 است.

قدرت دو نمونه جفت نشده و زوج تی -tests به عنوان تابعی از ارتباط. اعداد تصادفی شبیه سازی شده از یک توزیع نرمال متغیر با واریانس 1 و انحراف از مقدار مورد انتظار 0.4 سرچشمه می گیرند. سطح معنی داری 5٪ و تعداد موارد 60 مورد است.

آزمون t دو نمونه برای تفاوت در میانگین شامل نمونه های مستقل (نمونه های غیر جفت شده) یا نمونه های زوج است. آزمونهای t زوجی نوعی مسدود کردن است و وقتی واحدهای جفت شده با توجه به "فاکتورهای نویز" که مستقل از عضویت در دو گروه در مقایسه هستند ، شبیه به هم هستند ، قدرت آنها بیشتر از آزمونهای غیر جفت است. [22] در زمینه های مختلف، زوج تی -tests می توان برای کاهش اثرات مخدوش کننده عوامل در مطالعه مشاهده .

نمونه های مستقل (جفت نشده) ویرایش ]

از t-test نمونه های مستقل زمانی استفاده می شود که دو مجموعه جداگانه از نمونه های مستقل و توزیع شده یکسان بدست آمده باشد ، یکی از هر دو جمعیت با هم مقایسه شود. به عنوان مثال ، فرض کنید ما در حال ارزیابی اثر یک درمان پزشکی هستیم و 100 نفر را در مطالعه خود ثبت نام می کنیم ، سپس به طور تصادفی 50 نفر را به گروه درمان و 50 نفر را به گروه کنترل اختصاص می دهیم. در این حالت ، ما دو نمونه مستقل داریم و از فرم جفت نشده آزمون t استفاده می کنیم.

نمونه های جفت شده ویرایش ]

مقاله اصلی: آزمون تفاوت زوجی

نمونه های t زنجیره ای معمولاً از نمونه ای از جفتهای واحد مشابه ، یا یک گروه از واحدها تشکیل شده است که دو بار آزمایش شده است ( آزمون t "اندازه گیریهای مکرر" ).

یک نمونه معمول از اندازه گیری های مکرر t-test می تواند جایی باشد که افراد قبل از درمان آزمایش می شوند ، مثلاً برای فشار خون بالا ، و افراد دیگر پس از درمان با یک داروی کاهش دهنده فشار خون دوباره آزمایش می شوند. با مقایسه تعداد بیماران مشابه قبل و بعد از درمان ، ما به طور موثر از هر بیمار به عنوان کنترل خود استفاده می کنیم. به این ترتیب رد صحیح فرضیه صفر (در اینجا: هیچ تفاوتی با درمان ایجاد نمی شود) می تواند بسیار محتمل باشد ، با افزایش قدرت آماری فقط به این دلیل که اکنون تنوع تصادفی از بین رفته است. با این حال ، افزایش قدرت آماری بهای زیادی دارد: آزمایشات بیشتری لازم است ، هر آزمودنی باید دو بار آزمایش شود. از آنجا که نیمی از نمونه اکنون به نیمی دیگر ، نسخه جفت شده Student بستگی داردt-test فقط داردn/2- 1 درجه آزادی (با تعداد کل مشاهدات n ). جفت ها به واحدهای آزمایشی منفرد تبدیل می شوند و نمونه باید دو برابر شود تا به همان درجه آزادی برسد. به طور معمول ، n - 1 درجه آزادی وجود دارد (با n تعداد کل مشاهدات). [23]

نمونه زوج تی آزمون در "همسان جفت نمونه" نتایج حاصل از یک نمونه جفت نشده است که پس از آن برای تشکیل یک نمونه زوج، با استفاده از متغیرهای اضافی که همراه با متغیرهای مورد نظر را اندازه گیری شدند. [24] تطبیق با شناسایی جفت مقادیر متشکل از یک مشاهده از هر دو نمونه انجام می شود ، جایی که این جفت از نظر سایر متغیرهای اندازه گیری شده مشابه است. این روش گاهی در مطالعات مشاهده ای برای کاهش یا از بین بردن اثرات عوامل مخدوش کننده مورد استفاده قرار می گیرد.

نمونه های جفت شده t-test اغلب به عنوان "نمونه های t-test وابسته " شناخته می شوند.

محاسبات ویرایش ]

عبارت صریح است که می تواند مورد استفاده برای انجام مختلف تی -tests در زیر آورده شده. در هر حالت ، فرمولی برای آماری از آزمون که دقیقاً یک توزیع- t تحت فرضیه صفر را دقیقاً دنبال یا نزدیک می کند ، آورده شده است. همچنین ، در هر مورد ، درجه های آزادی مناسب ارائه می شود. از هر یک از این آمار می توان برای انجام آزمون یک دم یا دو دم استفاده کرد .

هنگامی که تی ارزش و درجه آزادی تعیین می شود، یک ص -value می توان با استفاده از یک پیدا شده است جدول از ارزش از دانشجویان تی -distribution . اگر مقدار p محاسبه شده زیر آستانه انتخاب شده برای اهمیت آماری باشد (معمولاً سطح 0.10 ، 0.05 یا 0.01) ، فرضیه صفر به نفع فرضیه جایگزین رد می شود.

منبع

https://en.wikipedia.org/wiki/Student%27s_t-test