آمار غیرپارامتری شاخه ای از آماری است که صرفاً براساس خانواده های پارامتری توزیع توزیع احتمال نمی باشد (نمونه های رایج پارامترها میانگین و واریانس است). آمار غیرپارامتری مبتنی بر عدم توزیع یا داشتن توزیع مشخص است اما پارامترهای توزیع نامشخص هستند. آمار غیرپارامتری شامل آمار توصیفی و استنباط آماری است .
فهرست
تعاریف [ ویرایش ]
اصطلاح «آمار غیرپارامتری» به دو روش زیر بطور نامشخص تعریف شده است ، در میان دیگران.
- معنای اول غیر پارامتری تکنیکهایی را پوشش می دهد که به داده های متعلق به خانواده خاص پارامتری توزیع توزیع احتمال اعتماد ندارند.
اینها شامل موارد زیر است:
- روش های توزیع رایگان ، که به فرضیات متکی نیستند که داده ها از یک خانواده پارامتری مشخص توزیع توزیع احتمال گرفته شده است . به همین ترتیب خلاف آمار پارامتری است .
- آمار غیرپارامتری ( آماری تعریف شده است که تابعی از نمونه است ؛ هیچ وابستگی به یک پارامتر ندارد ).
آمار سفارش ، که مبتنی بر ردیف مشاهدات است ، نمونه ای از چنین آماری است.
بحث زیر از کندال گرفته شده است . [1]
فرضیه های آماری مربوط به رفتار متغیرهای تصادفی قابل مشاهده است .... به عنوان مثال ، فرضیه (الف) مبنی بر اینکه توزیع عادی دارای یک میانگین مشخص است و واریانس آماری است. این فرضیه (b) نیز وجود دارد که دارای یک واریانس معین اما نامشخص است؛ این فرضیه (c) نیز وجود دارد که توزیع از نظر عادی با میانگین و واریانس نامشخص است. سرانجام ، فرضیه (d) نیز وجود دارد که دو توزیع مداوم نا مشخص یکسان هستند.
توجه شده است که در مثالهای (الف) و (ب) توزیع زیرنظر گرفته شده از مشاهدات به شکلی خاص (عادی) در نظر گرفته شده است و فرضیه مربوط به ارزش یک یا هر دو پارامتر آن است. چنین فرضیه ای ، به دلایل آشکار ، پارامتری نامیده می شود .
فرضیه (c) ماهیت متفاوتی داشت ، زیرا هیچ مقدار پارامتر در بیانیه فرضیه مشخص نشده است. ممکن است منطقی چنین فرضیه ای را غیر پارامتری بنامیم . فرضیه (d) نیز غیر پارامتری است اما علاوه بر این ، حتی شکل اصلی توزیع را نیز مشخص نمی کند و ممکن است اکنون منطقی بدون توزیع نامیده شود . با وجود این تمایزات ، ادبیات آماری معمولاً برچسب "غیرپارامتری" را برای آزمایش رویه هایی که اخیراً آن را "عاری از توزیع" نامیده ایم ، اعمال می کند و بدین ترتیب یک طبقه بندی مفید از دست می یابد.
- معنای دوم تکنیک های غیر پارامتری را پوشش می دهد که فرض نمی کنند ساختار یک مدل ثابت باشد. به طور معمول ، مدل برای اندازه گیری پیچیدگی داده ها در اندازه رشد می کند. در این تکنیک ها معمولاً متغیرهای جداگانه به توزیع پارامتری تعلق دارند و فرضیاتی در مورد انواع اتصالات بین متغیرها نیز ایجاد می شود. این تکنیک ها ، از جمله دیگر:
- رگرسیون غیر پارامتری ، که در آن مدل سازی می شود که ساختار رابطه بین متغیرها بصورت غیر پارامتری رفتار می شود ، اما با وجود این ممکن است مفروضات پارامتری در مورد توزیع باقیمانده مدل وجود داشته باشد.
- مدل های بیزی سلسله مراتبی غیر پارامتری ، مانند مدل های مبتنی بر فرآیند Dirichlet ، که اجازه می دهد تعداد متغیرهای نهفته در حد لازم برای رشد داده ها رشد کنند ، اما در جایی که متغیرهای فردی هنوز دنبال توزیع های پارامتری و حتی فرایند کنترل سرعت رشد هستند متغیرهای نهفته از توزیع پارامتری پیروی می کنند.
برنامه ها و هدف [ ویرایش ]
روشهای غیر پارامتری به طور گسترده برای مطالعه جمعیتهایی استفاده می شوند که دارای رتبه بندی هستند (مانند بررسی های فیلم دریافت یک تا چهار ستاره). استفاده از روشهای غیر پارامتری ممکن است زمانی ضروری باشد که داده ها دارای رتبه بندی باشند اما تفسیر عددی روشنی ندارند ، مانند هنگام ارزیابی ترجیحات . از نظر سطح اندازه گیری ، روش های غیر پارامتری منجر به داده های معمولی می شوند .
از آنجا که روش های غیر پارامتری فرضیات کمتری را ایجاد می کنند ، کاربرد آنها بسیار گسترده تر از روش های پارامتری مربوطه است. به ویژه ، آنها ممکن است در موقعیت هایی اعمال شوند که کمتر درباره برنامه مورد نظر شناخته شده باشد. همچنین به دلیل اتکا به فرضیات کمتری ، روشهای غیر پارامتری استحکام بیشتری دارند .
توجیه دیگر استفاده از روشهای غیر پارامتری سادگی است. در موارد خاص ، حتی هنگامی که استفاده از روش های پارامتری توجیه می شود ، روش های غیر پارامتری ممکن است استفاده از آن ساده تر باشد. به دلیل همین سادگی و همچنین استحکام بیشتر آنها ، برخی از آمارشناسان روشهای غیر پارامتری را به عنوان فضای کمتری برای استفاده نادرست و سوء تفاهم می دانند.
کاربرد گسترده تر و افزایش استحکام آزمایش های غیر پارامتری با هزینه ای همراه است: در مواردی که یک آزمایش پارامتری مناسب باشد ، آزمایش های غیر پارامتری قدرت کمتری دارند . به عبارت دیگر ، برای تهیه نتیجه گیری با همان میزان اطمینان ، می توان به اندازه بزرگتر نمونه مورد نیاز بود.
مدل های غیر پارامتری [ ویرایش ]
مدل غیر پارامتریک از متفاوت پارامتری مدل در ساختار مدل مشخص نشده است پیشینی نیست اما در عوض از داده تعیین می شود. اصطلاح غیر پارامتری به معنای این نیست که چنین مدلهایی کاملاً فاقد پارامتر باشند بلکه تعداد و ماهیت پارامترها انعطاف پذیر بوده و از قبل برطرف نشده است.
- هیستوگرام یک برآورد ناپارامتری ساده از یک توزیع احتمال است.
- تخمین چگالی هسته تخمین بهتری از تراکم نسبت به هیستوگرام فراهم می کند.
- رگرسیون غیر پارامتری و روشهای رگرسیون نیم پارامتری بر اساس هسته ، اسپلین و موجک توسعه یافته اند .
- تجزیه و تحلیل پوششی داده ها ضریب بهره وری شبیه به موارد حاصل از آنالیز چند متغیره و بدون فرض توزیع را فراهم می کند.
- KNN ها نمونه غیب را بر اساس نقاط K در مجموعه تمرینی که به آن نزدیکترین طبقه بندی می شوند ، طبقه بندی می کنند.
- ماشین بردار پشتیبانی (با کرنل گوسی) یک طبقه بندی بزرگ حاشیه ناپارامتری است.
- روش لحظه ها (آمار) با توزیع احتمال چند جمله ای.
روشها [ ویرایش ]
روشهای آماری استنباطی غیر پارامتری (یا بدون توزیع ) روشی ریاضی برای آزمایش فرضیه آماری است که برخلاف آمار پارامتری ، هیچ فرضی در مورد توزیع احتمال متغیرهای مورد ارزیابی قرار نمی دهد. آزمایشاتی که اغلب استفاده می شود شامل
- تجزیه و تحلیل تشابهات
- تست اندرسون-دارلینگ : آزمایش اینکه آیا نمونه ای از توزیع معین تهیه شده است یا خیر
- روش های آماری bootstrap : تخمین صحت / توزیع نمونه گیری آماری
- کوکران Q : آزمایش می کند که آیا درمان های k در طرح بلوک های تصادفی با نتایج 1/1 دارای اثرات یکسان هستند
- کاپا کوهن : توافق بین بخشی را برای موارد طبقه بندی می کند
- تجزیه و تحلیل واریانس دو طرفه فریدمن به ترتیب : تست اینکه آیا تیمارهای K در طرح بلوکهای تصادفی دارای اثرات یکسان هستند
- Kaplan-Meier : برآورد عملکرد بقا از داده های طول عمر ، مدل سازی سانسور
- تاو کندال : وابستگی آماری بین دو متغیر را اندازه گیری می کند
- کندل W : اندازه گیری بین 0 و 1 توافق نامه بین بخشی
- آزمون کولموگروف - اسمیرنوف : آزمایش اینکه آیا نمونه ای از توزیع مشخص گرفته می شود یا اینکه دو نمونه از همان توزیع کشیده شده است
- تجزیه و تحلیل واریانس یک طرفه Kruskal-Wallis توسط صفحات: تست اینکه آیا> 2 نمونه مستقل از توزیع مشابه گرفته شده است
- آزمون کوپر : تست اینکه آیا نمونه ای از توزیع داده شده ، حساس به تغییرات چرخه ای مانند روز هفته ، تهیه شده است
- آزمون Logrank : توزیع بقا دو نمونه سست و پوست راست ، سانسور شده را مقایسه می کند
- آزمون رتبه Mann-Whitney U یا Wilcoxon: تست اینکه آیا دو نمونه از توزیع مشابه گرفته شده است ، در مقایسه با یک فرضیه جایگزین داده شده.
- آزمون مک نمار : تست اینکه آیا در جدولهای احتمالی 2 2 2 با یک ویژگی دوتایی و جفت های سوء استفاده شده ، فرکانس های حاشیه ای سطر و ستون برابر هستند
- آزمون میانه : تست اینکه آیا دو نمونه از توزیع ها با میانگین مساوی گرفته شده است
- آزمون جایگشتی پیتمن : یک تست اهمیت آماری که مقادیر دقیق p را با بررسی کلیه بازآرایی های احتمالی برچسب ها به دست می آورد
- محصولات رده بندی : ژن های متفاوت بیان شده در آزمایش های ریزآرایی را تکرار می کند
- آزمون Siegel-Tukey : آزمون اختلاف در مقیاس بین دو گروه
- تست ورود به سیستم : آزمایش اینکه آیا نمونه های جفت همسان از توزیع با میانه مساوی گرفته شده اند
- ضریب همبستگی رتبه Spearman : وابستگی آماری بین دو متغیر با استفاده از یک عملکرد یکنواخت اندازه گیری می شود
- آزمون مربع مرتبه ها : برابری واریانس را در دو یا چند نمونه آزمایش می کند
- آزمون توکی-دادورث : برابری دو توزیع را با استفاده از رده ها آزمایش می کند
- والد-ولفوویتز تست را اجرا می کند : اینکه آیا عناصر یک توالی از یکدیگر مستقل / تصادفی هستند را آزمایش می کند
- آزمون رتبه امضا شده Wilcoxon : تست اینکه آیا نمونه های جفت همسان از جمعیت با میانگین های مختلف گرفته می شوند
تاریخچه [ ویرایش ]
آمارهای غیرپارامتری اولیه شامل معدل (قرن سیزدهم یا قبل از آن ، استفاده در تخمین توسط ادوارد رایت ، 1599 ، مراجعه به تاریخچه میانه ) و آزمایش علامت توسط جان آربوتنوت (1710) در تجزیه و تحلیل نسبت جنسی انسان در بدو تولد است (به آزمون ثبت نام مراجعه کنید § تاریخچه ) [2] [3]
در این وبلاگ به ریاضیات و کاربردهای آن و تحقیقات در آنها پرداخته می شود. مطالب در این وبلاگ ترجمه سطحی و اولیه است و کامل نیست.در صورتی سوال یا نظری در زمینه ریاضیات دارید مطرح نمایید .در صورت امکان به آن می پردازم. من دوست دارم برای یافتن پاسخ به سوالات و حل پروژه های علمی با دیگران همکاری نمایم.در صورتی که شما هم بامن هم عقیده هستید با من تماس بگیرید.