آمار چند متغیره زیربخش آماری است که مشاهده و تحلیل همزمان بیش از یک متغیر نتیجه را شامل می شود. کاربرد آمارهای چند متغیره ، تجزیه و تحلیل چند متغیره است .

آمارهای چند متغیره مربوط به درک اهداف و پیشینه متفاوت هر یک از اشکال مختلف تحلیل چند متغیره و چگونگی ارتباط آنها با یکدیگر است. استفاده عملی از آمارهای چند متغیره برای یک مشکل خاص ممکن است شامل انواع مختلفی از تحلیلهای چند متغیره و چند متغیره به منظور درک روابط بین متغیرها و ارتباط آنها با مسئله مورد بررسی باشد.

بعلاوه ، آمارهای چند متغیره از نظر هر دو مربوط به توزیع احتمالات چند متغیره است

  • چگونه می توان از اینها برای نشان دادن توزیع دادههای مشاهده شده استفاده کرد.
  • چگونه می توان آنها را به عنوان بخشی از استنباط آماری مورد استفاده قرار داد ، به ویژه در مواردی که چندین مقدار مختلف به همان تحلیل علاقه مند هستند

انواع خاصی از مشکلات مربوط به داده های چند متغیره، برای مثال رگرسیون خطی ساده و رگرسیون چندگانه هستند، نه معمولا نظر گرفته می شود موارد خاص از آمار چند متغیره زیرا تجزیه و تحلیل با در نظر گرفتن (تک متغیره) توزیع شرطی از یک متغیر نتیجه تنها با توجه به سایر برخورد متغیرها

 

فهرست

انواع تجزیه و تحلیل ویرایش ]

مدل های مختلف زیادی وجود دارد که هر کدام نوع تحلیل خاص خود را دارند:

  1. تجزیه و تحلیل واریانس چند متغیره (MANOVA) تجزیه واریانس را گسترش می دهد تا مواردی را پوشش دهد که بیش از یک متغیر وابسته وجود داشته باشد که به طور همزمان مورد تجزیه و تحلیل قرار گیرد. همچنین به تجزیه و تحلیل چند متغیره کواریانس (MANCOVA) مراجعه کنید.
  2. رگرسیون چند متغیره سعی در تعیین فرمول دارد که می تواند شرح دهد که چگونه عناصر یک بردار از متغیرها به طور همزمان به تغییرات در دیگران پاسخ می دهند. برای روابط خطی ، تجزیه و تحلیل رگرسیون در اینجا بر اساس اشکال مدل خطی کلی است . برخی معتقدند که رگرسیون چند متغیره با رگرسیون چند متغیره متمایز است ، با این وجود ، بحث می شود و به طور مداوم در زمینه های علمی صدق نمی کند. [1]
  3. تجزیه و تحلیل مؤلفه های اصلی (PCA) مجموعه جدیدی از متغیرهای متعامد ایجاد می کند که حاوی همان اطلاعات به عنوان مجموعه اصلی است. محورهای تغییر را می چرخد ​​و مجموعه جدیدی از محورهای متعامد را ترتیب می دهد ، به گونه ای که به ترتیب خلاصه ای از تنوع تغییرات را جمع بندی می کند.
  4. تجزیه و تحلیل عاملی شبیه به PCA است اما به کاربر اجازه می دهد تعداد مشخصی از متغیرهای مصنوعی ، کمتر از مجموعه اصلی را استخراج کند ، و باقی مانده تغییرات غیر قابل توضیح را به عنوان خطا در اختیار شما قرار می دهد. متغیرهای استخراج شده به عنوان متغیرهای پنهان یا عوامل شناخته می شوند. ممکن است هرکدام در گروهی از متغیرهای مشاهده شده ، متغیر حسابداری را به خود اختصاص دهند.
  5. تحلیل همبستگی کانونی روابط خطی بین دو مجموعه متغیر پیدا می کند. آن (به عنوان مثال متعارف) نسخه دو متغیره تعمیم است [2] همبستگی.
  6. تجزیه و تحلیل افزونگی (RDA) شبیه به تجزیه و تحلیل همبستگی کانونی است اما به کاربر اجازه می دهد تعداد مشخصی از متغیرهای مصنوعی را از یک مجموعه متغیرهای (مستقل) استخراج کند که تا آنجا که ممکن است واریانس در مجموعه های دیگر (مستقل) توضیح دهد. این یک آنالوگ رگرسیون چند متغیره است .
  7. تجزیه و تحلیل مکاتبات (CA) یا میانگین تلاقی متقابل ، مجموعه ای از متغیرهای مصنوعی را می آموزد که مجموعه اصلی را خلاصه می کند. مدل زمینه ای تفاوت های مربعی را بین پرونده ها (موارد) فرض می کند.
  8. تجزیه و تحلیل مکاتبات متعارف (یا "محدود") (CCA) برای جمع بندی تغییرات مشترک در دو مجموعه از متغیرها (مانند تجزیه و تحلیل افزونگی). ترکیبی از تجزیه و تحلیل مکاتبات و تحلیل رگرسیون چند متغیره - سایپرز ، باشگاه دانش مدل زمینه ای تفاوت های مربعی را بین پرونده ها (موارد) فرض می کند.
  9. مقیاس بندی چند بعدی شامل الگوریتم های مختلفی برای تعیین مجموعه ای از متغیرهای مصنوعی است که به بهترین نحو مسافت های جفت شده بین سوابق را نشان می دهد. روش اصلی تجزیه و تحلیل مختصات اصلی است (PCoA ؛ بر اساس PCA).
  10. تجزیه و تحلیل تبعیض آمیز ، یا تجزیه و تحلیل متغیر معمولی ، تلاش می کند تا تعیین کند که آیا مجموعه ای از متغیرها را می توان برای تمایز بین دو یا چند گروه از موارد استفاده کرد.
  11. تجزیه و تحلیل تمایز خطی (LDA) یک پیش بینی کننده خطی را از دو مجموعه داده معمولاً توزیع شده محاسبه می کند تا طبقه بندی مشاهدات جدید را امکان پذیر کند.
  12. سیستم های خوشه بندی اشیاء را به گروه ها (به اصطلاح خوشه ها) اختصاص می دهند به گونه ای که اشیاء (موارد) از یک خوشه یکسان نسبت به اشیاء از خوشه های مختلف به یکدیگر شبیه هستند.
  13. پارتیشن بندی بازگشتی یک درخت تصمیم گیری را ایجاد می کند که تلاش می کند تا به درستی اعضای جمعیت را بر اساس یک متغیر وابسته وابسته طبقه بندی کند.
  14. شبکه های عصبی مصنوعی روش های رگرسیون و خوشه بندی را به مدل های چند متغیره غیرخطی گسترش می دهند.
  15. از گرافیک های آماری مانند تورها ، توطئه های مختصات موازی ، ماتریس scatterplot می توان برای کشف داده های چند متغیره استفاده کرد.
  16. مدل های معادلات همزمان شامل بیش از یک معادله رگرسیون ، با متغیرهای وابسته مختلف ، با هم برآورد می شوند.
  17. Autoregression بردار شامل رگرسیون همزمان متغیرهای سری زمانی مختلف به تنهایی و ارزشهای عقب مانده یکدیگر است.
  18. تجزیه و تحلیل منحنی های پاسخ اصلی (PRC) روشی مبتنی بر RDA است که به کاربر اجازه می دهد با گذشت زمان با اصلاح تغییرات در درمان های کنترل ، بر اثرات درمان تمرکز کند. [3]

توزیع احتمال مهم ویرایش ]

مجموعه توزیع توزیع احتمالی مورد استفاده در آنالیزهای چند متغیره است که نقش مشابهی با مجموعه مربوط به توزیع دارند که در تجزیه و تحلیل تک متغیره هنگامی که توزیع عادی مناسب با یک مجموعه داده است ، نقش دارند. این توزیع های چند متغیره عبارتند از:

توزیع معکوس ویشارت در مهم است استنتاج بیزی ، برای مثال در بیزی رگرسیون خطی چند متغیره . علاوه بر این ، توزیع T-مربع هوتلینگ یک توزیع چند متغیره است ، به طور کلی توزیع t دانشجویی را نشان می دهد ، که در آزمایش فرضیه چند متغیره استفاده می شود .

تاریخچه ویرایش ]

کتاب درسی آندرسون در سال 1958 ، مقدمه ای بر تحلیل چند متغیره ، [4] نسلی از نظریه پردازان و آمارشناسان کاربردی را آموزش داد. کتاب اندرسون بر آزمایش فرضیه از طریق آزمون نسبت احتمال و خصوصیات توابع قدرت تأکید دارد : پذیرش ، بی طرفی و یکنواختی . [5] [6]

نرم افزار و ابزار ویرایش ]

تعداد زیادی از بسته های نرم افزاری و ابزارهای دیگر برای تجزیه و تحلیل چند متغیره از جمله:

همچنین مشاهده کنید ویرایش ]

منبع

https://en.wikipedia.org/wiki/Multivariate_statistics