رگرسیون لجستیک
"مدل Logit" در اینجا هدایت می شود. این نباید با عملکرد Logit اشتباه گرفته شود .
در آمار ، از مدل لجستیکی (یا مدل logit ) برای مدل سازی احتمال وجود یک کلاس یا رویداد خاص مانند عبور / شکست ، برد / باخت ، زنده / مرده یا سالم / بیمار استفاده می شود. این حالت را می توان برای مدل سازی چندین کلاس از حوادث مانند تعیین اینکه آیا یک تصویر شامل گربه ، سگ ، شیر و غیره است ، گسترش داد.
رگرسیون لجستیک یک مدل آماری است که در شکل اصلی خود از یک تابع لجستیک برای مدل سازی یک متغیر وابسته باینری استفاده می کند ، اگرچه بسیاری از پسوندهای پیچیده تر وجود دارد. در تحلیل رگرسیون ، رگرسیون لجستیک [1] (یا رگرسیون logit ) در حال تخمین پارامترهای یک مدل لجستیک (نوعی رگرسیون باینری ) است. از نظر ریاضی ، یک مدل لجستیک باینری دارای یک متغیر وابسته با دو مقدار ممکن است ، مانند pass / fail که با یک متغیر شاخص نشان داده می شود ، جایی که دو مقدار با برچسب "0" و "1" نشان داده می شوند. در مدل لجستیک ،ورود به سیستم شانس (به لگاریتم از شانس ) برای ارزش برچسب "1" است ترکیب خطی از یک یا چند مستقل متغیر ( "پیش بینی")؛ متغیرهای مستقل می توانند هر یک متغیر باینری (دو کلاس ، کد شده توسط یک متغیر شاخص) یا یک متغیر پیوسته (هر مقدار واقعی) باشند. احتمال مربوط به مقدار دارای برچسب "1" می تواند بین 0 (مطمئنا مقدار "0") و 1 (مطمئنا مقدار "1") متفاوت باشد ، از این رو برچسب گذاری می شود. تابعی که log-odds را به احتمال زیاد تبدیل می کند ، تابع logistic است ، از این رو نام آن است. واحد اندازه گیری برای مقیاس لگاریتمی شانس است که به نام لوجیت ،istic و آن ، از این رو نام های جایگزین است. مدل های مشابه با مختلف تابع سیگموئید جای تابع لجستیک نیز می توانید استفاده، مانند مدل احتمالی ؛ مشخصه مشخصه مدل لجستیک این است که افزایش یکی از متغیرهای مستقل ضریب احتمال نتیجه معین را با یک نرخ ثابت مقیاس می کند ، هر متغیر مستقل پارامتر خاص خود را دارد. برای یک متغیر وابسته باینری این نسبت شانس را تعمیم می دهد .
در یک مدل رگرسیون لجستیک باینری ، متغیر وابسته دارای دو سطح ( طبقه ای ) است. خروجی هایی که بیش از دو مقدار دارند با استفاده از رگرسیون لجستیک چند جمله ای و اگر دسته های متعددی مرتب شده باشند ، با استفاده از رگرسیون لجستیک ترتیبی مدل سازی می شوند (به عنوان مثال شانس متناسب مدل لجستیک ترتیبی [2] ). مدل رگرسیون لجستیک خود به سادگی احتمال خروجی را از نظر ورودی مدل می کند و طبقه بندی آماری را انجام نمی دهد(این یک طبقه بندی نیست) ، اگرچه می توان از آن برای ساخت یک طبقه بندی استفاده کرد ، به عنوان مثال با انتخاب مقدار قطع و طبقه بندی ورودی های با احتمال بیشتر از قطع به عنوان یک کلاس ، در زیر قطع برای کلاس دیگر ؛ این یک روش معمول برای طبقه بندی باینری است . ضرایب معمولاً برخلاف حداقل مربعات خطی با یک عبارت بسته بسته محاسبه نمی شوند . see اتصالات مدل را ببینید . رگرسیون لجستیک به عنوان یک مدل آماری کلی در ابتدا توسط جوزف برکسون [3] گسترش یافت و رواج یافت ، [3] که از Berkson (1944) آغاز شد ، جایی که او "logit" را ایجاد کرد. رجوع شود به تاریخچه .
بخشی از یک سریال در |
تجزیه و تحلیل رگرسیون |
---|
![]() |
مدل ها |
برآورد کردن |
زمینه |
فهرست
- 1برنامه های کاربردی
- 2مثال ها
- 3بحث
- 4رگرسیون لجستیک در مقابل سایر رویکردها
- 5تفسیر متغیر نهفته
- 6عملکرد لجستیک ، شانس ، نسبت شانس و لوجیت
- 7اتصالات مدل
- 8ضرایب
- 9مشخصات ریاضی رسمی
- 10بیزی
- 11تاریخ
- 12برنامه های افزودنی
- 13نرم افزار
- 14همچنین ببینید
- 15منابع
- 16خواندن بیشتر
- 17لینک های خارجی
برنامه ها [ ویرایش ]
رگرسیون لجستیک در زمینه های مختلفی از جمله یادگیری ماشین ، بیشتر رشته های پزشکی و علوم اجتماعی استفاده می شود. به عنوان مثال ، امتیاز تروما و شدت آسیب ( TRISS ) ، که به طور گسترده برای پیش بینی مرگ و میر در بیماران آسیب دیده استفاده می شود ، در ابتدا توسط بوید و همکاران ایجاد شد. استفاده از رگرسیون لجستیک. [4] بسیاری از مقیاس های پزشکی دیگر که برای ارزیابی شدت بیمار استفاده می شود با استفاده از رگرسیون لجستیک ساخته شده اند. [5] [6] [7] [8] برای پیش بینی خطر ابتلا به یک بیماری خاص (به عنوان مثال دیابت ، بیماری عروق کرونر قلب ) ، براساس ویژگی های مشاهده شده بیمار (سن ، جنس ، شاخص توده بدن ) ، ممکن است از رگرسیون لجستیک استفاده شود .، نتایج آزمایشات مختلف خون و غیره). [9] [10] مثال دیگر ممکن است پیش بینی اینکه آیا یک رای دهنده نپالی به کنگره نپال یا حزب کمونیست نپال یا هر حزب دیگری رأی می دهد ، بر اساس سن ، درآمد ، جنس ، نژاد ، کشور محل سکونت ، رای در انتخابات قبلی و غیره . [11] این روش همچنین می توانید در استفاده می شود مهندسی ، به ویژه برای پیش بینی احتمال شکست را از یک فرایند، سیستم یا محصول داده می شود. [12] [13] همچنین در برنامه های بازاریابی مانند پیش بینی تمایل مشتری به خرید یک محصول یا توقف اشتراک و غیره استفاده می شود. [14] در اقتصادمی توان از آن برای پیش بینی احتمال انتخاب یک فرد برای حضور در نیروی کار استفاده کرد ، و یک برنامه تجاری برای پیش بینی احتمال کوتاهی صاحب خانه در وام مسکن است . از زمینه های تصادفی مشروط ، گسترش رگرسیون لجستیک به داده های متوالی ، در پردازش زبان طبیعی استفاده می شود .
منبع
https://en.wikipedia.org/wiki/Logistic_regression