یادگیری ماشین

رگرسیون لجستیک چیست؟

رگرسیون لجستیک چیست؟

رگرسیون لجستیک چیست؟ رگرسیون لجستیک در اوایل قرن بیستم در علوم زیستی مورد استفاده قرار گرفت. سپس در بسیاری از کاربردهای علوم اجتماعی مورد استفاده قرار گرفت. رگرسیون لجستیک زمانی استفاده می شود که متغیر وابسته (هدف) مقوله ای باشد.

به عنوان مثال:

  • برای پیش بینی هرزنامه بودن ایمیل (1) یا (0)
  • این که آیا تومور بدخیم است (1) یا نه (0)

سناریویی را در نظر بگیرید که در آن باید طبقه بندی کنیم که آیا ایمیل اسپم است یا خیر. اگر برای این مشکل از رگرسیون خطی استفاده کنیم، نیاز به تعیین آستانه ای وجود دارد که بر اساس آن بتوان طبقه بندی را انجام داد.

از این مثال می توان استنباط کرد که رگرسیون خطی برای مسئله طبقه بندی مناسب نیست. رگرسیون خطی نامحدود است و این رگرسیون لجستیک را به میان می آورد. مقدار آنها از 0 به 1 تغییر میکند.

Model

Output = 0 or 1

Hypothesis => Z = WX + B

hΘ(x) = sigmoid (Z)

Sigmoid Function

رگرسیون لجستیک چیست؟انواع رگرسیون لجستیک

اگر Z به بی نهایت برود Y (پیش بینی شده) 1 می شود و اگر Z به بی نهایت منفی برود Y (پیش بینی شده) 0 می شود.

تحلیل فرضیه (Hypothesis)

خروجی از این فرضیه، احتمال برآورد شده است و برای استنباط اینکه، وقتی ورودی X داده می‌شود چقدر مطمئن است که مقدار پیش‌بینی‌شده می‌تواند مقدار واقعی باشد استفاده می‌شود. مثال زیر را در نظر بگیرید.

X = [x0 x1] = [1 IP-Address]

بر اساس مقدار x1، فرض کنید که احتمال تخمین زده شده را 0.8 به دست آوردیم. این نشان می دهد که 80٪ احتمال دارد که یک ایمیل اسپم باشد.

از نظر ریاضی این را می توان به صورت زیر نوشت

این نام “رگرسیون لجستیک” را توجیه می کند. داده ها در مدل رگرسیون خطی قرار می گیرند، که سپس توسط یک تابع لجستیکی که متغیر وابسته مقوله ای هدف را پیش بینی می کند، عمل می کند.

انواع رگرسیون لجستیک

در اینجا با انوا انواع رگرسیون لجستیک آشنا خواهیم شد.

1. رگرسیون لجستیک باینری

پاسخ قطعی تنها دو 2 نتیجه ممکن دارد. مثال: هرزنامه یا نه

2. رگرسیون لجستیک چند جمله ای

سه یا چند دسته بدون سفارش. مثال: پیش بینی اینکه کدام غذا بیشتر ترجیح داده می شود (گیاهی، غیر گیاهی، وگان)

3. رگرسیون لجستیک ترتیبی

سه یا چند دسته با سفارش. مثال: امتیاز فیلم از 1 تا 5

مرز تصمیم گیری

برای پیش بینی اینکه یک داده به کدام کلاس تعلق دارد، می توان یک آستانه تعیین کرد. بر اساس این آستانه، احتمال تخمینی به دست آمده در طبقات طبقه بندی می شود.بگویید، اگر predicted_value ≥ 0.5 باشد، ایمیل را به عنوان هرزنامه و در غیر اینصورت به عنوان غیر هرزنامه طبقه بندی کنید.

مرز تصمیم می تواند خطی یا غیر خطی باشد. ترتیب چند جمله ای را می توان برای به دست آوردن مرز تصمیم پیچیده افزایش داد.

جمع بندی

در آمار، مدل لجستیک (یا مدل لاجیت) برای مدل‌سازی احتمال یک کلاس یا رویداد خاص مانند عبور / عدم عبور، برد / باخت، زنده / مرده یا سالم / بیمار استفاده می‌شود.

جمله بالا توضیح ویکی پدیا درباره رگرسیون لجستیک می باشد. هدف مدل دادن 0 یا 1 به ما است. مدل مقداری بین 0 و 1 را پیش‌بینی می‌کند و این مقدار احتمال آن وضعیت را نشان می‌دهد.

رگرسیون لجستیک مقادیر پیوسته را پیش بینی نمی کند. رگرسیون لجستیک درست یا نادرست بودن چیزی را پیش بینی می کند.

رگرسیون لجستیک به نظر شبیه رگرسیون خطی است، اما متفاوت می باشند. رگرسیون خطی یک الگوریتم پیش بینی است. از سوی دیگر، رگرسیون لجستیک یک الگوریتم طبقه بندی است. الگوریتم رگرسیون خطی از حداقل مربعات برای برازش بهترین خط با داده ها استفاده می کرد اما رگرسیون لجستیک نمی تواند از آن روش استفاده کند. بنابراین، روشی دیگر مورد نیاز است. رگرسیون لجستیک از «حداکثر احتمال» برای تطبیق بهترین خط با داده ها استفاده می کند.

حداکثر احتمال چقدر است؟!

برآورد حداکثر احتمال شامل تلقی مسئله به عنوان یک مسئله بهینه‌سازی یا جستجو است، جایی که ما مجموعه‌ای از پارامترها را جستجو می‌کنیم که بهترین تناسب را برای احتمال مشترک نمونه داده (X) داشته باشد.

به بیان ساده تر شما دیتایی مانند افراد حاظر در کشتی تایتانیک را در نظر بگیرید احتمال زنده بودن یک نفر را در مجموعه داده تایتانیک محاسبه می‌کنیم، و سپس فرد دیگری، و سپس یکی دیگر، پس از اتمام همه محاسبات، مدل ضرب‌کننده همه این احتمالات، خط S شکل را با داده‌ها مطابقت می‌دهد. به محاسبه ادامه می دهد تا زمانی که بهترین خط S شکل را پیدا کند.

برای مطالعه مقاله ساخت وب سایت بازی با وردپرس بر روی لینک کلیک کنید

کلمات کلیدی:رگرسیون لجستیک چیست؟،انواع رگرسیون لجستیک،رگرسیون لجستیک

امیرحسین باقری

امیرحسین باقری هستم عاشق برنامه نویسی مخصوصا با python و همینطور طراح قالب و متخصص فرانت اند؛ از دانشی که تو این مدت بدست آوردم میشه به HTML, CSS, Bootstrap, Flexbox, SASS, Python, Django, DRF و هوش مصنوعی اشاره کرد.

دیدگاهتان را بنویسید

دکمه بازگشت به بالا