وبلاگ

توضیح وبلاگ من

دانلود پایان نامه کارشناسی ارشد:استنباط آماری مدل رگرسیونی با خطاهای خودبازگشتی به روش لاسو

 
تاریخ: 06-11-99
نویسنده: نویسنده محمدی

:

در این فصل به تعاریف و مقدمات لازم از جمله مدل رگرسیون خطی چندگانه استاندارد، مفهوم چند همخطی، رگرسیون ریج، بریج، روش لاسو و … که در فصلهای بعد به آنها نیاز داریم، خواهیم پرداخت.

 

 

 

1-1-رگرسیون خطی چندگانه و مسئله چند همخطی

 

یک مدل رگرسیون که شامل بیش از یک متغیر مستقل باشد و نسبت به پارامترها خطی باشد را مدل رگرسیون خطی چندگانه می نامند. فرم کلی یک مدل رگرسیون خطی چندگانه استاندارد به صورت زیر میباشد:

 

 

 

 

    (1-1)

 

 

که درآن  متغیرهای تصادفی مستقل و هم توزیع با میانگین صفر و واریانس  میباشد .  بردار پارامترها، برای    بردار متغیرهای مستقل و  متغیر پاسخ میباشد. ماتریس  را ماتریس طرح مینامیم.

 

هنگامی که بین متغیر های مستقل همبستگی وجود داشته باشد، می گوییم بین آنها چند همخطی وجود دارد. از آثار چند همخطی می توان به موارد زیر اشاره کرد:

 

الف : از آنجاییکه در این حالت اطلاعات مستقل در مورد هریک از متغیرهای مستقل وجود ندارد، لذا نمی توان اثرات جزئی متغیرهای مذکور روی متغیر وابسته را برآورد کرد .

 

ب : هنگامی که همبستگی شدید بین متغیرهای مستقل وجود داشته باشد، کوواریانس و واریانس ضرایب، بزرگتر برآورد خواهند شد .

 

ج : در حالتی که با چند همخطی شدید در مدل مواجه هستیم، پیش بینی های صورت گرفته از آن غیر قابل اعتماد خواهد بود. در این حالت پیش بینی ها براساس مدلی که دارای زیر مجموعه ای از متغیرهای مستقل مدل اصلی است، بهتر صورت می گیرد .

 

د : رابطه قوی بین دو یا چند متغیر مستقل سبب می شود که نتوان ماتریس  را معکوس کرد. زیرا در این صورت ستون های ماتریس  به هم وابسته هستند و در نتیجه ستون های  نیز با هم وابسته هستند و پررتبه نیست.

 

همان طور که در قسمت ج گفتیم یکی از روش ها برای بهبود برآورد کمترین مربعات، زیر مجموعه منتخب می باشد که نتیجه گزینش بهترین زیر مجموعه رگرسیون می باشد . از روش های زیر مجموعه منتخب میتوان به رگرسیون گام به گام، حذف پیشرو و انتخاب پسرو

دانلود مقاله و پایان نامه

 اشاره کرد. البته قابل ذکر است که زیر مجموعه منتخب خود دارای مشکل عدم استواری می باشد . به عنوان مثال با تغییر کوچک در داده ها مدل های خیلی متفاوتی را بوجود می آورد، که این امر درستی پیشبینی را کاهش می دهد.

 

معمولا می توان درستی پیش بینی را با انقباض تعدادی از ضرایب و یا با صفر قرار دادن آنها بهبود بخشید. روش پیشنهادی برای بهبود روش برآورد کمترین مربعات، رگرسیونهای انقباضی است. از جمله رگرسیون ریج[1]، لاسو[2]و بریج[3]که به اختصار این روشها را توضیح میدهیم. برای توضیح بیشتر در مورد این روشها به سلیمانی(1392) مراجعه شود.

 

1-2-رگرسیون ریج

 

رگرسیون ریج در سال 1962 برای اولین بار توسط هوئرل و کنارد[4] معرفی شد. همان طور که می دانیم اساس و پایه برآوردگر کمترین مربعات یک رگرسیون خطی این است که  وجود داشته باشد. دو دلیل وجود دارد که این معکوس وجود نداشته باشد : یکی ماتریس طرح  پر رتبه ستونی نباشد و دیگری چند همخطی بودن می باشد. روش رگرسیون ریج یکی از بهترین و محبوب ترین گزینه ها برای رفع این مشکل می باشد.

 

اضافه کردن ماتریس قطری  به   راهی آسان برای تضمین معکوس پذیری می باشد یعنی . (  یک ماتریس   همانی می باشد). بنابراین برآوردگر رگرسیون ریج پارامتر  به صورت زیر می باشد :

 

که  می باشد .این برآوردگر را نیز میتوان با مینیمم کردن عبارت

 

نسبت به  تحت شرط  بدست آورد.  یک پارامتر تنظیم کننده میباشد که میزان انقباض ضرایب را کنترل میکند.

 

بطور معادل با مینیمم کردن

 

نسبت به  بدست میآید.

 

همانطور که میدانید، برآوردگر کمترین مربعات  به صورت زیر میباشد:

 

یک برآوردگر اریب با میانگین و واریانس زیر میباشد :

 

همانطور که میدانید برآوردگر کمترین مربعات نااریب با واریانس زیر میباشد:

 

هوئرل و کنارد ثابت کردهاند که اگر  کراندار باشد می توان -یی را پیدا کرد به طوریکه :

 

بنابراین رگرسیون ریج می تواند برآورد  را بهبود ببخشد.

 

 

 

 

 

1-3-بریج

 

فرانک و فریدمن[5] در سال 1993 در مورد تعمیم رگرسیون ریج و زیرمجموعه منتخب، از راه اضافه کردن یک جمله تاوان به شکل  به مجموع مربعات باقی‌مانده ها پرداختند که هم ارز قیدی به فرم    می‌باشد، که آنرا “بریج” نامیدند.

 

لازم به ذکر است برای توابعی به فرم خطی، تعداد زیادی تابع تاوان وجود دارد : تاوان  با  (که به تابع تاوان آنتروپی معروف است) که توسط  در سال 1996 در روش انتخاب بهترین زیر مجموعه مورد استفاده قرار گرفت. تاوان  با  (لاسو) که توسط تیبشیرانی در سال 1996 و تاوان  با  (ریج) توسط هوئرل و کنارد در سال 1962 مورد مطالعه قرار گرفت. همچنین فن و لی[6](2001) کلاس بزرگی از تابع تاوانها را معرفی و سپس مورد مطالعه قرار دادند. آنها نشان دادند که چون تاوان  منحصر به فرد میباشد، از اینرو لاسو خود به خود انتخاب متغیر را انجام میدهد، که در بخش بعد آنرا بیان میکنیم.

 

 

 

[1]

 

[2]

 

[3]

 

[4]

 

[5]

 

[6]


فرم در حال بارگذاری ...

« پایان نامه ارشد : بررسی سطح اهانت آمیزی واژه های زبان فارسیپایان نامه ارشد : بررسی عملکرد حلال های مختلف جهت جذب دی اکسیدکربن در برج جذب بستر سیال »