مبانی نظری مدل‌های تعمیم‌یافته خطی

با در نظر گرفتن مدل رگرسیون خطی ساده که به صورت yi=xi β+εi تعریف می‌شود و در آن i=1,…,n، yi متغیر وابسته و xi برداری از k از متغیرهای مستقل یا پیش‌بینی کننده، β برداری 1 در k از پارامترهای نامعین و εi متغیر تصادفی با میانگین صفر است. فرض می‌شود که εi مستقل از هم، با واریانس ثابت σ2 و توزیع نرمال باشند. در این مدل‌ها آزمون فرض به صورت زیر تعریف می‌شود:

بر این اساس مدل رگرسیون خطی دارای  مؤلفه‌های زیر خواهد بود:

1- مؤلفه تصادفی : این مؤلفه توزیع متغیر وابسته را مشخص می‌نماید. در مدل خطی ساده توزیع متغیر وابسته معمولاً نرمال فرض می‌شود. 

2- مؤلفه سیستماتیک : این مؤلفه ترکیب خطی متغیرهای مستقل و ضرایب را به صورت پیش‌بینی‌کننده خطی ηi=xi β  نشان می‌دهد. 

3- تابع پیوند میان مؤلفه تصادفی و سیستماتیک : عبارت xi β=ηi پیش‌بینی کننده خطی نامیده می‌شود. میانگین متغیر پاسخ تابعی از پیش‌بینی‌کننده در تابع پیوند (g(ηi است. برای مدل خطی نرمال، تابع پیوند همانی  است. 

مدل‌های GLM در جهت تعمیم مؤلفه فوق به صورت زیر به وجود آمده‌اند:

1- در صورتی که مؤلفه تصادفی از توزیع غیرنرمال پیروی کند.

2- تابع پیوند همانی نباشد.