مبانی نظری مدلهای تعمیمیافته خطی
با در نظر گرفتن مدل رگرسیون خطی ساده که به صورت yi=xi β+εi تعریف میشود و در آن i=1,…,n، yi متغیر وابسته و xi برداری از k از متغیرهای مستقل یا پیشبینی کننده، β برداری 1 در k از پارامترهای نامعین و εi متغیر تصادفی با میانگین صفر است. فرض میشود که εi مستقل از هم، با واریانس ثابت σ2 و توزیع نرمال باشند. در این مدلها آزمون فرض به صورت زیر تعریف میشود:
بر این اساس مدل رگرسیون خطی دارای مؤلفههای زیر خواهد بود:
1- مؤلفه تصادفی : این مؤلفه توزیع متغیر وابسته را مشخص مینماید. در مدل خطی ساده توزیع متغیر وابسته معمولاً نرمال فرض میشود.
2- مؤلفه سیستماتیک : این مؤلفه ترکیب خطی متغیرهای مستقل و ضرایب را به صورت پیشبینیکننده خطی ηi=xi β نشان میدهد.
3- تابع پیوند میان مؤلفه تصادفی و سیستماتیک : عبارت xi β=ηi پیشبینی کننده خطی نامیده میشود. میانگین متغیر پاسخ تابعی از پیشبینیکننده در تابع پیوند (g(ηi است. برای مدل خطی نرمال، تابع پیوند همانی است.
مدلهای GLM در جهت تعمیم مؤلفه فوق به صورت زیر به وجود آمدهاند:
1- در صورتی که مؤلفه تصادفی از توزیع غیرنرمال پیروی کند.
2- تابع پیوند همانی نباشد.
نرخگذاری بیمه های غیر عمر در واقع هنر قیمت گذاری بیمه نامه با در نظر گرفتن ویژگیهای مختلفی از موضوع مورد بیمه و دارنده بیمه نامه است. مهمترین منبع جهت تصمیم گیریها، داده های گذشته خود شرکت بیمه در صدور وخسارت میباشد. در تجزیه و تحلیل، اکچوئر با تکیه بر این داده ها سعی در یافتن مدلی مناسب است به گونه ای که آن مدل بتواند به خوبی چگونگی وابستگی هزینه های مطالبات بیمه نامه را به تعداد متغیرهای توضیحی شرح دهد. در سال 1990 اکچوئرهای بریتانیا مدلهای خطی تعمیم یافته را(GLMs) به عنوان ابزاری برای تحلیل تعرفه معرفی کردند که اکنون این روش به عنوان متد استانداردی در بسیاری از کشورها به شمار میرود.
مقدمه
مدلهای تعمیمیافتهخطی[1] دسته گستردهای از مدلهای آماری هستند که در برآورد ترکیبات خطی از متغیرهای پیشبینیکننده مورد استفاده قرار میگیرند. علاوه بر این این مدلها در برازش مدلهای رگرسیونی برای متغیرهای وابسته پیوسته، مدلهایی برای نرخها و نسبتها، و متغیرهای دودویی[2]، ترتیبی، چندجملهای و تعداد[3] به کار میروند.
مدلهای تعمیمیافته خطی به دو دلیل بسیار پرکاربرد هستند:
1. این مدلها چارچوب نظری کلی برای بررسی بسیاری از مدلهای آماری مرتبط فراهم میآورند.
2. اجرای مدلهای مختلف را در نرمافزارهای آماری تسهیل میکنند. زیرا از الگوریتم یکسانی میتوان برای برآورد، استنباط و ارزیابی کفایت مدل برای تمام مدلهای تعمیمیافته خطی استفاده نمود.
مدلهای تعمیمیافته خطی امروزه یکی از ابزارهای پرکاربرد در محاسبات اکچوئری است. متغیرهای توضیحی ممکن است پیوسته یا طبقهبندی شده باشند. برای مثال در صورتی که سن واقعی افراد در نظر گرفته شود، متغیر پیوسته است و درصورتی که افراد در ردههای مختلف سنی طبقهبندی شوند برای هر رده کد تعریف میشود، متغیر طبقهبندی شده است و تنها مقادیر کدهای تعریف شده را خواهد گرفت. مدلهای تعمیمیافته خطی ضرایب رگرسیونی مجزایی را برای هر یک از سطوح متغیر طبقهبندی شده ارائه میدهند. در این روش میتوان طبقهای به عنوان طبقه پایه در نظر گرفت و ضرایب رگرسیونی نسبت به آن محاسبه نمود.