Uploaded by Motaz Abd-Alkareem

multiple regression egypt Motaz

advertisement
‫نماذج وتطبيقات في االقتصاد القياس ي‬
‫د‪ .‬معت ـ ــزعبد الكري ـ ـ ـ ــم‬
‫كلية الدراسات االقتصادية والعلوم السياسية‬
‫جامعة اإلسكندرية‬
‫ربيع ‪2021‬‬
‫تحليل االنحداراملتعدد‬
Multiple Regression
Analysis
*
:‫*تم االعتماد بشكل أساس ي في إعداد شرائح هذه املحاضرة على‬
• Gujarati D. N. & Porter D. C., (2009), Basic Econometrics, McGraw-Hill, Irwin, 5th Edition.
‫مقدمة‬
‫‪ o‬يختص االنحداراملتعدد بقياس العالقة بين متغير تابع و أكثر من متغيرمستقل (تفسيري)‪.‬‬
‫‪ o‬الذي يحدد طبيعة املتغير (تابع أم مستقل) هي النظرية االقتصادية أو املالحظة‪.‬‬
‫‪ o‬أبسط صورة لالنحداراملتعدد هي وجود متغيرين مستقلين كما يلي‪:‬‬
‫𝟐𝑿 𝟐𝒃 ‪𝒀 = 𝒂 + 𝒃𝟏 𝑿𝟏 +‬‬
‫‪ o‬سيقتصر تحليلنا على االنحدار الخطي املتعدد ‪ ،Multiple Linear Regression‬حيث املتغير‬
‫التابع دالة خطية في املعلمات (سواء كان املتغير التابع دالة خطية في املتغيرات املستقلة أم ال)‪.‬‬
‫‪ o‬تسمى ( 𝟐𝒃 ‪ )𝒃𝟏 ,‬بمعامالت االنحدار الجزئية ‪.partial regression (slope) coefficients‬‬
‫تفسيرمعامالت االنحدارالجزئية‬
‫‪ o‬افترض أن (𝟒‪ )𝒃𝟏 = +‬فمعنى ذلك أن زيادة املتغير ( 𝟏𝑿) بوحدة واحدة سوف تؤدي إلى زيادة املتغير‬
‫(𝒀) بمقدار (𝟒) وحدات في املتوسط مع بقاء املتغيرات التفسيرية األخرى ثابتة‪ .‬ويمكن التأكد من ذلك من‬
‫خالل الحصول على املشتقة الجزئية األولى لـ (𝒀) بالنسبة لـ ( 𝟏𝑿)‪ ،‬حيث‪:‬‬
‫𝒀𝝏‬
‫𝟏𝒃 =‬
‫𝟏𝑿𝝏‬
‫‪ o‬مع بقاء املتغيرات التفسيرية األخرى ثابتة تعني أن معامالت االنحدار الجزئية تعطي التأثير املباشر (الصافي)‬
‫لكل متغيرمستقل على املتغير التابع‪.‬‬
‫𝟏𝑿‬
‫( ‪.)𝒃𝟏 .‬‬
‫𝒀‬
‫فإذا افترضنا أن املرونة تساوي (𝟓‪ )+‬فيعني ذلك أن‬
‫‪ )𝒃𝟏 ( o‬هي نفسها امليل‪ ،‬أما املرونة فهي‬
‫زيادة ( 𝟏𝑿) بنسبة ‪ %1‬سوف تؤدي إلى زيادة (𝒀) بنسبة ‪ %5‬في املتوسط مع بقاء املتغيرات التفسيرية‬
‫األخرى ثابتة‪.‬‬
‫العالقة الحقيقية والعالقة املقدرة‬
‫العالقة الحقيقية‬
‫العالقة املقدرة‬
‫𝒊𝟐𝑿 𝟐𝒃 ‪𝑬(𝒀) = 𝒂 + 𝒃𝟏 𝑿𝟏𝒊 +‬‬
‫𝒊𝟐𝑿 𝟐 ˆ𝒃 ‪𝒀ˆ 𝒊 = 𝒂ˆ + 𝒃ˆ𝟏 𝑿𝟏𝒊 +‬‬
‫𝒊𝒖 ‪𝒀𝒊 = 𝒂 + 𝒃𝟏 𝑿𝟏𝒊 + 𝒃𝟐 𝑿𝟐𝒊 +‬‬
‫)𝒀(𝑬 ‪𝒖𝒊 = 𝒀𝒊 −‬‬
‫𝒊𝒆 ‪𝒀𝒊 = 𝒂ˆ + 𝒃ˆ𝟏 𝑿𝟏𝒊 + 𝒃ˆ𝟐 𝑿𝟐𝒊 +‬‬
‫𝒊 ˆ𝒀 ‪𝒆𝒊 = 𝒀𝒊 −‬‬
‫تقديرمعلمات نموذج االنحدارالخطي املتعدد باستخدام طريقة‬
‫املربعات الصغرى العادية ‪OLS‬‬
‫‪ o‬وفقا لهذه الطريقة فإن أفضل خط (مسطح) انحدار هو ذلك الخط الذي يجعل مجموع مربعات‬
‫انحر افات القيم املقدرة للمتغيرالتابع عن القيم املشاهدة له ) 𝒊𝟐𝒆 ‪ (σ‬عند حدها األدن ى‪.‬‬
‫‪ o‬ويعني ذلك أن املطلوب هو الحصول على قيمة كل من ) 𝟐ˆ𝒃 ‪ˆ ˆ𝟏 ,‬‬
‫𝒃‪ (𝒂,‬التي تؤدي إلى تدنية هذا املجموع‪.‬‬
‫‪ o‬وبالتالي الشرط الضروري للتدنية هو أن املشتقة الجزئية األولى ملجموع مربعات االنحر افات بالنسبة‬
‫للمقدرات تساوي صفرا‪ ،‬أي أن‪:‬‬
‫𝟐‬
‫𝟐‬
‫𝟐‬
‫𝒊𝒆 ‪𝝏 σ‬‬
‫𝒊𝒆 ‪𝝏 σ‬‬
‫𝒊𝒆 ‪𝝏 σ‬‬
‫𝟎=‬
‫𝟎=‬
‫𝟎=‬
‫ˆ𝒂 𝝏‬
‫𝟏ˆ𝒃 𝝏‬
‫𝟐ˆ𝒃 𝝏‬
‫‪ o‬مقدرات املربعات الصغرى‪:‬‬
‫𝟐‬
‫‪σ‬‬
‫‪σ‬‬
‫𝒚‬
‫𝒙‬
‫𝒙‬
‫𝒊𝟏 𝒊‬
‫𝒊𝟐𝒙 𝒊𝟏𝒙 ‪𝟐𝒊 − σ 𝒚𝒊 𝒙𝟐𝒊 σ‬‬
‫ˆ‬
‫= 𝟏𝒃‬
‫𝟐 𝒊𝟐𝒙 𝒊𝟏𝒙 ‪σ 𝒙𝟐𝟏𝒊 σ 𝒙𝟐𝟐𝒊 − σ‬‬
‫𝟐‬
‫‪σ‬‬
‫‪σ‬‬
‫𝒚‬
‫𝒙‬
‫𝒙‬
‫𝒊𝟐 𝒊‬
‫𝒊𝟐𝒙 𝒊𝟏𝒙 ‪𝟏𝒊 − σ 𝒚𝒊 𝒙𝟏𝒊 σ‬‬
‫ˆ‬
‫= 𝟐𝒃‬
‫𝟐 𝒊𝟐𝒙 𝒊𝟏𝒙 ‪σ 𝒙𝟐𝟏𝒊 σ 𝒙𝟐𝟐𝒊 − σ‬‬
‫𝟐 ̅𝑿 𝟐 ˆ𝒃 ‪𝒂ˆ = 𝒀̅ − 𝒃ˆ 𝟏 𝑿̅ 𝟏 −‬‬
‫مالحظات‬
‫‪ o‬خط (مسطح) االنحدار يمر باألوساط الحسابية‪̅ X̅ , X̅ ( :‬‬
‫‪.)Y,‬‬
‫‪1‬‬
‫‪2‬‬
‫‪ o‬بالنسبة للمتغيرالتابع فإن الوسط الحسابي للقيم املقدرة يساوي الوسط الحسابي للقيم الفعلية‪ ،‬أي أن‪:‬‬
‫̅𝒀 = ̅𝒀ˆ‬
‫‪ o‬افتراضات االنحدارالخطي في حالة االنحدار املتعدد هي نفسها في حالة االنحدارالبسيط‪.‬‬
‫‪ o‬خصائص مقدرات ‪ OLS‬في حالة االنحدار املتعدد هي نفسها في حالة االنحدار البسيط‪.‬‬
‫تقييم نموذج‬
‫االنحدارالخطي املتعدد‬
‫أوال‪ -‬جودة التوفيق (باستخدام معامل التحديد املتعدد)‬
‫‪ o‬يستخدم معامل التحديد املتعدد ‪ multiple coefficient of determination‬في قياس جودة‬
‫توفيق ‪ goodness of fit‬نموذج االنحدار املتعدد‪.‬‬
‫‪ o‬وهو عبارة عن نسبة التغيرات املفسرة إلى التغيرات الكلية‪.‬‬
‫ˆ‬
‫ˆ‬
‫‪σ‬‬
‫𝑺𝑺𝑹‬
‫𝑺𝑺𝑬‬
‫𝒃‬
‫𝒚‬
‫𝒙‬
‫‪+‬‬
‫𝒃‬
‫𝟏‬
‫𝒊‬
‫𝒊𝟏‬
‫𝒊𝟐𝒙 𝒊𝒚 ‪𝟐 σ‬‬
‫𝟐‬
‫= 𝑹‬
‫‪=𝟏−‬‬
‫=‬
‫𝑺𝑺𝑻‬
‫𝑺𝑺𝑻‬
‫𝒊𝟐𝒚 ‪σ‬‬
‫‪ o‬املعنى‪ :‬افترض أن قيمته تساوي (‪ )0.96‬فيعنى ذلك أن ‪ %96‬من التغير في املتغير التابع يمكن تفسيره بالتغير‬
‫في املتغيرات املستقلة معا‪ .‬بعبارة أخرى‪ ،‬املتغيرات املستقلة مجتمعة تفسر ‪ %96‬من التغيرفي املتغير التابع‪.‬‬
‫‪ o‬يعاب على معامل التحديد املتعدد أنه يتأثربعدد املتغيرات التفسيرية حيث ‪ -‬غالبا ‪ -‬تزداد قيمته بزيادة عدد‬
‫املتغيرات التفسيرية‪.‬‬
‫‪ o‬لتالش ي هذا القصور تم تعديل هذا املعامل بحيث ال يتأثربعدد املتغيرات التفسيرية وسمي بمعامل التحديد‬
‫املعدل ‪ Adjusted R2‬ويأخذ الصيغة التالي‪:‬‬
‫𝟏‪𝒏−‬‬
‫𝟐‬
‫𝟐‬
‫̅‬
‫) 𝑹 ‪𝑹 = 𝟏 − (𝟏 −‬‬
‫𝒌‪𝒏−‬‬
‫‪ o‬ويالحظ أن‪ )𝑹̅ 𝟐 < 𝑹𝟐 ( :‬وذلك ألن قيمة (𝟏 > 𝒌) وكلما زاد عدد املتغيرات التفسيرية زاد الفارق بينهما‪.‬‬
‫ثانيا‪ -‬اختبارات املعنوية اإلحصائية (باستخدام اختبار ‪)t‬‬
‫‪ o‬يستخدم اختبار(‪ )t‬الختباراملعنوية اإلحصائية لكل مقدرعلى حدة‪.‬‬
‫‪ o‬صياغة الفروض‪:‬‬
‫𝟎 = 𝟏𝒃 ‪𝑯𝟎 :‬‬
‫𝟎 ≠ 𝟏𝒃 ‪𝑯𝟏 :‬‬
‫‪ o‬حساب إحصائية االختبار ‪:test statistic‬‬
‫(وتسمى أيضا بـ ‪ t‬املحسوبة)‬
‫‪ o‬القرار‪:‬‬
‫ˆ‬
‫𝒃‪ˆ −‬‬
‫ˆ‬
‫) ˆ‬
‫𝒃‬
‫‪−‬‬
‫𝒃(𝑬‬
‫𝒃‬
‫𝒃‬
‫𝟏‬
‫𝟏‬
‫𝟏‬
‫𝟏‬
‫𝟏‬
‫∗‬
‫= 𝒕‬
‫=‬
‫=‬
‫𝟏ˆ𝒃𝒔‬
‫𝟏ˆ𝒃𝒔‬
‫𝟏ˆ𝒃𝒔‬
‫إذا كان‬
‫القرار‬
‫𝟐‪𝒕∗ > 𝐭 𝛂/‬‬
‫𝛂 < 𝒆𝒖𝒍𝒂𝒗 ‪𝒑 −‬‬
‫رفض فرض العدم وقبول الفرض البديل‬
‫𝟐‪𝒕∗ ≤ 𝐭 𝛂/‬‬
‫𝛂 ≥ 𝒆𝒖𝒍𝒂𝒗 ‪𝒑 −‬‬
‫ال يمكن رفض فرض العدم‬
‫املعنى‬
‫القيمة املقدرة لها معنوية إحصائية‬
‫القيمة املقدرة ليس لها معنوية إحصائية‬
‫‪ o‬ويمكن الحصول على فترات الثقة لكل معلمة على حدة على النحو التالي‪:‬‬
‫) 𝟏ˆ𝒃𝒔( )∝(𝒕 ‪𝒃ˆ 𝟏 −𝒕(∝) 𝒔𝒃ˆ𝟏 < 𝒃𝟏 < 𝒃ˆ 𝟏 +‬‬
‫𝟐‬
‫𝟐‬
‫) 𝟏 ˆ𝒃𝒔( )∝(𝒕 ‪𝒃ˆ 𝟏 ±‬‬
‫𝟐‬
‫ثانيا‪ -‬اختبارات املعنوية اإلحصائية (باستخدام اختبار ‪)F‬‬
‫‪ o‬يستخدم اختبار(‪ )F‬الختباراملعنوية اإلحصائية الكلية ‪ overall significance‬لالنحداراملتعدد‪.‬‬
‫‪(ANOVA) table‬‬
‫‪F‬‬
‫𝑅𝑆𝑀‬
‫=‬
‫𝐸𝑆𝑀‬
‫‪MS‬‬
‫∗𝐹‬
‫𝑆𝑆𝑅‬
‫= 𝑅𝑆𝑀‬
‫‪𝑘−1‬‬
‫𝑆𝑆𝐸‬
‫= 𝐸𝑆𝑀‬
‫𝑘‪𝑛−‬‬
‫‪Degrees of‬‬
‫)‪Freedom (df‬‬
‫‪𝑘 −1‬‬
‫‪Sum of‬‬
‫)‪Squares (SS‬‬
‫‪RSS‬‬
‫‪Regression‬‬
‫‪𝑛−k‬‬
‫‪ESS‬‬
‫‪Error‬‬
‫‪𝑛 −1‬‬
‫‪TSS‬‬
‫‪Total‬‬
‫‪ o‬صياغة الفروض‪:‬‬
‫(يالحظ أن فرض العدم فرض مشترك بأن معامالت االنحدار الجزئية آنيا (معا) تساوي صفرا)‬
‫‪ o‬حساب إحصائية االختبار ‪:test statistic‬‬
‫(وتسمى أيضا بـ ‪ F‬املحسوبة)‬
‫‪ o‬القرار‪:‬‬
‫القرار‬
‫إذا كان‬
‫)𝒌‪ 𝑭∗ ≥ 𝑭(𝜶,𝒌−𝟏,𝒏−‬رفض فرض العدم‬
‫𝜶 ≤ 𝒆𝒖𝒍𝒂𝒗 ‪ 𝒑 −‬وقبول الفرض البديل‬
‫)𝒌‪ 𝑭∗ < 𝑭(𝜶,𝒌−𝟏,𝒏−‬ال يمكن رفض فرض‬
‫العدم‬
‫𝜶 > 𝒆𝒖𝒍𝒂𝒗 ‪𝒑 −‬‬
‫𝟎 = 𝟐𝒃 = 𝟏𝒃 ‪𝑯𝟎 :‬‬
‫ليست كل املعلمات تساوي صفرا ‪𝑯𝟏 :‬‬
‫𝑹𝑺𝑴‬
‫∗‬
‫= 𝑭‬
‫𝑬𝑺𝑴‬
‫املعنى‬
‫العالقة الكلية بين املتغير التابع واملتغيرات‬
‫املستقلة مجتمعة معنوية إحصائيا‬
‫العالقة الكلية بين املتغير التابع واملتغيرات‬
‫املستقلة مجتمعة ليست معنوية إحصائيا‬
‫مالحظة‬
‫‪ o‬قد يقودنا اختبار (‪ )F‬إلى رفض فرض العدم بأن جميع معامالت االنحدار الجزئية تساوي‬
‫صفرا‪ .‬ومع ذلك‪ ،‬باستخدام اختبار (‪ )t‬قد يتم قبول فرض العدم بأن أحد معامالت االنحدار‬
‫الجزئية يساوي صفرا‪.‬‬
‫‪ o‬بصيغة أخرى‪ ،‬إذا كانت املتغيرات التفسيرية مجتمعة لها تأثير معنوي على املتغير التابع‪ ،‬فإن‬
‫هذا ال يعني بالضرورة أن كل متغيرتفسيري على حدة له تأثيرمعنوي على املتغيرالتابع‪.‬‬
‫تطبيق‬
‫‪ o‬من البيانات التي تم إعطاؤها لك والتي تخص ‪ 64‬دولة لعام ‪ 2010‬قم بتقديرالنموذج التالي‪:‬‬
‫حيث‪:‬‬
‫𝒊𝒖 ‪𝑪𝑴𝒊 = 𝒂 + 𝒃𝟏 𝑷𝑮𝑵𝑷𝒊 + 𝒃𝟐 𝑭𝑳𝑹𝒊 +‬‬
‫‪ )𝑪𝑴( o‬ترمز إلى معدل وفيات األطفال (‪ ،)Child Mortality‬وهو عبارة عن عدد وفيات األطفال قبل سن‬
‫الخامسة لكل ألف مولود حي‪.‬‬
‫‪ )𝑷𝑮𝑵𝑷( o‬ترمزإلى نصيب الفرد من الناتج القومي اإلجمالي (‪ ،)Per capita GNP‬مقيسا بالدوالر‪.‬‬
‫‪ )𝑭𝑳𝑹( o‬ترمزإلى معدل معرفة القراءة والكتابة للمرأة (‪ ،)Female Literacy Rate‬مقيسا بالنسبة املئوية‪.‬‬
‫النتائج‬
‫‪෣‬‬
‫𝑪‬
‫𝒊𝑹𝑳𝑭 𝟔𝟏𝟑𝟐 ‪𝑴𝒊 = 𝟐𝟔𝟑. 𝟔𝟒𝟏𝟓 − 𝟎. 𝟎𝟎𝟓𝟔 𝑷𝑮𝑵𝑷𝒊 − 𝟐.‬‬
‫)‪(11.5932) (0.0020‬‬
‫)‪(0.2099‬‬
‫‪R2= 0.7077‬‬
‫التفسير‪:‬‬
‫‪ o‬زيادة نصيب الفرد من الناتج القومي اإلجمالي بمقدار دوالر سوف تؤدي إلى انخفاض معدل وفيات‬
‫األطفال (عدد وفيات األطفال قبل سن الخامسة لكل ألف مولود حي) بحوالي ( 𝟔𝟓𝟎𝟎‪ )𝟎.‬طفل في‬
‫املتوسط مع ثبات باقي املتغيرات التفسيرية‪.‬‬
‫‪ o‬زيادة معدل معرفة القراءة والكتابة للمرأة بمقدار نقطة مئوية واحدة سوف تؤدي إلى انخفاض معدل‬
‫وفيات األطفال (عدد وفيات األطفال قبل سن الخامسة لكل ألف مولود حي) بحوالي (𝟔𝟏𝟑𝟐‪)𝟐.‬‬
‫طفل في املتوسط مع ثبات باقي املتغيرات التفسيرية‪.‬‬
‫النتائج‬
‫‪ o‬يتضح من قيمة معامل التحديد أن ‪ %70.8‬من التغيرات في معدل وفيات األطفال يمكن تفسيرها ب ـ (𝑷𝑵𝑮𝑷) و‬
‫(𝑹𝑳𝑭)‪.‬‬
‫‪ o‬بالنسبة ملعامل االنحدار الجزئي الخاص بـ (𝑷𝑵𝑮𝑷) يتضح أن ()𝟏𝟎‪ ،)𝒑 − 𝒗𝒂𝒍𝒖𝒆 𝟎.𝟎𝟎𝟕 < 𝜶 (𝟎.‬ومن ثم‬
‫يتم رفض فرض العدم القائل بأن معلمة املجتمع تساوي صفرا‪ ،‬وهو ما يعني أن (𝑷𝑵𝑮𝑷) له تأثير معنوي على معدل‬
‫وفيات األطفال (عند مستوى معنوية ‪ ،)%1‬مع بقاء املتغيرات التفسيرية األخرى ثابتة‪.‬‬
‫‪ o‬بالنسبة ملعامل االنحدار الجزئي الخاص بـ (𝑹𝑳𝑭) يتضح أن ()𝟏𝟎‪ ،)𝒑 − 𝒗𝒂𝒍𝒖𝒆 𝟎.𝟎𝟎𝟎 < 𝜶 (𝟎.‬ومن ثم يتم‬
‫رفض فرض العدم القائل بأن معلمة املجتمع تساوي صفرا‪ ،‬وهو ما يعني أن (𝑹𝑳𝑭) له تأثير معنوي على معدل وفيات‬
‫األطفال (عند مستوى معنوية ‪ ،)%1‬مع بقاء املتغيرات التفسيرية األخرى ثابتة‪.‬‬
‫‪ o‬بالنسبة إلحصائية (𝑭) يتضح أن ()𝟏𝟎‪ ،)𝒑 − 𝒗𝒂𝒍𝒖𝒆 𝟎.𝟎𝟎𝟎 < 𝜶 (𝟎.‬ومن ثم يتم رفض فرض العدم القائل‬
‫بأن جميع معلمات املجتمع تساوي صفرا‪ ،‬وهو ما يعني أن العالقة الكلية بين معدل وفيات األطفال واملتغيرات التفسيرية‬
‫بالنموذج مجتمعة تكون معنوية (عند مستوى معنوية ‪.)%1‬‬
‫اختبار()‪)Jarque-Bera (JB‬‬
‫بما أن ()𝟓𝟎‪ )𝒑 − 𝒗𝒂𝒍𝒖𝒆 𝟎.𝟕𝟓𝟔 > 𝜶 (𝟎.‬فإنه ال يمكن رفض العدم (عند مستوى معنوية ‪ ،)%5‬وهو ما يعني‬
‫أن حد الخطأ العشوائي يتبع توزيعا معتدال‪.‬‬
‫مراجعة‬
‫االختبارالثالث‬
‫شكراً‬
Download