نماذج وتطبيقات في االقتصاد القياس ي د .معت ـ ــزعبد الكري ـ ـ ـ ــم كلية الدراسات االقتصادية والعلوم السياسية جامعة اإلسكندرية ربيع 2021 تحليل االنحداراملتعدد Multiple Regression Analysis * :*تم االعتماد بشكل أساس ي في إعداد شرائح هذه املحاضرة على • Gujarati D. N. & Porter D. C., (2009), Basic Econometrics, McGraw-Hill, Irwin, 5th Edition. مقدمة oيختص االنحداراملتعدد بقياس العالقة بين متغير تابع و أكثر من متغيرمستقل (تفسيري). oالذي يحدد طبيعة املتغير (تابع أم مستقل) هي النظرية االقتصادية أو املالحظة. oأبسط صورة لالنحداراملتعدد هي وجود متغيرين مستقلين كما يلي: 𝟐𝑿 𝟐𝒃 𝒀 = 𝒂 + 𝒃𝟏 𝑿𝟏 + oسيقتصر تحليلنا على االنحدار الخطي املتعدد ،Multiple Linear Regressionحيث املتغير التابع دالة خطية في املعلمات (سواء كان املتغير التابع دالة خطية في املتغيرات املستقلة أم ال). oتسمى ( 𝟐𝒃 )𝒃𝟏 ,بمعامالت االنحدار الجزئية .partial regression (slope) coefficients تفسيرمعامالت االنحدارالجزئية oافترض أن (𝟒 )𝒃𝟏 = +فمعنى ذلك أن زيادة املتغير ( 𝟏𝑿) بوحدة واحدة سوف تؤدي إلى زيادة املتغير (𝒀) بمقدار (𝟒) وحدات في املتوسط مع بقاء املتغيرات التفسيرية األخرى ثابتة .ويمكن التأكد من ذلك من خالل الحصول على املشتقة الجزئية األولى لـ (𝒀) بالنسبة لـ ( 𝟏𝑿) ،حيث: 𝒀𝝏 𝟏𝒃 = 𝟏𝑿𝝏 oمع بقاء املتغيرات التفسيرية األخرى ثابتة تعني أن معامالت االنحدار الجزئية تعطي التأثير املباشر (الصافي) لكل متغيرمستقل على املتغير التابع. 𝟏𝑿 ( .)𝒃𝟏 . 𝒀 فإذا افترضنا أن املرونة تساوي (𝟓 )+فيعني ذلك أن )𝒃𝟏 ( oهي نفسها امليل ،أما املرونة فهي زيادة ( 𝟏𝑿) بنسبة %1سوف تؤدي إلى زيادة (𝒀) بنسبة %5في املتوسط مع بقاء املتغيرات التفسيرية األخرى ثابتة. العالقة الحقيقية والعالقة املقدرة العالقة الحقيقية العالقة املقدرة 𝒊𝟐𝑿 𝟐𝒃 𝑬(𝒀) = 𝒂 + 𝒃𝟏 𝑿𝟏𝒊 + 𝒊𝟐𝑿 𝟐 ˆ𝒃 𝒀ˆ 𝒊 = 𝒂ˆ + 𝒃ˆ𝟏 𝑿𝟏𝒊 + 𝒊𝒖 𝒀𝒊 = 𝒂 + 𝒃𝟏 𝑿𝟏𝒊 + 𝒃𝟐 𝑿𝟐𝒊 + )𝒀(𝑬 𝒖𝒊 = 𝒀𝒊 − 𝒊𝒆 𝒀𝒊 = 𝒂ˆ + 𝒃ˆ𝟏 𝑿𝟏𝒊 + 𝒃ˆ𝟐 𝑿𝟐𝒊 + 𝒊 ˆ𝒀 𝒆𝒊 = 𝒀𝒊 − تقديرمعلمات نموذج االنحدارالخطي املتعدد باستخدام طريقة املربعات الصغرى العادية OLS oوفقا لهذه الطريقة فإن أفضل خط (مسطح) انحدار هو ذلك الخط الذي يجعل مجموع مربعات انحر افات القيم املقدرة للمتغيرالتابع عن القيم املشاهدة له ) 𝒊𝟐𝒆 (σعند حدها األدن ى. oويعني ذلك أن املطلوب هو الحصول على قيمة كل من ) 𝟐ˆ𝒃 ˆ ˆ𝟏 , 𝒃 (𝒂,التي تؤدي إلى تدنية هذا املجموع. oوبالتالي الشرط الضروري للتدنية هو أن املشتقة الجزئية األولى ملجموع مربعات االنحر افات بالنسبة للمقدرات تساوي صفرا ،أي أن: 𝟐 𝟐 𝟐 𝒊𝒆 𝝏 σ 𝒊𝒆 𝝏 σ 𝒊𝒆 𝝏 σ 𝟎= 𝟎= 𝟎= ˆ𝒂 𝝏 𝟏ˆ𝒃 𝝏 𝟐ˆ𝒃 𝝏 oمقدرات املربعات الصغرى: 𝟐 σ σ 𝒚 𝒙 𝒙 𝒊𝟏 𝒊 𝒊𝟐𝒙 𝒊𝟏𝒙 𝟐𝒊 − σ 𝒚𝒊 𝒙𝟐𝒊 σ ˆ = 𝟏𝒃 𝟐 𝒊𝟐𝒙 𝒊𝟏𝒙 σ 𝒙𝟐𝟏𝒊 σ 𝒙𝟐𝟐𝒊 − σ 𝟐 σ σ 𝒚 𝒙 𝒙 𝒊𝟐 𝒊 𝒊𝟐𝒙 𝒊𝟏𝒙 𝟏𝒊 − σ 𝒚𝒊 𝒙𝟏𝒊 σ ˆ = 𝟐𝒃 𝟐 𝒊𝟐𝒙 𝒊𝟏𝒙 σ 𝒙𝟐𝟏𝒊 σ 𝒙𝟐𝟐𝒊 − σ 𝟐 ̅𝑿 𝟐 ˆ𝒃 𝒂ˆ = 𝒀̅ − 𝒃ˆ 𝟏 𝑿̅ 𝟏 − مالحظات oخط (مسطح) االنحدار يمر باألوساط الحسابية̅ X̅ , X̅ ( : .)Y, 1 2 oبالنسبة للمتغيرالتابع فإن الوسط الحسابي للقيم املقدرة يساوي الوسط الحسابي للقيم الفعلية ،أي أن: ̅𝒀 = ̅𝒀ˆ oافتراضات االنحدارالخطي في حالة االنحدار املتعدد هي نفسها في حالة االنحدارالبسيط. oخصائص مقدرات OLSفي حالة االنحدار املتعدد هي نفسها في حالة االنحدار البسيط. تقييم نموذج االنحدارالخطي املتعدد أوال -جودة التوفيق (باستخدام معامل التحديد املتعدد) oيستخدم معامل التحديد املتعدد multiple coefficient of determinationفي قياس جودة توفيق goodness of fitنموذج االنحدار املتعدد. oوهو عبارة عن نسبة التغيرات املفسرة إلى التغيرات الكلية. ˆ ˆ σ 𝑺𝑺𝑹 𝑺𝑺𝑬 𝒃 𝒚 𝒙 + 𝒃 𝟏 𝒊 𝒊𝟏 𝒊𝟐𝒙 𝒊𝒚 𝟐 σ 𝟐 = 𝑹 =𝟏− = 𝑺𝑺𝑻 𝑺𝑺𝑻 𝒊𝟐𝒚 σ oاملعنى :افترض أن قيمته تساوي ( )0.96فيعنى ذلك أن %96من التغير في املتغير التابع يمكن تفسيره بالتغير في املتغيرات املستقلة معا .بعبارة أخرى ،املتغيرات املستقلة مجتمعة تفسر %96من التغيرفي املتغير التابع. oيعاب على معامل التحديد املتعدد أنه يتأثربعدد املتغيرات التفسيرية حيث -غالبا -تزداد قيمته بزيادة عدد املتغيرات التفسيرية. oلتالش ي هذا القصور تم تعديل هذا املعامل بحيث ال يتأثربعدد املتغيرات التفسيرية وسمي بمعامل التحديد املعدل Adjusted R2ويأخذ الصيغة التالي: 𝟏𝒏− 𝟐 𝟐 ̅ ) 𝑹 𝑹 = 𝟏 − (𝟏 − 𝒌𝒏− oويالحظ أن )𝑹̅ 𝟐 < 𝑹𝟐 ( :وذلك ألن قيمة (𝟏 > 𝒌) وكلما زاد عدد املتغيرات التفسيرية زاد الفارق بينهما. ثانيا -اختبارات املعنوية اإلحصائية (باستخدام اختبار )t oيستخدم اختبار( )tالختباراملعنوية اإلحصائية لكل مقدرعلى حدة. oصياغة الفروض: 𝟎 = 𝟏𝒃 𝑯𝟎 : 𝟎 ≠ 𝟏𝒃 𝑯𝟏 : oحساب إحصائية االختبار :test statistic (وتسمى أيضا بـ tاملحسوبة) oالقرار: ˆ 𝒃ˆ − ˆ ) ˆ 𝒃 − 𝒃(𝑬 𝒃 𝒃 𝟏 𝟏 𝟏 𝟏 𝟏 ∗ = 𝒕 = = 𝟏ˆ𝒃𝒔 𝟏ˆ𝒃𝒔 𝟏ˆ𝒃𝒔 إذا كان القرار 𝟐𝒕∗ > 𝐭 𝛂/ 𝛂 < 𝒆𝒖𝒍𝒂𝒗 𝒑 − رفض فرض العدم وقبول الفرض البديل 𝟐𝒕∗ ≤ 𝐭 𝛂/ 𝛂 ≥ 𝒆𝒖𝒍𝒂𝒗 𝒑 − ال يمكن رفض فرض العدم املعنى القيمة املقدرة لها معنوية إحصائية القيمة املقدرة ليس لها معنوية إحصائية oويمكن الحصول على فترات الثقة لكل معلمة على حدة على النحو التالي: ) 𝟏ˆ𝒃𝒔( )∝(𝒕 𝒃ˆ 𝟏 −𝒕(∝) 𝒔𝒃ˆ𝟏 < 𝒃𝟏 < 𝒃ˆ 𝟏 + 𝟐 𝟐 ) 𝟏 ˆ𝒃𝒔( )∝(𝒕 𝒃ˆ 𝟏 ± 𝟐 ثانيا -اختبارات املعنوية اإلحصائية (باستخدام اختبار )F oيستخدم اختبار( )Fالختباراملعنوية اإلحصائية الكلية overall significanceلالنحداراملتعدد. (ANOVA) table F 𝑅𝑆𝑀 = 𝐸𝑆𝑀 MS ∗𝐹 𝑆𝑆𝑅 = 𝑅𝑆𝑀 𝑘−1 𝑆𝑆𝐸 = 𝐸𝑆𝑀 𝑘𝑛− Degrees of )Freedom (df 𝑘 −1 Sum of )Squares (SS RSS Regression 𝑛−k ESS Error 𝑛 −1 TSS Total oصياغة الفروض: (يالحظ أن فرض العدم فرض مشترك بأن معامالت االنحدار الجزئية آنيا (معا) تساوي صفرا) oحساب إحصائية االختبار :test statistic (وتسمى أيضا بـ Fاملحسوبة) oالقرار: القرار إذا كان )𝒌 𝑭∗ ≥ 𝑭(𝜶,𝒌−𝟏,𝒏−رفض فرض العدم 𝜶 ≤ 𝒆𝒖𝒍𝒂𝒗 𝒑 −وقبول الفرض البديل )𝒌 𝑭∗ < 𝑭(𝜶,𝒌−𝟏,𝒏−ال يمكن رفض فرض العدم 𝜶 > 𝒆𝒖𝒍𝒂𝒗 𝒑 − 𝟎 = 𝟐𝒃 = 𝟏𝒃 𝑯𝟎 : ليست كل املعلمات تساوي صفرا 𝑯𝟏 : 𝑹𝑺𝑴 ∗ = 𝑭 𝑬𝑺𝑴 املعنى العالقة الكلية بين املتغير التابع واملتغيرات املستقلة مجتمعة معنوية إحصائيا العالقة الكلية بين املتغير التابع واملتغيرات املستقلة مجتمعة ليست معنوية إحصائيا مالحظة oقد يقودنا اختبار ( )Fإلى رفض فرض العدم بأن جميع معامالت االنحدار الجزئية تساوي صفرا .ومع ذلك ،باستخدام اختبار ( )tقد يتم قبول فرض العدم بأن أحد معامالت االنحدار الجزئية يساوي صفرا. oبصيغة أخرى ،إذا كانت املتغيرات التفسيرية مجتمعة لها تأثير معنوي على املتغير التابع ،فإن هذا ال يعني بالضرورة أن كل متغيرتفسيري على حدة له تأثيرمعنوي على املتغيرالتابع. تطبيق oمن البيانات التي تم إعطاؤها لك والتي تخص 64دولة لعام 2010قم بتقديرالنموذج التالي: حيث: 𝒊𝒖 𝑪𝑴𝒊 = 𝒂 + 𝒃𝟏 𝑷𝑮𝑵𝑷𝒊 + 𝒃𝟐 𝑭𝑳𝑹𝒊 + )𝑪𝑴( oترمز إلى معدل وفيات األطفال ( ،)Child Mortalityوهو عبارة عن عدد وفيات األطفال قبل سن الخامسة لكل ألف مولود حي. )𝑷𝑮𝑵𝑷( oترمزإلى نصيب الفرد من الناتج القومي اإلجمالي ( ،)Per capita GNPمقيسا بالدوالر. )𝑭𝑳𝑹( oترمزإلى معدل معرفة القراءة والكتابة للمرأة ( ،)Female Literacy Rateمقيسا بالنسبة املئوية. النتائج 𝑪 𝒊𝑹𝑳𝑭 𝟔𝟏𝟑𝟐 𝑴𝒊 = 𝟐𝟔𝟑. 𝟔𝟒𝟏𝟓 − 𝟎. 𝟎𝟎𝟓𝟔 𝑷𝑮𝑵𝑷𝒊 − 𝟐. )(11.5932) (0.0020 )(0.2099 R2= 0.7077 التفسير: oزيادة نصيب الفرد من الناتج القومي اإلجمالي بمقدار دوالر سوف تؤدي إلى انخفاض معدل وفيات األطفال (عدد وفيات األطفال قبل سن الخامسة لكل ألف مولود حي) بحوالي ( 𝟔𝟓𝟎𝟎 )𝟎.طفل في املتوسط مع ثبات باقي املتغيرات التفسيرية. oزيادة معدل معرفة القراءة والكتابة للمرأة بمقدار نقطة مئوية واحدة سوف تؤدي إلى انخفاض معدل وفيات األطفال (عدد وفيات األطفال قبل سن الخامسة لكل ألف مولود حي) بحوالي (𝟔𝟏𝟑𝟐)𝟐. طفل في املتوسط مع ثبات باقي املتغيرات التفسيرية. النتائج oيتضح من قيمة معامل التحديد أن %70.8من التغيرات في معدل وفيات األطفال يمكن تفسيرها ب ـ (𝑷𝑵𝑮𝑷) و (𝑹𝑳𝑭). oبالنسبة ملعامل االنحدار الجزئي الخاص بـ (𝑷𝑵𝑮𝑷) يتضح أن ()𝟏𝟎 ،)𝒑 − 𝒗𝒂𝒍𝒖𝒆 𝟎.𝟎𝟎𝟕 < 𝜶 (𝟎.ومن ثم يتم رفض فرض العدم القائل بأن معلمة املجتمع تساوي صفرا ،وهو ما يعني أن (𝑷𝑵𝑮𝑷) له تأثير معنوي على معدل وفيات األطفال (عند مستوى معنوية ،)%1مع بقاء املتغيرات التفسيرية األخرى ثابتة. oبالنسبة ملعامل االنحدار الجزئي الخاص بـ (𝑹𝑳𝑭) يتضح أن ()𝟏𝟎 ،)𝒑 − 𝒗𝒂𝒍𝒖𝒆 𝟎.𝟎𝟎𝟎 < 𝜶 (𝟎.ومن ثم يتم رفض فرض العدم القائل بأن معلمة املجتمع تساوي صفرا ،وهو ما يعني أن (𝑹𝑳𝑭) له تأثير معنوي على معدل وفيات األطفال (عند مستوى معنوية ،)%1مع بقاء املتغيرات التفسيرية األخرى ثابتة. oبالنسبة إلحصائية (𝑭) يتضح أن ()𝟏𝟎 ،)𝒑 − 𝒗𝒂𝒍𝒖𝒆 𝟎.𝟎𝟎𝟎 < 𝜶 (𝟎.ومن ثم يتم رفض فرض العدم القائل بأن جميع معلمات املجتمع تساوي صفرا ،وهو ما يعني أن العالقة الكلية بين معدل وفيات األطفال واملتغيرات التفسيرية بالنموذج مجتمعة تكون معنوية (عند مستوى معنوية .)%1 اختبار())Jarque-Bera (JB بما أن ()𝟓𝟎 )𝒑 − 𝒗𝒂𝒍𝒖𝒆 𝟎.𝟕𝟓𝟔 > 𝜶 (𝟎.فإنه ال يمكن رفض العدم (عند مستوى معنوية ،)%5وهو ما يعني أن حد الخطأ العشوائي يتبع توزيعا معتدال. مراجعة االختبارالثالث شكراً