انحياز المتغير المحذوف
عودة للموسوعةيقع انحياز المتغير المحذوف (omitted variable bias ويعهد اختصارًا بـOVB) في فهم الإحصاء عندما يتجاهل النموذج الإحصائي متغيرًا واحدًا أوأكثر ذا صلة بالظاهرة المدروسة. وقد يؤدي ذلك الانحياز إلى إيعاز تأثير المتغير المحذوف إلى المتغيرات الأخرى الخاضعة للملاحظة. وبصفة خاصة، يعبر انحياز المتغير المفقود عن الخطأ الذي يظهر في تقدير بارامترات الانحدار الخطي، وذلك عندما يتجاهل النموذج المستخدم متغيرًا مستقلًا يرتبط بكلٍ من المتغير التابع ومتغير مستقل واحد على الأقل من بين المتغيرات المتضمنة.
في الانحدار الخطي
شرح مبسط
فلنفترض حتى العلاقة بين السبب والنتيجة يعبر عنها بالعلاقة التالية:
حيث (a) و(b) و(c) هم بارامترات الدالة، و(y) هوالمتغير التابع، و(x) و(z) هما المتغيران المستقلان، و(u) هوالحد الذي يعبر عن الخطأ. ونريد حتى نتبين مدى تأثير (x) على (y) (أي أننا نحاول تقدير قيمة البارامتر b). ويقع انحياز المتغير المحذوف في هذه الحالة عند تحقق هذين الشرطين:
- وجود ارتباط واضح بين المتغير المحذوف والمتغير التابع (أي حتى معامل الانحدار لا يساوي صفر).
- أن يرتبط المتغير المحذوف بأحد المتغيرات المستقلة الأخرى (أي ألا تساوي دالة التغاير بين هذين المتغيرين صفر).
والآن فلنفترض أننا حذفنا المتغير (z) من العلاقة السابقة، وأن العلاقة بين (x) و(z) معطاة بالصيغة الآتية:
حيث (d) و(f) هما بارامترات الدالة، و(e) هومقدار الخطأ. وبالتعويض في العلاقة السبقة:
فإذا قمنا بتحليل انحدار (y) على (x) فقط، فسوف نستنتج عمليًا صيغة المعادلة السابقة وليس المعادلة الحقيقية، وسوف تهجرب قيمة معامل الانحدار على (x) من ناتج جمع جزئين: الجزء (b) وهوتعبير عن تأثير (x) على (y) بشكل مباشر، والجزء الآخر (cf) وهوتعبير عن التأثير غير المباشر للمتغير (x) على (y) (حيث حتى x يؤثر على z، وهوبدوره يؤثر على y، فتكون محصلة التأثير طبقًا لنظرية التفاضل هي حاصل ضرب معامل تأثير x على z مع معامل تأثير z على y).
أوبعبارة أخرى، عند حذف المتغير z من العلاقة وتحليل انحدار y على x، فإننا عمليًا نقدر المشتقة الكلية لـy بالنسبة إلى x، وذلك عوضًا عن المشتقة الجزئية لـy بالنسبة لـx. ويستثنى من ذلك الحالة التي تكون فيها كلًا من (c) و(f) تساويان الصفر. ويتضمن التعبير (cf) كلًا من إتجاه ومقدار الانحياز، حيث أننا نحاول تقدير قيمة (b)، ولكننا سنحصل في الحقيقة على (b+cf). حيث حتى مقدار الانحياز هوالقيمة المطلقة لـ(cf)، وإتجاه الانحيازقد يكون موجبًا إذا كان (cf>0)، وسالبًا إذا كان (cf<0).
شرح مفصل
على سبيل المثال، دعنا نفترض وجود نموذج خطي معطى بالصيغة الآتية:
حيث:
- x_i هومتجه صفي (1 x p) ، وهويحتوي على قيم عدد p من المتغيرات المستقلة المقاسة في اللحظة الزمنية i أوبالنسبة للمشارك رقم i.
- β هومتجه عمودي (p x 1) يحتوي على عدد p من البارامترات المجهولة والتي يفترض أن يتم تقديرها لاحقًا (وهي معاملات استجابة المتغير التابع إلى تغير جميع من المتغيرات المستقلة في المتجه (x_i)).
- z_i هي كمية قياسية، وهي قيمة متغير مستقل آخر مقاسة في اللحظة الزمنية i أوبالنسبة للمشارك رقم i.
- δ هي كمية قياسية وهي تعبير عن بارامتر مجهول يفترض أن يتم تقديره لاحقًا (وهومعامل استجابة المتغير التابع إلى z).
- u_i هومقدار الخطأ المجهول في اللحظة الزمنية i أوبالنسبة للمشارك رقم i. ويمكن تمثيله على أنه تأثير متغير عشوائي متوسط قيمته تساوي صفر.
- y_i هي قيمة المتغير التابع المقاسة في اللحظة الزمنية i أوبالنسبة للمشارك رقم i.
وما علينا عمله هورصد قيم جميع المتغيرات آنيًا عدة مرات (i = 1,2,3….)، وتجميعها، ومن ثم رصها فوق بعضها على هيئة متجهات ومصفوفات. بحيث نحصل على المصفوفة X، والمتجهات Y وZ وU. حيث:
و
وإذا حُذف المتغير z من المعادلة، فإن الطريقة المعتادة في الحصول على قيم بارامترات المعاملات المستقلة الآخرى هي طريقة المربعات الصغرى الاعتيادية:
(حيث حتى الفاصلة العلوية تعني مدور المصفوفة، و«1-» العلوية تعني معكوس المصفوفة). وبالتعويض عن Y في على النموذج الخطي السابق:
وفي حساب القيم المتسقطة (أوالقيم المتوسطة)، فإن مساهمة الحد الأخير في الناتج هوصفر، وذلك بافتراض حتى الحد U لا يرتبط نهائيًا بالمتغيرات الانحدارية X. وبتبسيط الحدود المتبقية ينتج أن:
ويعبر الحد الثاني عن انحياز المتغير المحذوف z في هذه الحالة، وقيمته لا تساوي الصفر في حالة ما إذا كان z يرتبط بأي من المتغيرات في المصفوفة X (أي حتى «X′Z» لا يساوي متجهًا صفريًا). لاحظ حتى قيمة الانحياز تساوي الجزء الموزون من z_i المسبب عن x_i.
تأثيره على طريقة المربعات الصغرى الاعتيادية
تنص مبرهنة جاوس-ماركوف على حتى نماذج الانحدار التي تلتزم بافتراضات نموذج الانحدار الخطي الكلاسيكي هي أكفأ وأدق طرق ممكنة في تقدير معاملات الارتباطات، وهي أقلها انحيازًا كذلك. ويشترط الانحدار الخطي في حالة استخدام طريقة المربعات الصغرى حتى متغير الخطأ في المعادلة لا يرتبط بأي من المتغيرات الانحدارية.
ولكن وجود متغير محذوف يخل بهذا الشرط بالتحديد. وعليه فمن المتسقط في هذه الحالة حتى تكون تقديرات المربعات الصغرى متحيزة وغير متسقة. ويعتمد إتجاه الانحياز على كيفية التقدير بالإضافة إلى مقدار التغاير بين المتغيرات الانحدارية والمتغيرات المحذوفة. ففي حالة التغاير الموجب بين المتغير المحذوف وبين جميع من المتغير المستقل والتابع، فمن المتسقط حتى تكون قيمة معامل الانحدار المقاسة أكبر من قيمته الحقيقية. ويمكن ملاحظة هذا التأثير عن طريق حساب القيمة المتسقطة للبارامتر، كما تقدم في الفقرة السابقة.
المراجع
- Barreto; Howland (2006). "Omitted Variable Bias". Introductory Econometrics: Using Monte Carlo Simulation with Microsoft Excel. Cambridge University Press.
- Clarke, Kevin A. (2005). "The Phantom Menace: Omitted Variable Bias in Econometric Research". Conflict Management and Peace Science. 22 (4): 341–352. doi:10.1080/07388940500339183.
- Greene, W. H. (1993). Econometric Analysis (الطبعة 2nd). Macmillan. صفحات 245–246.
- Wooldridge, Jeffrey M. (2009). "Omitted Variable Bias: The Simple Case". Introductory Econometrics: A Modern Approach. Mason, OH: Cengage Learning. صفحات 89–93. ISBN .
التصنيفات: انحياز, تحليل الانحدار, مقالات بدون مصدر منذ أغسطس 2019, جميع المقالات بدون مصدر, مقالات بدون مصدر منذ 2019, جميع المقالات التي بحاجة لصيانة, مقالات بحاجة لشريط بوابات