
يُستخدم الانحدار الخطي على نطاق واسع لقياس وتكميم العلاقة بين متغيرين أو أكثر، كما يُعد أداة مهمة لضبط أثر «العوامل المربكة» (Confounding) التي قد تُشوّه تفسير العلاقة بين المتغيرات. يقدّم هذا المقرر—وهو جزء من برنامج الشهادة المهنية في علم البيانات—شرحاً عملياً لكيفية تطبيق الانحدار الخطي باستخدام لغة R، وكيفية التعامل مع الإرباك وضبطه عند تحليل البيانات. في تطبيقات علم البيانات، من الشائع جداً أن نهتم بفهم العلاقة بين متغيرين أو أكثر: هل يرتبط متغير ما بآخر؟ وما مقدار هذا الارتباط؟ وهل يمكن الاعتماد على هذا الارتباط للتنبؤ؟ في هذا المقرر ستتعلّم كيفية فحص هذه العلاقات عبر بناء نماذج انحدار خطي وتفسير مخرجاتها عملياً في R. تعتمد دراسة الحالة المحفِّزة في هذا المقرر على النهج القائم على البيانات المستخدم في بناء فرق البيسبول كما ورد في قصة «Moneyball». سنحاول تحديد أي النتائج/المقاييس المقاسة تتنبأ بأفضل شكل بعدد النقاط (runs) التي يحققها فريق البيسبول، وذلك باستخدام الانحدار الخطي. كما سنفحص مفهوم الإرباك، حيث تؤثر متغيرات خارجية في العلاقة بين متغيرين أو أكثر، ما قد يؤدي إلى استنتاجات مضللة إذا لم نكتشف هذا الأثر ونعالجه بشكل صحيح.
Rafael Irizarry
Professor of Biostatistics