
يُعدّ الاستدلال الإحصائي والنمذجة من الأدوات الأساسية لتحليل البيانات المتأثرة بالصدفة، ولذلك فهما مهارتان لا غنى عنهما لعلماء البيانات. في هذه الدورة ستتعلّم هذه المفاهيم المحورية من خلال دراسة حالة محفّزة حول التنبؤ بنتائج الانتخابات. ستوضح لك الدورة كيف يمكن تطبيق الاستدلال والنمذجة لتطوير الأساليب الإحصائية التي تجعل استطلاعات الرأي أداة فعّالة، وكيفية تنفيذ ذلك عملياً باستخدام لغة R. ستتعرّف على المفاهيم اللازمة لتعريف التقديرات وهوامش الخطأ، وكيف يمكن توظيفها لإنتاج تنبؤات جيدة نسبياً، مع تقديم تقدير لمدى دقة توقعاتك (أي قياس درجة عدم اليقين المصاحبة لها). بعد إتقان هذه الأساسيات، ستتمكن من فهم مفهومين شائعين على نطاق واسع في علم البيانات: فترات الثقة (Confidence Intervals) وقيم p (p-values)، وكيف تُستخدمان لتفسير النتائج واتخاذ قرارات مبنية على البيانات. كما ستتعلّم كيفية استخدام النماذج لتجميع البيانات من مصادر متعددة بهدف تحسين جودة الاستنتاجات والتوقعات. إضافة إلى ذلك، تقدّم الدورة مدخلاً مبسطاً إلى أساسيات الإحصاء البايزي والنمذجة التنبؤية، بما يساعدك على توسيع أدواتك التحليلية وبناء فهم عملي لكيفية التعامل مع عدم اليقين عند تحليل البيانات والتنبؤ بها.
Rafael Irizarry
Professor of Biostatistics