
لغة البرمجة R مُصمَّمة خصيصاً لتحليل البيانات، وهي المفتاح الذي يربط بين المشكلات التي تريد حلّها بالبيانات وبين الإجابات التي تحتاجها لتحقيق أهدافك. تبدأ هذه الدورة بسؤال عملي، ثم تقودك خطوة بخطوة عبر عملية الإجابة عنه باستخدام البيانات. ستتعلّم أولاً تقنيات أساسية لإعداد البيانات (تنقيحها/معالجتها) قبل التحليل، مثل التعامل مع القيم المفقودة، وتنسيق البيانات وتوحيدها (التطبيع)، وتقسيم القيم إلى فئات (Binning)، وتحويل القيم الفئوية إلى قيم رقمية قابلة للاستخدام في التحليل والنمذجة. بعد ذلك ستنتقل إلى التحليل الاستكشافي للبيانات (EDA) لفهم بياناتك بشكل أعمق. ستستخدم الإحصاء الوصفي، وتجميع البيانات، وتحليل التباين (ANOVA)، وإحصاءات الارتباط لتلخيص البيانات والكشف عن العلاقات المهمة بين المتغيرات، وهي علاقات قد تقود إلى رؤى قابلة للتطبيق. وعندما تصبح بياناتك جاهزة للتحليل، ستتعلّم كيفية تطوير نموذج تنبؤي باستخدام أساليب انحدار متعددة، ثم تقييم النموذج للتحقق من حالات فرط التكيّف (Overfitting) أو نقص التكيّف (Underfitting). كما ستتعلّم تحسين أداء النموذج عبر تقنيات التنظيم (Regularization) والبحث الشبكي (Grid Search) لضبط المعاملات واختيار الإعدادات الأنسب. باتباع هذا المسار المنهجي، ستتمكن من الانتقال بثقة من سؤال واضح إلى نتائج مدعومة بالبيانات باستخدام R.
Gabriela de Queiroz
Program Director
Tiffany Zhu
Data Scientist
Yiwen Li
Software Engineer