
ضمن برنامج الشهادة المهنية في علم البيانات، تغطي هذه الدورة أساسيات التصور البياني للبيانات وتحليل البيانات الاستكشافي. ستتعلّم كيف يساعدك التصور على فهم البيانات بسرعة، واكتشاف الأنماط والاتجاهات، وطرح الأسئلة الصحيحة قبل الانتقال إلى النمذجة أو الاستنتاجات. سنستخدم ثلاثة أمثلة محفِّزة إلى جانب ggplot2، وهي حزمة متخصصة في التصور البياني ضمن لغة البرمجة الإحصائية R. سنبدأ بمجموعات بيانات بسيطة لبناء المفاهيم خطوة بخطوة، ثم ننتقل تدريجياً إلى دراسات حالة أكثر واقعية تتناول الصحة العالمية والاقتصاد واتجاهات الأمراض المعدية في الولايات المتحدة. كما ستتناول الدورة جانباً بالغ الأهمية في العمل مع البيانات: كيف يمكن للأخطاء، والتحيزات، والأخطاء المنهجية، ومشكلات غير متوقعة أخرى أن تؤدي إلى بيانات تحتاج إلى تعامل حذر. وغالباً ما يكون من الصعب أو حتى من المستحيل ملاحظة الخطأ داخل مجموعة البيانات بمجرد النظر إلى الجداول أو القيم الخام، مما يجعل التصور البياني أداة محورية لاكتشاف المشكلات مبكراً وتجنّب استنتاجات مضللة. ومع تزايد توفر مجموعات بيانات غنية بالمعلومات وأدوات برمجية قوية، أصبحت القدرة على إنشاء رسوم واضحة ومعبّرة مهارة أساسية للتواصل الفعّال مع النتائج المبنية على البيانات، سواء في البحث أو الصناعة أو صنع القرار.
Rafael Irizarry
Professor of Biostatistics