
تمنحك هذه الدورة فرصة لتنفيذ مشروع متكامل في تنقية وتجهيز البيانات باستخدام بايثون، بحيث تنتقل من بيانات خام وغير منظمة إلى مجموعة بيانات نظيفة وقابلة للتحليل. ستبدأ بتحديد هدف التحليل وأسئلة العمل، ثم جمع البيانات أو استيرادها وفهم بنية الملفات والجداول وأنواع المتغيرات. بعد ذلك ستطبق تقنيات عملية لمعالجة القيم المفقودة، إزالة التكرارات، توحيد الصيغ، واكتشاف القيم الشاذة التي قد تشوّه النتائج. ستتعلم أيضًا كيف تنظم خطوات العمل على شكل خط معالجة واضح يمكن إعادة تشغيله، مع الاهتمام بقابلية التتبع وتسجيل التحويلات لتسهيل المراجعة. باستخدام مكتبات بايثون الشائعة ستنفذ عمليات دمج وتجميع وإعادة تشكيل للبيانات لتصبح مناسبة للنمذجة أو التصور. كما ستتدرب على تلخيص ما قمت به وشرح القرارات التي اتخذتها، وإعداد مخرجات يمكن مشاركتها مع أصحاب المصلحة مثل تقارير موجزة أو دفاتر ملاحظات منظمة. بنهاية المشروع ستكون قادرًا على إدارة مشروع تنقية بيانات كامل بثقة، مع نتائج قابلة للاستخدام في التحليل.
Di Wu
Instructor