
يزوّدك هذا المساق بالمهارات اللازمة لبناء ثقة في التعامل مع البيانات الحقيقية والفوضوية. يتعلم المشاركون كيفية استيراد وتنظيف وتنظيم البيانات باستخدام لغة R وأدوات مثل dplyr وtidyr من حزمة Tidyverse. يشمل ذلك ممارسات ربط مجموعات البيانات وإعادة تشكيلها وبناء خطوط أنابيب بيانات فعالة تدعم العمل القابل للتكرار. ينظر المساق أيضاً في تناول جمع البيانات من مصادر الإنترنت بشكل مسؤول مع الاعتبارات الأخلاقية والقانونية اللازمة. بنهاية المساق، ستكون قادراً على تنظيم البيانات بطريقة تُمكّن من استخدامها بسهولة في مراحل التحليل والتصوير والنمذجة.
Dr. Elijah Meyer
Mine Ãetinkaya-Rundel
Department of Statistical Science