
تشرح هذه الدورة الطرق الأساسية لاستخراج البيانات من مصادر مختلفة مثل الإنترنت، واجهات برمجة التطبيقات (APIs)، قواعد البيانات، والزملاء بصيغ متنوعة. كما تتناول أساسيات تنظيف البيانات وتحويلها إلى شكل منظم يُعرف باسم "البيانات النظيفة"، مما يسرع من عمليات التحليل اللاحقة. تغطي أيضًا مكونات مجموعة البيانات الكاملة التي تتضمن البيانات الخام، تعليمات المعالجة، وأدلة الكود لضمان وضوح ونظافة البيانات قبل استخدامها في التحليل.
Jeff Leek, PhD
Fred Hutchinson Cancer Center
Roger D. Peng, PhD
University of Texas, Austin
Brian Caffo, PhD
Bloomberg School of Public Health