TrueschoTruescho
كل الدورات
هندسة البيانات وضمان موثوقية خطوط البيانات للتعلّم الآلي
Coursera
دورة
غير محدد

هندسة البيانات وضمان موثوقية خطوط البيانات للتعلّم الآلي

Coursera

تعلم تقنيات تنظيف وتحويل البيانات الحقيقية لتحويلها إلى أصول تحليلية موثوقة باستخدام أدوات بايثون وpandas، مع التركيز على جودة البيانات ومعالجتها.

غير محدد10 أسبوعالإنجليزية

عن الدورة

تمنح هذه الدورة المهارات اللازمة لتحويل مجموعات البيانات الحقيقية إلى أصول تحليلية قابلة للاستخدام الموثوق. يتعلم المتدربون كيفية تقييم الميزات التصنيفية واختيار استراتيجيات الترميز المناسبة وقياس جودة البيانات والتوثيق، بالإضافة إلى معالجة القيم المفقودة بفعالية. باستخدام بايثون ومكتبة pandas، يتم التدريب على تقييم عدد الفئات، وترميز الأهداف، والتحقق من اكتمال البيانات بواسطة أدوات مثل Great Expectations، وبناء مسار التحويل الشفاف. كما تشمل الدورة تنظيف الحقول المعقدة كالسن، الشواذ في الرواتب، والتواريخ لضمان إنتاج بيانات جاهزة للاستخدام في النمذجة والتنبؤ.

ماذا ستتعلم

  • تحويل وتحقق من سلامة البيانات باستخدام تقنيات الترميز والتنظيف
  • تصميم وتنظيم خطوط بيانات ML لضمان أداء عالٍ وموثوق
  • إدارة التطوير القابل لإعادة الإنتاج باستخدام التحكم في الإصدار وأدوات البيئة

المتطلبات المسبقة

  • معرفة أساسية بالمفاهيم والمصطلحات
  • الاستعداد لممارسة التمارين التطبيقية

المدرسون

P

Professionals from the Industry

المواضيع

إدارة البيانات
تكنولوجيا المعلومات
تحليل البيانات
علوم البيانات
تحويل البيانات
التحقق من البيانات
سلامة البيانات
جودة البيانات

معلومات الدورة

المنصةCoursera
المستوىغير محدد
طريقة التعلمغير محدد
السعرمجاني

المهارات

إدارة البيانات
تكنولوجيا المعلومات
تحليل البيانات
علوم البيانات
تحويل البيانات
التحقق من البيانات
سلامة البيانات
جودة البيانات
Dataflow
Package and Software Management

ابدأ التعلم الآن