أساسيات هندسة البيانات

KodeKloud

يغطي هذا المساق بناء أنظمة بيانات موثوقة وقابلة للتوسع لدعم نماذج الذكاء الاصطناعي، بدءًا من معالجة البيانات حتى الأتمتة باستخدام أدوات حديثة.

غير محدد4 أسبوعالإنجليزية

مجاني

عن الدورة

يتناول هذا المساق كيفية بناء هندسة بيانات متكاملة تدعم أنظمة الذكاء الاصطناعي الجاهزة للإنتاج، مع التركيز على تطوير خطوط البيانات الآمنة والقابلة للتوسع. تبدأ الرحلة بفهم دورة حياة MLOps وأسباب نقص كفاية DevOps التقليدية للتعامل مع تحديات انحراف النماذج والبيانات. يتعلم المتدربون كيفية بناء خطوط ETL مرنة باستخدام أدوات مثل Pandas وPolars للبيانات متوسطة الحجم، ثم التوسع في المعالجة الموزعة عبر Apache Spark وDask. يركز المساق بشكل خاص على تدفق البيانات في الوقت الحقيقي باستخدام Apache Kafka، وتطبيق مخازن الميزات لتلافي الفرق بين التدريب والتشغيل. كما يعلّم كيفية أتمتة سير عمل تعلم الآلة المعقد باستخدام أدوات مثل Airflow وPrefect لضمان التدريب المستمر والموثوق.

ماذا ستتعلم

بناء خطوط بيانات قابلة للتوسع باستخدام Pandas وPolars وApache Spark
تصميم حلول بث مباشر باستخدام Apache Kafka ومخازن الميزات
أتمتة سير عمل تعلم الآلة المعقد لضمان تدريب مستمر وموثوق

المتطلبات المسبقة

معرفة أساسية بالحاسوب والإنترنت
القدرة على قراءة التعليمات بالإنجليزية وإكمال تمارين قصيرة

المدرسون

Mumshad Mannambeth

المواضيع

تعلم الآلة

علوم البيانات

تطوير البرمجيات

علوم الحاسوب

خطوط البيانات

DevOps

البيانات الوقتية

Apache Airflow

معلومات الدورة

المنصةCoursera

المستوىغير محدد

طريقة التعلمغير محدد

السعرمجاني

المهارات