
يتناول هذا المساق كيفية بناء هندسة بيانات متكاملة تدعم أنظمة الذكاء الاصطناعي الجاهزة للإنتاج، مع التركيز على تطوير خطوط البيانات الآمنة والقابلة للتوسع. تبدأ الرحلة بفهم دورة حياة MLOps وأسباب نقص كفاية DevOps التقليدية للتعامل مع تحديات انحراف النماذج والبيانات. يتعلم المتدربون كيفية بناء خطوط ETL مرنة باستخدام أدوات مثل Pandas وPolars للبيانات متوسطة الحجم، ثم التوسع في المعالجة الموزعة عبر Apache Spark وDask. يركز المساق بشكل خاص على تدفق البيانات في الوقت الحقيقي باستخدام Apache Kafka، وتطبيق مخازن الميزات لتلافي الفرق بين التدريب والتشغيل. كما يعلّم كيفية أتمتة سير عمل تعلم الآلة المعقد باستخدام أدوات مثل Airflow وPrefect لضمان التدريب المستمر والموثوق.
Mumshad Mannambeth