
تركز هذه الدورة على تطوير مهارات بناء خطوط بيانات عالية الكفاءة وقابلة للتوسع عبر منصات هندسة البيانات الأساسية مثل هادوب، سبارك، وسنوفليك، إلى جانب إدارة وتحسين أدائها. تغطي الدورة استخدام منصة Databricks لتنفيذ تحليلات البيانات والتعلم الآلي، مع تطوير حلول تعلم الآلة باستخدام PySpark وMLFlow. كما تشرح مفاهيم DataOps وDevOps لتطبيق تكامل ونشر مستمر (CI/CD) في بيئات هندسة البيانات، بما في ذلك أتمتة العمليات وتحسين استخدام الموارد ضمن بيئة عمل متقدمة ومحترفة.
Noah Gift
Interdisciplinary Data Science (MIDS)
Kennedy Behrman
Envestnet
Matt Harrison