
في هذه الدورة ستتعرّف على منصات هندسة البيانات الأساسية: Hadoop وSpark وSnowflake، وستتعلم كيفية تحسين أدائها وإدارتها بكفاءة لبناء خطوط بيانات فعّالة وقابلة للتوسع. ستتعمق أيضاً في Databricks باعتباره منصة قوية لتنفيذ مهام تحليلات البيانات وتطبيقات تعلم الآلة، وكيفية الاستفادة منه لتسريع العمل على البيانات وتشغيل الأحمال التحليلية على نطاق واسع. كما ستركّز الدورة على صقل مهاراتك في علم البيانات باستخدام Python عبر PySpark، بما يشمل العمل على البيانات الموزعة وكتابة عمليات التحويل والمعالجة بأسلوب مناسب لبيئات البيانات الضخمة. وستتعرف على المفاهيم الأساسية في MLflow، وهي منصة مفتوحة المصدر لإدارة دورة حياة تعلم الآلة من البداية إلى النهاية، بما في ذلك تتبع التجارب وإدارة النماذج، مع تعلم كيفية دمج MLflow مع Databricks لدعم سير عمل تعلم الآلة بشكل منظم وقابل للتكرار. إلى جانب الجانب التقني، ستكتسب منهجيات تساعدك على تحسين إدارة المشاريع وسير العمل في هندسة البيانات، عبر تطبيق أفضل الممارسات مثل Kaizen للتحسين المستمر، وDevOps لرفع كفاءة التسليم والتشغيل، وDataOps لتحسين التعاون وجودة البيانات وأتمتة خطوط المعالجة. صُممت هذه الدورة للمتعلمين الراغبين في بدء مسار مهني أو تطويره في علم البيانات أو هندسة البيانات، وكذلك لمطوري البرمجيات والمهندسين الذين يسعون لتوسيع مهاراتهم في منصات البيانات الحديثة.
Noah Gift
Executive in Residence and Founder of Pragmatic AI Labs
Kennedy Behrman
Senior Data Engineer