
تقدّم هذه الدورة تدريباً عملياً على هندسة البيانات باستخدام Apache Spark ضمن بيئة Azure Synapse Analytics، مع التعرّف على Delta Lake وأساليب تصور البيانات. ستتعلّم إتقان الميزات والقدرات الأساسية لـ Apache Spark لمعالجة البيانات والتحليلات على نطاق واسع داخل Azure Synapse، بدءاً من إعداد مجمعات Spark (Spark pools) وتهيئتها، وصولاً إلى تشغيل الشيفرة عبر دفاتر الملاحظات (Notebooks) لتنفيذ مهام التحميل والتحليل والتصور. ستركّز الدورة على كيفية العمل مع بيانات مخزّنة في بحيرة بيانات (Data Lake)، وكيفية قراءة البيانات ومعالجتها وتحويلها لدعم خطوط البيانات (Pipelines) وسير العمل الهندسي داخل بيئة Azure السحابية. كما ستفهم طريقة عمل Spark في بيئة موزّعة، وكيف يوزّع المهام على العُقد لتنفيذ المعالجة بكفاءة. ستتدرّب على استخدام DataFrames وSpark SQL لإجراء عمليات التلاعب بالبيانات مثل التنقية، والتحويل، والتجميع، والاستعلام، بما يخدم سيناريوهات هندسة البيانات اليومية. كذلك ستتعرّف على Delta Lake بوصفه طبقة تخزين مفتوحة المصدر تضيف معاملات ACID إلى Apache Spark، ما يرفع موثوقية البيانات وجودتها في بحيرات البيانات. وأخيراً، ستتعلّم إنشاء جداول Delta Lake واستخدامها، بما في ذلك تحديث البيانات وإجراء الاستعلامات على الإصدارات السابقة من البيانات (Time Travel) لدعم التتبع والتدقيق واسترجاع الحالات السابقة عند الحاجة.