
تشكل التحسينات في أداء Apache Spark أهمية كبيرة في بيئات هندسة البيانات ذات النطاق الكبير، حيث تؤثر بطء التحويلات وكثرة عمليات التبديل غير المتوازنة على تحليلات البيانات والالتزام باتفاقيات مستوى الخدمة. يغطي هذا المساق كيفية تحليل وتشخيص هذه المشكلات باستخدام أدوات المراقبة المدمجة في Spark لفهم سلوك المهام والمراحل وعمليات التبديل. يتعلم المتعلمون كيفية تطبيق تقنيات عملية تشمل تحسين تقسيم البيانات، تخفيف التفاوتات الموزونة، تحسين الانضمامات، تكوين استراتيجيات التخزين المؤقت، واختيار صيغ الملفات الفعالة. يساعد هذا التدريب على زيادة معدلات الإنتاجية وضمان تنفيذ التطبيقات بشكل موثوق.
Merna Elzahaby
Big Data Architect