
يركز هذا الكورس القصير على معالجة مشكلات اختناقات البيانات التي تواجه أنظمة المعالجة الموزعة باستخدام Apache Spark. توضح الدورة كيف يمكن لفهم أنماط توزيع البيانات وإجراء تحليل لمخططات التنفيذ ومراقبة مراحل المعالجة أن يساعد في تحديد أماكن حدوث عدم التوازن في تدفق البيانات، وبالتالي تحسين الأداء. يتعلم المشارك كيفية اختيار استراتيجيات تقسيم فعالة وإعدادات تكوين مثل shuffle.partitions وتقنيات broadcast join لتحسين سير العمل وتقليل زمن المعالجة. تتضمن الدورة محاضرات ومواد تعليمية مصممة لمتخصصي علوم البيانات والمهندسين لضمان فعالية أداء أنظمة البيانات الموزعة. لا تحتاج الدورة لخبرة عميقة مسبقة، ولكن مهارات الحاسوب الأساسية والإنترنت مطلوبة.
Hurix Digital