TrueschoTruescho
كل الدورات
أباتشي سبارك: تطبيق تدفقات عمل البيانات الضخمة وتقييمها
Coursera
دورة
غير محدد

أباتشي سبارك: تطبيق تدفقات عمل البيانات الضخمة وتقييمها

EDUCBA

مدخل واضح لسبارك لمعالجة البيانات الموزعة: البنية وRDD والتحويلات والتخزين المؤقت وتقييم التطبيقات لتحسين السرعة والموارد.

غير محدد2 أسبوعKK, العربية, الألمانية, الإنجليزية

عن الدورة

تعرّفك هذه الدورة على مفاهيم المعالجة الموزعة للبيانات باستخدام Apache Spark بطريقة مناسبة للمبتدئين مع امتداد إلى مفاهيم متوسطة. ستبدأ بفهم معمارية سبارك ومكوّناته الأساسية، وكيف يعمل السائق Driver والمنفّذون Executors وإدارة الموارد، وما الذي يميز Spark عن أدوات الدُفعات التقليدية. بعد ذلك ستتعلم لبنات البرمجة عبر RDDs: كيفية إنشاء البيانات، وتنفيذ التحويلات Actions وTransformations، وفهم التقييم الكسول Lazy Evaluation. ستغطي الدورة كذلك موضوعات مهمة لبناء تطبيقات قابلة للتوسع مثل التخزين المؤقت Persistence، والتعامل مع صيغ ملفات متعددة، وقراءة البيانات وكتابتها بكفاءة. ثم تنتقل إلى التفكير التحليلي في تحسين الأداء: متى تستخدم التخزين المؤقت، وكيف تختار عدد الأقسام Partitioning، وكيف تقيس أثر قراراتك على زمن التنفيذ واستهلاك الذاكرة. في نهاية الدورة ستكون قادرًا على بناء تدفقات عمل واقعية في سبارك وتقييمها وتحسينها وفق احتياجات البيانات وحجمها.

ماذا ستتعلم

  • وصف معمارية سبارك ومكوّناته الأساسية وبُنى RDD البرمجية
  • تطبيق التحويلات والتخزين المؤقت والتعامل مع صيغ ملفات متعددة في سبارك
  • تطوير تدفقات قابلة للتوسع وتقييم تطبيقات سبارك بهدف التحسين

المتطلبات المسبقة

  • No deep prior experience is required, but basic computer and internet skills are helpful
  • Ability to read course instructions in English and complete short practice activities

المدرسون

E

EDUCBA

المواضيع

Apache Spark
المعالجة الموزعة
RDD
تحسين تطبيقات سبارك

معلومات الدورة

المنصةCoursera
المستوىغير محدد
طريقة التعلمغير محدد
السعرمجاني

المهارات

Apache Spark
المعالجة الموزعة
RDD
تحسين تطبيقات سبارك
Data Transformation
Apache Spark
JSON
Data Import/Export
Performance Tuning
Big Data

ابدأ التعلم الآن