TrueschoTruescho
كل الدورات
تصميم وتنفيذ خطوط ETL باستخدام Apache Spark
Coursera
دورة
غير محدد

تصميم وتنفيذ خطوط ETL باستخدام Apache Spark

EDUCBA

اكتسب مهارات تصميم وبناء وإدارة خطوط عمل ETL كاملة باستخدام Apache Spark في سياق هندسة البيانات الواقعية.

غير محدد2 أسبوعالإنجليزية

عن الدورة

تُعد دورة تصميم وتنفيذ خطوط ETL باستخدام Apache Spark دورة عملية تستهدف تمكين المتعلمين من تصميم وبناء وإدارة عمليات استخراج وتحويل وتحميل البيانات (ETL) باستخدام Apache Spark ضمن بيئة هندسة بيانات واقعية. تبدأ الدورة بتنصيب وتكوين مكونات أساسية مثل PySpark وHadoop وMySQL، مع تنظيم هيكلية المشاريع واستكشاف مصادر البيانات. يتعلم المشاركون كيفية بناء تطبيقات Spark لمعالجة تحميل البيانات الكاملة والتزايدية عبر JDBC، بالإضافة إلى تطبيق التحويلات ومعالجة تحديات التنفيذ وتحسين خطوط ETL لتحقيق أداء عالي وموثوقية أكبر في معالجة البيانات.

ماذا ستتعلم

  • تنصيب وتكوين PySpark وHadoop وMySQL لخطوط ETL
  • بناء تطبيقات Spark للتحميل الكامل والتزايدي عبر JDBC
  • تطبيق التحويلات والتعامل مع تحديات النشر وتحسين خطوط ETL

المتطلبات المسبقة

  • معرفة أساسية ببرمجة Python
  • مفاهيم أساسية في قواعد البيانات

المدرسون

E

EDUCBA

المواضيع

ثبات البيانات
معالجة البيانات
تحويل البيانات
Apache Hadoop
Apache Spark
MySQL
استيراد وتصدير البيانات
استخراج تحويل تحميل

معلومات الدورة

المنصةCoursera
المستوىغير محدد
طريقة التعلمغير محدد
السعرمجاني

المهارات

ثبات البيانات
معالجة البيانات
تحويل البيانات
Apache Hadoop
Apache Spark
MySQL
استيراد وتصدير البيانات
استخراج تحويل تحميل
PySpark
Java Platform Enterprise Edition (J2EE)

ابدأ التعلم الآن