بايب سبارك عمليًا: معالجة البيانات الكبيرة

Edureka

دورة عملية تعلم العمل مع البيانات الضخمة باستخدام PySpark وأطر المعالجة الموزعة، تشمل أساسيات البيانات الضخمة وأرشفة Hadoop وعمليات التحويل المتقدمة.

غير محدد5 أسبوعالإنجليزية

مجاني

عن الدورة

تُزوّد هذه الدورة المتدربين بمهارات العمل مع مجموعات بيانات ضخمة مستخدمين PySpark وأطر المعالجة الموزعة. تبدأ الدورة بتعريف مفاهيم البيانات الضخمة ومكونات نظام Hadoop، مثل HDFS، لفهم التخزين والمعالجة الحديثة. تشرح أيضًا بنية Apache Spark ومبادئها الأساسية التي تضمن سير العمل القابل للتوسع والاعتمادية. يشمل المحتوى العملي استخدام تحويلات وإجراءات RDD لإدارة البيانات الكبيرة، إضافة إلى العمليات المتقدمة على DataFrame مثل التلاعب والدمج، مما يؤهل المتعلم لتطوير حلول معالجة بيانات واسعة النطاق بكفاءة عالية.

ماذا ستتعلم

استكشاف مفاهيم البيانات الضخمة ونظام Hadoop
شرح بنية Apache Spark ومبادئه الأساسية
استخدام تحويلات وإجراءات RDD لمعالجة البيانات الضخمة
تنفيذ عمليات متقدمة على DataFrame للتحليل والتجميع

المتطلبات المسبقة

معرفة أساسية ومصطلحات متعلقة بالبيانات الكبيرة
رغبة في التعلم من خلال تطبيقات وحالات عملية

المدرسون

Edureka

المواضيع

تحليل البيانات

علوم البيانات

إدارة البيانات

تكنولوجيا المعلومات

تحويل البيانات

لغة استعلام SQL

PySpark

تقنيات تخزين البيانات

معلومات الدورة

المنصةCoursera

المستوىغير محدد

طريقة التعلمغير محدد

السعرمجاني

المهارات