TrueschoTruescho
كل الدورات
بايب سبارك عمليًا: معالجة البيانات الكبيرة
Coursera
دورة
غير محدد

بايب سبارك عمليًا: معالجة البيانات الكبيرة

Edureka

دورة عملية تعلم العمل مع البيانات الضخمة باستخدام PySpark وأطر المعالجة الموزعة، تشمل أساسيات البيانات الضخمة وأرشفة Hadoop وعمليات التحويل المتقدمة.

غير محدد5 أسبوعالإنجليزية

عن الدورة

تُزوّد هذه الدورة المتدربين بمهارات العمل مع مجموعات بيانات ضخمة مستخدمين PySpark وأطر المعالجة الموزعة. تبدأ الدورة بتعريف مفاهيم البيانات الضخمة ومكونات نظام Hadoop، مثل HDFS، لفهم التخزين والمعالجة الحديثة. تشرح أيضًا بنية Apache Spark ومبادئها الأساسية التي تضمن سير العمل القابل للتوسع والاعتمادية. يشمل المحتوى العملي استخدام تحويلات وإجراءات RDD لإدارة البيانات الكبيرة، إضافة إلى العمليات المتقدمة على DataFrame مثل التلاعب والدمج، مما يؤهل المتعلم لتطوير حلول معالجة بيانات واسعة النطاق بكفاءة عالية.

ماذا ستتعلم

  • استكشاف مفاهيم البيانات الضخمة ونظام Hadoop
  • شرح بنية Apache Spark ومبادئه الأساسية
  • استخدام تحويلات وإجراءات RDD لمعالجة البيانات الضخمة
  • تنفيذ عمليات متقدمة على DataFrame للتحليل والتجميع

المتطلبات المسبقة

  • معرفة أساسية ومصطلحات متعلقة بالبيانات الكبيرة
  • رغبة في التعلم من خلال تطبيقات وحالات عملية

المدرسون

E

Edureka

المواضيع

تحليل البيانات
علوم البيانات
إدارة البيانات
تكنولوجيا المعلومات
تحويل البيانات
لغة استعلام SQL
PySpark
تقنيات تخزين البيانات

معلومات الدورة

المنصةCoursera
المستوىغير محدد
طريقة التعلمغير محدد
السعرمجاني

المهارات

تحليل البيانات
علوم البيانات
إدارة البيانات
تكنولوجيا المعلومات
تحويل البيانات
لغة استعلام SQL
PySpark
تقنيات تخزين البيانات
Data Pipelines
Big Data

ابدأ التعلم الآن