مبادئ هادوب وسبارك

Pearson

احصل على خبرة عملية في تثبيت وتشغيل Hadoop وSpark مع إدارة نشرات مجموعات البيانات الكبيرة وتطبيق مفاهيم تحليل البيانات.

غير محددالإنجليزية

مجاني

عن الدورة

توفر هذه الدورة تجربة عملية لتثبيت وتشغيل Hadoop وSpark على الحواسيب الشخصية، مع التقدم إلى إدارة نشرات مجموعات البيانات الكبيرة في البيئات الفعلية المختلفة. من خلال دروس تفاعلية ومثاليات، يتعلم المشاركون مفاهيم رئيسية مثل نظام الملفات الموزع HDFS، خوارزميات MapReduce، بيئة PySpark، لغة HiveQL، وأدوات إدخال البيانات. كما يتم تدريبهم على استخدام واجهات سهلة الاستخدام مثل Ambari وZeppelin لتبسيط سير عمل التحليلات وإدارة المجموعات. بنهاية الدورة، يمتلك المتعلمون المهارات الأساسية والثقة للبدء في مجال تحليل البيانات الكبيرة واكتشاف إمكانيات منظومة Hadoop الواسعة.

ماذا ستتعلم

تثبيت وتكوين وتشغيل Hadoop وSpark على الحواسيب الفردية والمجموعات باستخدام أدوات مثل Ambari وZeppelin
فهم وتطبيق مفاهيم البيانات الكبيرة مثل HDFS وMapReduce وPySpark وHiveQL وتقنيات إدخال البيانات مثل Flume وSqoop
تطوير وتشغيل وتصحيح تطبيقات تحليلات البيانات باستخدام أدوات عالية المستوى ولغات البرمجة النصية لتحليل مجموعات بيانات كبيرة بكفاءة

المتطلبات المسبقة

فهم أساسي للمفاهيم والمصطلحات المرتبطة
الاستعداد للتطبيق من خلال تمارين عملية أو دراسات حالة

المدرسون

Pearson

Douglas Eadline, PhD

Principle Scientist at Limulus Computing

المواضيع

إدارة البيانات

تكنولوجيا المعلومات

التحليلات

Apache Hadoop

Apache Hive

Apache Spark

البيانات الكبيرة

واجهة الأوامر

معلومات الدورة

المنصةCoursera

المستوىغير محدد

طريقة التعلمغير محدد

السعرمجاني

المهارات