
توفر هذه الدورة تجربة عملية لتثبيت وتشغيل Hadoop وSpark على الحواسيب الشخصية، مع التقدم إلى إدارة نشرات مجموعات البيانات الكبيرة في البيئات الفعلية المختلفة. من خلال دروس تفاعلية ومثاليات، يتعلم المشاركون مفاهيم رئيسية مثل نظام الملفات الموزع HDFS، خوارزميات MapReduce، بيئة PySpark، لغة HiveQL، وأدوات إدخال البيانات. كما يتم تدريبهم على استخدام واجهات سهلة الاستخدام مثل Ambari وZeppelin لتبسيط سير عمل التحليلات وإدارة المجموعات. بنهاية الدورة، يمتلك المتعلمون المهارات الأساسية والثقة للبدء في مجال تحليل البيانات الكبيرة واكتشاف إمكانيات منظومة Hadoop الواسعة.
Pearson
Douglas Eadline, PhD
Principle Scientist at Limulus Computing