
تقدم هذه الدورة للمبتدئين في علم البيانات فهماً شاملاً لمفاهيم ومصطلحات البيانات الكبيرة، وأسباب نشوء عصر البيانات الكبيرة. سيتعرف المشاركون على مصادر البيانات الثلاثة الأساسية: الأفراد، المؤسسات، وأجهزة الاستشعار. توضح الدورة لماذا تؤثر خصائص البيانات الكبيرة (الحجم، السرعة، التنوع، الصحة، القيمة) على جمع البيانات، والمراقبة، والتخزين، والتحليل. كما تقدم شرحاً مفصلاً لمكونات حزمة هادوب الأساسية مثل نظام إدارة الموارد YARN، نظام الملفات HDFS، ونموذج البرمجة MapReduce، مع خطوات تثبيت البرنامج وتشغيله. هذه الدورة تؤهل الراغبين في فهم وتطبيق البيانات الكبيرة في مساراتهم المهنية أو أعمالهم.
Ilkay Altintas
Chief Data Science Officer
Amarnath Gupta
Director, Advanced Query Processing Lab