
يعتبر مشروع التخرج هذا تتويجاً لدورة البيانات الكبيرة، حيث تعتمد على الأدوات والأساليب التي تم تعلمها في الدورات السابقة ضمن التخصص. يعمل المتدربون على بناء منظومة متكاملة للبيانات الكبيرة وتحليل مجموعة بيانات تحاكي بيانات في لعبة افتراضية بعنوان "صيد الفلامنجو الوردي". تمتد مرحلة المشروع خمسة أسابيع، حيث يتم استعراض خطوات علم البيانات الكبيرة بدءاً من اقتناء البيانات واستكشافها، وتهيئتها، والتحليل، وانتهاءً بإعداد التقارير. يبدأ المشروع بتحليل استكشافي باستخدام أدوات مثل سبلنك وأوفيس المفتوح، ثم ينتقل إلى معالجة مشاكل معقدة باستخدام KNIME، مكونات المكتبة MLLib في سبارك، وجيبي لتصور الشبكات.
Ilkay Altintas
Chief Data Science Officer
Amarnath Gupta
Director, Advanced Query Processing Lab