
تركّز هذه الدورة على شرح تنفيذ أنظمة البيانات الضخمة المتقدمة وتحسينها وتطبيقاتها العملية، بما يشمل أنظمة الملفات الموزعة، وMapReduce/Spark، وStorm/Spark Streaming، وMahout، مع توضيح المبادئ الأساسية وآليات التنفيذ واستراتيجيات التحسين. شهدت السنوات الأخيرة تسارعًا كبيرًا في انتشار تقنيات الذكاء الاصطناعي داخل مجالات صناعية متعددة. وبما أن أنظمة البيانات الضخمة تُعدّ الأساس الذي يمكّن الذكاء الاصطناعي المعتمد على البيانات اليوم، فقد أصبحت ذات أهمية بالغة. تهدف هذه الدورة إلى إرشاد الطلاب إلى المفاهيم الأساسية لأنظمة البيانات الضخمة، بما في ذلك كيفية تخزين البيانات ومعالجتها وتحليلها بكفاءة. تبدأ الدورة من المبادئ العامة لتصميم الأنظمة الموزعة، ثم تقدّم أطرًا منهجية لتقييم وتوسيع قدرات التخزين والحوسبة والشبكات داخل أنظمة البيانات الضخمة. وفي الختام، ولتسهيل فهم مبادئ التصميم هذه، تعتمد الدورة على دراسات حالة تستخدم أنظمة صناعية حقيقية لعرض كيفية تطبيق المبادئ الأساسية على أنظمة واقعية، وكيفية تحليل أدائها وحدودها. كما تتناول الدورة خطوط معالجة البيانات الضخمة مثل NoSQL، ومعالجة البيانات المتدفقة (Streaming)، ومعالجة بيانات الرسوم البيانية (Graph Data Processing).
Zhi Wang
Assistant Professor