
يقدّم هذا المقرر مقدمة متماسكة لعالم البيانات الضخمة، مع التركيز على مفاهيمها الأساسية ولماذا أصبحت محورية في التحليلات وعلوم البيانات الحديثة. ستتعرف على خصائص البيانات الضخمة واتجاهات التكنولوجيا التي دفعت تطور أدوات التخزين والمعالجة الموزعة، وكيف تختلف الاحتياجات عندما تتجاوز البيانات قدرات الأنظمة التقليدية. ينتقل المقرر إلى Hadoop بوصفه أحد أشهر الأطر للبيانات الضخمة، حيث ستدرس معماريته ومكوناته الرئيسية ومنظومته (ecosystem) ومشروعاته الفرعية، مع توضيح الفروق بين التوزيعات المختلفة ودور كل مكوّن في حل المشكلات على نطاق واسع. سيمنحك ذلك فهماً عملياً لكيفية التفكير في بناء حلول تعتمد على Hadoop، وما القيود التي يجب الانتباه لها. الجزء التطبيقي يركّز على اكتساب مهارات عملية لتثبيت Hadoop وتهيئته وتشغيله على جهاز افتراضي يعمل بنظام Linux. ستتعلم إعداد البيئة، التحقق من التشغيل، وتشغيل مهام بسيطة للتأكد من صحة التثبيت، ما يضعك على الطريق لاستخدام Hadoop لاحقاً في مهام التخزين والمعالجة. بنهاية المقرر ستكون قادراً على تعريف البيانات الضخمة وربطها بمجالات التحليلات، وفهم هندسة Hadoop، وتنفيذ إعداد عملي يمكّنك من البدء في معالجة البيانات ضمن بيئة حقيقية قابلة للتجربة والتعلم.
Karthik Shyamsunder