
تمتلك المؤسسات اليوم إمكانية الوصول إلى كميات هائلة من البيانات، وأصبح ذلك يؤثر مباشرة في طريقة عملها وتشغيلها. ومع تزايد الاعتماد على البيانات، تدرك المؤسسات أن النجاح يتطلب الاستفادة من رؤى البيانات الضخمة لاتخاذ قرارات أعمال أكثر فاعلية ودقة. ماذا ستتعلّم؟ في دورة «أساسيات البيانات الضخمة»، وهي جزء من برنامج MicroMasters في البيانات الضخمة، ستتعرّف على كيفية دفع البيانات الضخمة للتغيير التنظيمي، وعلى أبرز التحديات التي تواجهها المؤسسات عند محاولة تحليل مجموعات بيانات ضخمة للغاية. كما ستفهم القيود العملية المرتبطة بالحجم والسرعة والتنوع، ولماذا تتطلب هذه البيئات أدوات وأساليب تحليل قابلة للتوسع. ستتعلّم تقنيات أساسية مثل التنقيب عن البيانات (Data Mining) ومعالجة التدفقات (Stream Processing)، بما في ذلك التفكير الخوارزمي اللازم للتعامل مع البيانات المتدفقة وحساب العناصر أو الأحداث المتكررة بكفاءة. إضافة إلى ذلك، ستتعلّم كيفية تصميم وتنفيذ خوارزميات PageRank باستخدام MapReduce، وهو نموذج برمجي يتيح قابلية توسع كبيرة عبر مئات أو آلاف الخوادم ضمن عنقود Hadoop، ما يجعله مناسباً لمعالجة البيانات على نطاق واسع. بنهاية الدورة ستكون قادراً على فهم المبادئ التي تقف خلف خوارزميات السير العشوائي (Random Walk) التي يعتمد عليها PageRank، وكيفية تطبيق هذه المفاهيم عملياً ضمن بيئات معالجة موزعة لتحقيق نتائج قابلة للاستخدام في سياقات الويب والتحليلات واسعة النطاق.
Frank Neumann
Professor
Aneta Neumann
Internally Grant-Funded Research Fellow
Wanru (Kelly) Gao
Dr
Vahid Roostapour
Dr