أنظمة البيانات الضخمة المتقدمة

Tsinghua University

دورة متقدمة تشرح تصميم وتنفيذ وتحسين أنظمة البيانات الضخمة مثل Spark وMapReduce والبث اللحظي، مع دراسات حالة صناعية.

4 ساعة/أسبوع16 أسبوعالصينية1,923 متسجل

مجاني للتدقيق

عن الدورة

تركّز هذه الدورة على شرح تنفيذ أنظمة البيانات الضخمة المتقدمة وتحسينها وتطبيقاتها العملية، بما يشمل أنظمة الملفات الموزعة، وMapReduce/Spark، وStorm/Spark Streaming، وMahout، مع توضيح المبادئ الأساسية وآليات التنفيذ واستراتيجيات التحسين. شهدت السنوات الأخيرة تسارعًا كبيرًا في انتشار تقنيات الذكاء الاصطناعي داخل مجالات صناعية متعددة. وبما أن أنظمة البيانات الضخمة تُعدّ الأساس الذي يمكّن الذكاء الاصطناعي المعتمد على البيانات اليوم، فقد أصبحت ذات أهمية بالغة. تهدف هذه الدورة إلى إرشاد الطلاب إلى المفاهيم الأساسية لأنظمة البيانات الضخمة، بما في ذلك كيفية تخزين البيانات ومعالجتها وتحليلها بكفاءة. تبدأ الدورة من المبادئ العامة لتصميم الأنظمة الموزعة، ثم تقدّم أطرًا منهجية لتقييم وتوسيع قدرات التخزين والحوسبة والشبكات داخل أنظمة البيانات الضخمة. وفي الختام، ولتسهيل فهم مبادئ التصميم هذه، تعتمد الدورة على دراسات حالة تستخدم أنظمة صناعية حقيقية لعرض كيفية تطبيق المبادئ الأساسية على أنظمة واقعية، وكيفية تحليل أدائها وحدودها. كما تتناول الدورة خطوط معالجة البيانات الضخمة مثل NoSQL، ومعالجة البيانات المتدفقة (Streaming)، ومعالجة بيانات الرسوم البيانية (Graph Data Processing).

ماذا ستتعلم

فهم المفاهيم الأساسية لأنظمة البيانات الضخمة
استيعاب مبادئ تصميم الأنظمة الموزعة
استخدام أطر لتوسيع قدرات التخزين والحوسبة والشبكات وتقييمها
تحليل دراسات حالة لأنظمة بيانات ضخمة صناعية حديثة مثل GFS وMapReduce وSpark
فهم خطوط معالجة البيانات الضخمة مثل NoSQL والبث اللحظي ومعالجة بيانات الرسوم البيانية

المدرسون

Zhi Wang

Assistant Professor

المواضيع

Apache Spark

البيانات الضخمة

الذكاء الاصطناعي

مبادئ وعناصر التصميم

معلومات الدورة

المنصةedX

المستوىمبتدئ

طريقة التعلمغير محدد

شهادةمتاحة

السعرمجاني للتدقيق

المهارات

Apache Spark

البيانات الضخمة

الذكاء الاصطناعي

مبادئ وعناصر التصميم

ابدأ التعلم الآن