
تستعرض هذه الدورة كيفية إدارة مجموعات البيانات الكبيرة، وطرق تحميلها في بيئات المجموعات والتخزين السحابي. سيتم شرح كيفية تطبيق هياكل مناسبة على البيانات لتسهيل تنفيذ الاستعلامات باستخدام محركات SQL الموزعة مثل Apache Hive و Apache Impala. كما ستتعلم اختيار أنواع البيانات وأنظمة التخزين وصيغ الملفات الأنسب تبعًا للأدوات المستخدمة ومتطلبات الأداء. بنهاية الدورة، سيكون المتعلم قادرًا على تصفح قواعد البيانات والجداول في أنظمة البيانات الضخمة، واستكشاف الملفات في أنظمة الملفات الموزعة والتخزين السحابي، وإنشاء وإدارة قواعد البيانات الكبيرة باستخدام الأدوات المناسبة.
Ian Cook
Cloudera
Glynn Durham
Cloudera