
يركّز هذا المقرر على Apache Hive كطبقة استعلامات فوق أنظمة البيانات الضخمة، ويزوّدك بمهارات عملية لتصميم المخططات والاستعلام والتحسين. ستتعرّف على كيفية إنشاء قواعد بيانات وجداول Hive بطريقة تدعم قابلية التوسع، بما في ذلك اختيار الأنواع المناسبة، وتنظيم البيانات لتقليل كلفة القراءة. يشرح المقرر مفاهيم التقسيم Partitioning والتقسيم إلى دلاء Bucketing ولماذا تؤثر على أداء الاستعلامات عند التعامل مع أحجام كبيرة. ستتعلّم تطبيق عمليات الربط Joins بفعالية، واستخدام الدوال المعرّفة من قبل المستخدم UDFs عند الحاجة، وفهم SerDe وكيف يحدد طريقة تسلسل البيانات وفكها أثناء القراءة والكتابة. كما يتناول المقرر جوانب عملية لضبط الأداء مثل تقليل عمليات shuffle، تحسين شروط التصفية، اختيار صيغ تخزين مناسبة، ومراقبة خطط التنفيذ لتحديد عنق الزجاجة. بنهاية المقرر ستصبح قادرًا على بناء طبقة بيانات قابلة للاستعلام بكفاءة، كتابة استعلامات واضحة، وتحسينها لتناسب سير عمل البيانات الضخمة في التحليلات وتقارير الأعمال.
EDUCBA