
يستهدف هذا المقرر المستوى المتوسط ويعلّمك كيفية تصميم وبناء وتحسين خطوط معالجة البيانات الدَّفعية على Google Cloud بطريقة متينة وقابلة للتوسع. ستتجاوز مهارات المعالجة الأساسية لتتعامل مع تحويلات واسعة النطاق، ومع متطلبات تنسيق سير العمل لضمان وصول البيانات في الوقت المناسب لدعم ذكاء الأعمال والتقارير الحرجة. ستحصل على تدريب عملي باستخدام Dataflow مع Apache Beam لتنفيذ المعالجات الدفعية، إضافة إلى حلول Spark بلا خوادم عبر Dataproc Serverless عند الحاجة لأحمال مختلفة أو مكتبات معالجة متقدمة. يناقش المقرر قرارات التصميم المهمة: متى تختار المعالجة الدَّفعية بدل المعالجة اللحظية، وكيف تقدّر حجم البيانات ومعدلات الإدخال، وتحدد نقاط الاختناق. يركّز المقرر على جودة البيانات كشرط للثقة: التحقق من صحة البيانات، التنظيف، واكتشاف القيم الشاذة، ووضع ضوابط تمنع إدخال بيانات غير سليمة إلى مستودعات التحليل. كما يتناول إدارة سير العمل: جدولة المهام، الاعتماديات، التعامل مع الأخطاء، والملاحظة التشغيلية عبر السجلات والمراقبة والتنبيهات. بنهاية المقرر ستكون قادرًا على اختيار النهج المناسب لحالة العمل، وبناء خط دفعـي قابل للتوسع، وإضافة ضوابط جودة ومراقبة تجعل التشغيل أكثر استقرارًا وقابلية للتشخيص.
Google Cloud Training