معالجة البيانات دون خوادم باستخدام Dataflow: تطوير خطوط الأنابيب

Google Cloud

تعلّم تطوير خطوط أنابيب Dataflow بعمق عبر Beam SDK: مفاهيم Beam، معالجة البث بالنوافذ والمحفزات، I/O، المخططات، وتحسين الأداء.

5 ساعة/أسبوع3 أسبوعالإنجليزية231 متسجل

مجاني للتدقيق

عن الدورة

في الجزء الثاني من سلسلة دورات Dataflow، سنتعمّق في تطوير خطوط الأنابيب (Pipelines) باستخدام حزمة تطوير Beam SDK. نبدأ بمراجعة مفاهيم Apache Beam الأساسية التي تُعد حجر الأساس لبناء حلول معالجة بيانات قابلة للتوسع والعمل عبر بيئات تشغيل مختلفة. بعد ذلك ننتقل إلى معالجة بيانات البث (Streaming) من خلال شرح مفاهيم النوافذ (Windows) والعلامات المائية (Watermarks) والمحفزات (Triggers)، وكيف تساعد هذه الآليات على تنظيم البيانات غير المحدودة زمنياً والتحكم في توقيت إخراج النتائج. ثم نغطي خيارات مصادر البيانات ووجهات الإخراج (Sources & Sinks) التي يمكن استخدامها داخل خطوط الأنابيب، وكيفية اختيارها وضبطها بما يتناسب مع احتياجاتك. كما نتناول استخدام المخططات (Schemas) للتعبير عن البيانات المهيكلة، بما يبسّط كتابة كود Beam ويحسّن أداء خط الأنابيب. بعد ذلك نتناول كيفية تنفيذ التحويلات ذات الحالة (Stateful Transformations) باستخدام واجهات برمجة التطبيقات State وTimer، لتمكين منطق يعتمد على حالة متراكمة أو على مؤقتات زمنية ضمن تدفقات البيانات. ننتقل أيضاً إلى مراجعة أفضل الممارسات التي تساعد على تعظيم أداء خطوط أنابيب Dataflow، من حيث الكفاءة والموثوقية وقابلية الصيانة. وفي نهاية الدورة، نقدّم SQL وDataFrames كطرق لتمثيل منطق الأعمال داخل Beam، ونوضح كيفية تطوير خطوط الأنابيب بشكل تكراري باستخدام دفاتر Beam (Beam notebooks).

ماذا ستتعلم

مراجعة مفاهيم Apache Beam الأساسية: Pipeline وPCollections وPTransforms وRunner، والقراءة/الكتابة، وتحويلات الأدوات، والمدخلات الجانبية، والحزم (Bundles) ودورة حياة DoFn
مراجعة مفاهيم البث الأساسية: PCollections غير المحدودة، والنوافذ، والعلامات المائية، والمحفزات
اختيار وضبط خيارات الإدخال/الإخراج (I/O) المناسبة لخط أنابيب Dataflow
استخدام المخططات (Schemas) لتبسيط كود Beam وتحسين أداء خط الأنابيب
تطبيق أفضل الممارسات لبناء خطوط أنابيب Dataflow عالية الأداء
تطوير خط أنابيب Beam باستخدام SQL وDataFrames

المدرسون

Google Cloud Training

Course Team

المواضيع

Apache Beam

Google Cloud Dataflow

معلومات الدورة

المنصةedX

المستوىمتقدم

طريقة التعلمغير محدد

شهادةمتاحة

السعرمجاني للتدقيق

ابدأ التعلم الآن