
تشرح هذه الدورة كيفية بناء لوحات بيانات فورية تعتمد على Apache Spark Structured Streaming، والتي تمكّن المؤسسات من متابعة البيانات الحية مثل الطلبات، ونسب الشذوذ، ونشاط المستخدمين، بشكل فوري دون تأخير. يركز المساق على أساسيات البث مثل الميكرو-دفعات، ومشغلات البث، ونقاط التفتيش، وتطبيق القواعد على المخطط البياني للبيانات. بعد ذلك، يتم دمج Spark مع Kafka لمعالجة تدفقات الأحداث الحقيقية، مع تطبيق نوافذ زمنيّة وأعلام مائية لإدارة البيانات المتأخرة. كما يشمل المساق حفظ المقاييس في Delta Lake لدعم تقارير ذكاء الأعمال بشكل موثوق وفعال.
Starweaver
Global Leaders in Professional & Technology Education
Caio Avelino
Data Science, Business Intelligence, Machine Learning