
في مشروع التخرج هذا ستُظهر قدرتك على العمل كمهندس بيانات بشكل عملي ومتكامل. تتمثل مهمتك في تصميم وتنفيذ وإدارة منصة كاملة للبيانات والتحليلات تضم قواعد بيانات علائقية وغير علائقية، ومستودعات بيانات، وخطوط أنابيب للبيانات، ومحركات لمعالجة البيانات الضخمة، وأدوات ذكاء الأعمال (BI). يتطلب هذا المشروع أن تطبق وتطوّر المهارات والمعرفة التي اكتسبتها عبر الدورات المختلفة ضمن شهادة IBM الاحترافية في هندسة البيانات. ستستخدم مجموعة من الأدوات والتقنيات لتصميم قواعد البيانات، وجمع البيانات من مصادر متعددة، ثم تنفيذ عمليات الاستخراج والتحويل والتحميل (ETL) لإدخال البيانات إلى مستودع بيانات مُهيكل. ستقوم أيضاً بتصميم مخطط مستودع بيانات بنمط النجمة أو رقاقات الثلج (Star/Snowflake Schema) وتعبئته بالبيانات، ثم إجراء الاستعلامات والتحليلات باستخدام SQL. بعد ذلك ستستفيد من أداة ذكاء أعمال سحابية لإنشاء تقارير ولوحات معلومات (Dashboards) تعرض مؤشرات وتحليلات قابلة للفهم واتخاذ القرار. وأخيراً ستنفّذ جانباً من التحليلات التنبؤية وتعلّم الآلة ضمن بيئة البيانات الضخمة، عبر بناء نموذج ونشره باستخدام Apache Spark، بما يوضح قدرتك على الانتقال من هندسة البيانات إلى تشغيل التحليلات المتقدمة على نطاق واسع ضمن منصة واحدة متكاملة.
Rav Ahuja
Global Program Director
Ramesh Sannareddy
Content Developer