TrueschoTruescho
كل الدورات
سبارك، هادوب، وسنوفليك لهندسة البيانات
Coursera
دورة
غير محدد

سبارك، هادوب، وسنوفليك لهندسة البيانات

Duke University

تعلّم بناء خطوط بيانات قابلة للتوسع باستخدام منصات هادوب، سبارك، وسنوفليك، مع تعزيز الأداء وإدارة عمليات تعلم الآلة على منصة دATABRICKS.

غير محدد4 أسبوعالإنجليزية

عن الدورة

تركز هذه الدورة على تطوير مهارات بناء خطوط بيانات عالية الكفاءة وقابلة للتوسع عبر منصات هندسة البيانات الأساسية مثل هادوب، سبارك، وسنوفليك، إلى جانب إدارة وتحسين أدائها. تغطي الدورة استخدام منصة Databricks لتنفيذ تحليلات البيانات والتعلم الآلي، مع تطوير حلول تعلم الآلة باستخدام PySpark وMLFlow. كما تشرح مفاهيم DataOps وDevOps لتطبيق تكامل ونشر مستمر (CI/CD) في بيئات هندسة البيانات، بما في ذلك أتمتة العمليات وتحسين استخدام الموارد ضمن بيئة عمل متقدمة ومحترفة.

ماذا ستتعلم

  • إنشاء خطوط بيانات قابلة للتوسع باستخدام هادوب وسبارك وسنوفليك وDatabricks
  • تحسين أداء هندسة البيانات عبر تقنيات التجميع والتوسيع
  • بناء حلول تعلم آلي باستخدام PySpark وMLFlow على منصة Databricks
  • تنفيذ ممارسات DataOps وDevOps لنشر مستمر وتكامل التطبيقات

المتطلبات المسبقة

  • معرفة أساسية بالبرمجة وبايثون
  • مفاهيم بيانات أولية

المدرسون

N

Noah Gift

Interdisciplinary Data Science (MIDS)

K

Kennedy Behrman

Envestnet

M

Matt Harrison

المواضيع

برمجة بايثون
جودة البيانات
أباتشي هادوب
تحويل البيانات
عمليات التعلم الآلي
دمج البيانات
عمليات التطوير والتشغيل
Databricks

معلومات الدورة

المنصةCoursera
المستوىغير محدد
طريقة التعلمغير محدد
السعرمجاني

المهارات

برمجة بايثون
جودة البيانات
أباتشي هادوب
تحويل البيانات
عمليات التعلم الآلي
دمج البيانات
عمليات التطوير والتشغيل
Databricks
Data Warehousing
Distributed Computing

ابدأ التعلم الآن