
Duke University
تُعد هذه الدورة دليلاً شاملاً لإتقان استخدام منصة Databricks في هندسة وتحليل البيانات، بالإضافة إلى تشغيل النماذج اللغوية الكبيرة محلياً. ستتعلم كيفية بناء مسارات بيانات فعالة وتشغيل نماذج متقدمة مثل Mixtral على جهازك الشخصي باستخدام أدوات مبتكرة.
مرحباً بك في دورة "من Databricks إلى النماذج اللغوية المحلية"، وهي دورة تدريبية مصممة خصيصاً للمبتدئين الراغبين في دخول عالم علم البيانات والذكاء الاصطناعي التطبيقي. تهدف هذه الدورة إلى تزويد المتعلمين بالمهارات الأساسية والممارسات العملية اللازمة لاستخدام منصة Databricks في تنفيذ مهام هندسة البيانات وتحليلها بكفاءة عالية. خلال هذه الدورة، ستكتشف كيفية إدارة دورة حياة البيانات بالكامل، بدءاً من عمليات الاستخراج والتحويل والتحميل (ETL)، مروراً ببناء مسارات بيانات سلسة، وصولاً إلى تحويل البيانات ومعالجتها لتصبح جاهزة للاستخدام في مشاريع علم البيانات. ولن نتوقف عند هذا الحد، بل سنتجاوز حدود الحوسبة السحابية لتتعلم كيفية تشغيل النماذج اللغوية الكبيرة محلياً على جهازك الشخصي. ستتعمق في فهم كيفية الاستفادة من أدوات قوية مثل Hugging Face Candle و Mozilla llamafile لتشغيل نماذج متقدمة مثل Mixtral بسهولة وفعالية، مما يمنحك حرية التجربة والتطوير بعيداً عن قيود الخوادم السحابية وتكاليفها. ستحصل أيضاً على خبرة عملية في نماذج تعلم الآلة، وكيفية تصميم مسارات تعلم الآلة (ML Pipelines) ونشر النماذج. بنهاية هذه الدورة، ستكون قد بنيت أساساً متيناً يجمع بين قوة هندسة البيانات باستخدام Databricks ومرونة تشغيل النماذج اللغوية الضخمة محلياً، مما يؤهلك للانطلاق في مجال تحليل البيانات وهندستها بثقة واحترافية.
Noah Gift
Interdisciplinary Data Science (MIDS)
Alfredo Deza
Derek Wales
Duke Master in Interdisciplinary Data Science (MIDS)