إتقان الذكاء الاصطناعي التوليدي: بنية نماذج اللغة وإعداد البيانات

IBM

طوّر مهارات مطلوبة في بنية نماذج اللغة الكبيرة وإعداد بيانات NLP خلال أسبوعين، مع خبرة عملية وشهادة معترف بها.

2 ساعة/أسبوع2 أسبوعالإنجليزية1,743 متسجل

مجاني للتدقيق

عن الدورة

من المتوقع أن ينمو الطلب على الذكاء الاصطناعي التوليدي بأكثر من 46% سنوياً حتى عام 2030 (المصدر: Statista). لذلك يزداد احتياج السوق إلى مهندسي الذكاء الاصطناعي والمطورين، وعلماء البيانات، ومهندسي تعلم الآلة، وغيرهم من المتخصصين الذين يمتلكون مهارات عملية في الذكاء الاصطناعي التوليدي. تساعدك هذه الدورة على بناء مهارات مطلوبة لدى أصحاب العمل في مجال بنية نماذج اللغة الكبيرة (LLM) وإعداد البيانات، مع التركيز على ما تحتاجه فعلياً لتطبيق الحلول في بيئات العمل. وخلال مدة قصيرة تمتد لأسبوعين، ستتعرف إلى تطبيقات واقعية تستخدم الذكاء الاصطناعي التوليدي، وكيفية اختيار البنية المناسبة وفقاً للمشكلة والبيانات المتاحة. ستكتسب فهماً عملياً لبنى ونماذج الذكاء الاصطناعي التوليدي، بما في ذلك الشبكات العصبية المتكررة (RNNs)، والمحولات (Transformers)، والشبكات التوليدية الخصومية (GANs)، والمشفّرات التلقائية التباينية (VAEs)، ونماذج الانتشار (Diffusion Models). كما ستتعلم أساليب تدريب مختلفة تناسب كل نوع من هذه النماذج. إضافة إلى ذلك، ستستكشف نماذج اللغة الكبيرة مثل المحولات التوليدية المدربة مسبقاً (GPT) ونماذج ثنائية الاتجاه المستخدمة في معالجة اللغة، وستتعلم كيف تُستخدم هذه النماذج في مهام فهم اللغة وتوليد النص. وستطبق خطوات إعداد البيانات النصية عملياً، بما يشمل الترميز (Tokenization) والمعالجة المسبقة وبناء مُحمّل بيانات (Data Loader) باستخدام PyTorch لدعم التحويل إلى تمثيلات رقمية والحشو (Padding) لتجهيز البيانات للتدريب.

ماذا ستتعلم

اكتساب مهارات جاهزة لسوق العمل في بنية الذكاء الاصطناعي التوليدي وعلوم البيانات خلال أسبوعين، مع خبرة عملية وشهادة معترف بها في الصناعة يقدّرها أصحاب العمل.
التمييز بين معماريات ونماذج الذكاء الاصطناعي التوليدي مثل RNNs وTransformers وVAEs وGANs ونماذج الانتشار.
فهم كيفية استخدام نماذج اللغة الكبيرة مثل GPT وBERT وBART وT5 في معالجة اللغة.
تنفيذ الترميز (Tokenization) لمعالجة البيانات النصية الخام مسبقاً باستخدام مكتبات معالجة اللغة الطبيعية مثل NLTK وspaCy وBertTokenizer وXLNetTokenizer.
إنشاء مُحمّل بيانات (NLP Data Loader) باستخدام PyTorch لتنفيذ الترميز والتحويل إلى تمثيل رقمي (Numericalization) والحشو (Padding) لبيانات النص.

المتطلبات المسبقة

معرفة أساسية بلغة Python.
إلمام أساسي بـ PyTorch وبمفاهيم تعلم الآلة والشبكات العصبية (ميزة إضافية وليست شرطاً).

المدرسون

Joseph Santarcangelo

PhD., Data Scientist

المواضيع

الذكاء الاصطناعي التوليدي

نماذج اللغة الكبيرة وإعداد بيانات NLP

معلومات الدورة

المنصةedX

المستوىمتوسط

طريقة التعلمغير محدد

شهادةمتاحة

السعرمجاني للتدقيق

ابدأ التعلم الآن