الذكاء الاصطناعي التوليدي متعدد الوسائط: الرؤية والصوت والمساعدون

Codio

دورة عملية لأربعة أسابيع لتعلّم الرؤية وتحويل الصور لنص، وتحويل النص لصوت، ونسخ الصوت، وبناء مساعدين أذكياء.

4 ساعة/أسبوع4 أسبوعالإنجليزية15 متسجل

مجاني للتدقيق

عن الدورة

تقدّم هذه الدورة الشاملة غوصاً عملياً عميقاً في تطبيقات الذكاء الاصطناعي متعدد الوسائط، وتنقلك خطوة بخطوة من المفاهيم الأساسية إلى التكامل المتقدم لبناء حلول متكاملة. تبدأ رحلتك باستكشاف قدرات الرؤية (Vision) لإتقان تحليل الصور وتحويلها إلى نص (Image-to-Text)، بما يشمل فهم محتوى الصورة واستخلاص المعلومات منها وربط العناصر المرئية باللغة بطريقة قابلة للاستخدام في التطبيقات الواقعية. بعد ذلك تنتقل إلى عالم الصوت، حيث تتعلم إنشاء أصوات واقعية عبر تحويل النص إلى كلام (Text-to-Speech - TTS)، ثم تتقن نسخ التسجيلات الصوتية بدقة عالية باستخدام تحويل الكلام إلى نص (Speech-to-Text) عبر Whisper، بما يتيح لك التعامل مع المحتوى الصوتي وتحويله إلى بيانات نصية قابلة للبحث والتحليل. تختتم المنهجية باستكشاف قوي لواجهة برمجة تطبيقات المساعدين (Assistants API)، حيث ستتعلم بناء وكلاء مستقلين قادرين على تنفيذ مهام معقدة. ستحصل على خبرة عملية في استخدام Code Interpreter لتحليل البيانات وتشغيل الشيفرة، وFile Search للبحث والاستعلام داخل الملفات والمستندات، وFunction Calling لربط مساعدك بأدوات وخدمات خارجية. من خلال الجمع بين هذه الركائز، ستكتسب المهارات اللازمة لتطوير حلول ذكاء اصطناعي متقدمة من طرف إلى طرف يمكنها أن ترى وتسمع وتتحدث وتتصرف اعتماداً على بيانات معقدة، ضمن نظام واحد متماسك.

ماذا ستتعلم

إتقان تحليل الصور وتحويلها إلى نص باستخدام قدرات Vision (Image-to-Text)
توليد أصوات واقعية عبر تحويل النص إلى كلام (TTS) وتوظيفها في التطبيقات
نسخ التسجيلات الصوتية بدقة عالية باستخدام Whisper (Speech-to-Text)
بناء مساعدين أذكياء باستخدام Assistants API لتنفيذ مهام متعددة الخطوات
استخدام Code Interpreter لتحليل البيانات وتشغيل الشيفرة داخل سير عمل المساعد
تطبيق File Search للاستعلام داخل المستندات وربط المعرفة بالردود

المواضيع

الذكاء الاصطناعي متعدد الوسائط

بناء المساعدين والوكلاء الذكيين

معلومات الدورة

المنصةedX

المستوىمبتدئ

طريقة التعلمغير محدد

شهادةمتاحة

السعرمجاني للتدقيق

ابدأ التعلم الآن