
يعد التعلم التعزيزي فرعًا متقدمًا من التعلم الآلي يركز على تصميم وكلاء يتخذون قرارات تفاعلية بناءً على بيئة وديناميكيات معينة. تقدم هذه الدورة عرضًا مفصلًا للتقنيات الإحصائية التي يستخدمها التعلم التعزيزي، مثل نماذج ماركوف للعمليات اتخاذ القرار، وأساليب الاستكشاف والاستغلال. يكتسب المتعلمون فهمًا دقيقًا لأهمية التوازن بين البحث عن المعرفة والاستفادة من المعلومات المتاحة، مع تعلم كيفية تقييم دوال القيمة واستخدام البرمجة الديناميكية في حلول التحكم الصناعي الأمثل. تمثل الدورة ضرورة متزايدة في ظل الاهتمام المتزايد بأنظمة الذكاء الاصطناعي التفاعلية.
Martha White
Computing Science
Adam White
Computing Science