
في هذه الدورة الختامية، يُطلب من المتدربين تطبيق المعرفة المكتسبة من الدورات السابقة لبناء حل تعلم معزز كامل. تتناول الدورة كل جانب من صياغة المشكلة، اختيار الخوارزميات، اختيار المعاملات، وتصميم التمثيلات، لتكوين حل متكامل. تتضمن المهمة تنفيذ بيئة تحاكي المشكلة ووكيل تحكم باستخدام شبكة عصبية للتقريب الوظيفي. كما يتم إجراء دراسة علمية لتحليل متانة الوكلاء وتعزيز القدرة على تقييم أداء أنظمة التعلم المعزز في بيئات العالم الحقيقي، مع التركيز على الصياغة الصحيحة والنمذجة والتقييم.
Martha White
Assistant Professor
Adam White
Assistant Professor