اتخاذ القرار والتعلم التعزيزي

Columbia University

مقدمة في اتخاذ القرار المتسلسل والتعلم التعزيزي، مع شرح نظرية المنفعة ونمذجة المشاكل باستخدام عمليات ماركوف وطرق البرمجة الديناميكية.

غير محدد8 أسبوعالإنجليزية

مجاني

عن الدورة

تقدم هذه الدورة مقدمة منهجية في اتخاذ القرارات المتسلسلة وتعلم التعزيز. تبدأ بشرح نظرية المنفعة وكيفية تمثيل وتحديد التفضيلات لاتخاذ القرارات بشكل منهجي. صُممت الدورة لتغطية نمذجة مشاكل اتخاذ القرار البسيطة باستخدام مشاكل الآلات ذات الأذرع المتعددة، مع مناقشة أساليب تقييم ملاحظات الأداء. ثم تنتقل إلى نمذجة المشاكل باستخدام عمليات ماركوف للقرارات (MDPs) وكيفية حلها من خلال خوارزميات البرمجة الديناميكية. كما تغطي الدورة تطبيقات أولية للتعلم التعزيزي باستخدام أساليب مثل مونت كارلو وطريقة الفرق الزمني، مع التركيز على الجوانب العملية لتحسين اتخاذ القرار في الأنظمة الذكية.

ماذا ستتعلم

تمثيل التفضيلات النوعية بكميات مناسبة لاتخاذ القرار
نمذجة مشاكل القرار باستخدام مشاكل الآلات متعددة الأذرع وعمليات ماركوف
تنفيذ خوارزميات البرمجة الديناميكية لإيجاد السياسات المثلى
تطبيق خوارزميات التعلم التعزيزي الأساسية باستخدام مونت كارلو والفرق الزمني

المدرسون

Tony Dear

Computer Science

المواضيع

نماذج ماركوف

الخوارزميات

التعلم التعزيزي

الذكاء الاصطناعي والتعلم الآلي

الطرق الإحصائية

التعلم الآلي

اتخاذ القرار المعتمد على البيانات

أنظمة دعم القرار

معلومات الدورة

المنصةCoursera

المستوىغير محدد

طريقة التعلمغير محدد

السعرمجاني

المهارات