
تبدأ هذه الدورة من الأساسيات الأولى للتعلم المعزز (Reinforcement Learning)، ثم تتدرّج خطوة بخطوة حتى تصل إلى فهم متكامل لخوارزمية Q-learning، وهي واحدة من أهم خوارزميات التعلم المعزز وأكثرها استخداماً. ستتعرّف على المفاهيم النظرية الجوهرية التي يقوم عليها التعلم المعزز، وكيفية تحويل هذه النظرية إلى تطبيقات عملية لحل مشكلات واقعية باستخدام لغة بايثون. كما ستتعمق في الصيغة الأساسية للتعلم المعزز: معادلة بيلمان (Bellman Equation)، التي تُعد حجر الأساس لفهم كيفية تقييم الحالات واتخاذ القرارات المثلى. ستغطي الدورة أيضاً خوارزمية Q-Learning بالتفصيل، إلى جانب مجموعة من التحسينات القوية التي تجعلها أكثر فعالية في بيئات مختلفة. وفي الجزء الثاني من الدورة، ستستخدم الشبكات العصبية لتنفيذ Q-learning، بهدف إنتاج وكلاء تعلّم أقوى وأكثر كفاءة؛ فالشبكات العصبية هي ما يجعل هذا المجال يُسمّى «التعلم المعزز العميق» (Deep Reinforcement Learning). بنهاية الدورة ستكون قد اكتسبت قاعدة معرفية وعملية كافية تؤهلك للانتقال إلى تنفيذ خوارزميات التعلم المعزز باستخدام الشبكات العصبية العميقة، مع فهم واضح للمنطق الرياضي والخطوات البرمجية اللازمة لبناء وكلاء تعلّم فعّالين.
Xander Steenbrugge
Instructor
Frank Washburn
Instructor
Shalev NessAiver
Instructor