Decision Making and Reinforcement Learning

Columbia University

This course is an introduction to sequential decision making and reinforcement learning. We start with a discussion of utility theory to learn how preferences can be represented and modeled for decision making. We first model simple decision problems as multi-armed bandit problems in and discuss several approaches to evaluate feedback. We will then model decision problems as finite Markov decision processes (MDPs), and discuss their solutions via dynamic programming algorithms. We touch on the n

Unknown8 weeks4,469 enrolled

Free

About this Course

What You'll Learn

Map between qualitative preferences and appropriate quantitative utilities.
Model non-associative and associative sequential decision problems with multi-armed bandit problems and Markov decision processes respectively
Implement dynamic programming algorithms to find optimal policies
Implement basic reinforcement learning algorithms using Monte Carlo and temporal difference methods

Instructors

Tony Dear

Computer Science

Course Info

PlatformCoursera

LevelUnknown

PacingUnknown

PriceFree

Skills

Markov Model

Algorithms

Reinforcement Learning

Artificial Intelligence and Machine Learning (AI/ML)

Statistical Methods

Machine Learning

Data-Driven Decision-Making

Decision Support Systems

Probability Distribution

Simulations

Start Learning Now