Gradient estimates of return distributions

Dimitrakakis, Christos; Bengio, Samy

2005

Formats

Format
BibTeX
MARCXML
TextMARC
MARC
DublinCore
EndNote
NLM
RefWorks
RIS

Files

Résumé

We present a general method for maintaining estimates of the distribution of parameters in arbitrary models. This is then applied to the estimation of probability distributions over actions in value-based reinforcement learning. While this approach is similar to other techniques that maintain a confidence measure for action-values, it nevertheless offers an insight into current techniques and hints at potential avenues of further research.

Détails

Titre Gradient estimates of return distributions

Auteur(s) Dimitrakakis, Christos ; Bengio, Samy

Publié dans PASCAL Workshop on Principled Methods of Trading Exploration and Exploitation

Présenté à PASCAL Workshop on Principled Methods of Trading Exploration and Exploitation

Date 2005

Mots-clés (libres)

learning

Note IDIAP-RR 05-29

Lien supplémentaire URL; Related documents

Laboratoires LIDIAP

Le document apparaît dans Production scientifique et compétences > STI - Faculté des sciences et techniques de l'ingénieur > IEM - Institute of Electrical and Micro Engineering > LIDIAP - Laboratoire de l'IDIAP
Production scientifique et compétences > Euler Center for Signal Processing
Papiers de conférence
Travail produit à l'EPFL
Publié

Date de création de la notice 2006-03-10

Files

Résumé

Détails

PDF