Ressource en auto-formation : Apprentissage par renforcement

Ce cours s'organise selon le schéma suivant : Après avoir défini précisément le problème que l'on veut résoudre, c'est-à-dire le problème de contrôle optimal, on démontre des propriétés importantes liées à ce problème et à sa solution. Ce faisant, on essaie de donner de l'intuition concernant ce pro...
cours / présentation - Création : 26-01-2008
Par : Philippe Preux
Partagez !

Présentation de: Apprentissage par renforcement

Informations pratiques sur cette ressource

Langue du document : Français
Type : cours / présentation
Temps d'apprentissage : 2 jours
Niveau : master
Public(s) cible(s) : apprenant
Document : Document PDF
Age attendu : 18 et +
Difficulté : moyen
Droits d'auteur : pas libre de droits, gratuit
Ce document est soumis à la licence GFDL (http://www.gnu.org/copyleft/fdl.html)

Description de la ressource en auto-formation

Résumé

Ce cours s'organise selon le schéma suivant : Après avoir défini précisément le problème que l'on veut résoudre, c'est-à-dire le problème de contrôle optimal, on démontre des propriétés importantes liées à ce problème et à sa solution. Ce faisant, on essaie de donner de l'intuition concernant ce problème afin de comprendre à quoi sert ce que l'on essaie de faire. Disons-le tout de suite, le problème que l'on va étudier est extrêmement général, les applications en sont très variées et l'utilisation de ce qui suit est grande.

  • Granularité : cours
  • Structure : atomique

"Domaine(s)" et indice(s) Dewey

  • (006.3)
  • (511.8)

Domaine(s)

Informations pédagogiques

  • Proposition d'utilisation : Ce cours est dispensé à des étudiants en Master 2 spécialité Modélisation du comportement et de la cognition

Informations techniques sur cette ressource en auto-formation

  • Configuration conseillée : Nécessite Adobe Acrobat Reader ou tout autre logiciel permettant la lecture de documents au format PDF

Intervenants, édition et diffusion

Intervenants

Créateur(s) de la métadonnée : Isabelle Gilles-Gallet
Validateur(s) de la métadonnée : Isabelle Gilles-Gallet

Édition

  • Université de Lille III

Diffusion

Partagez !

AUTEUR(S)

  • Philippe Preux
    Université de Lille 3

DIFFUSION

Cette ressource en auto-formation vous est proposée par :
UNIT - accédez au site internet
Sur les réseaux sociaux :

ÉDITION

Université de Lille III

EN SAVOIR PLUS

  • Identifiant de la fiche
    http://ori.unit-c.fr/uid/unit-ori-wf-1-1681
  • Identifiant OAI-PMH
    oai:www.unit.eu:unit-ori-wf-1-1681
  • Schéma de la métadonnée
  • Entrepôt d'origine
    UNIT
  • Publication
    26-01-2008

Ressources en auto-formation sur les mêmes thèmes

Présentation de la ressource en auto-formation Le jeu de go et la révolution de Monte Carlo cours / présentation, démonstration
28/04/2009
Le jeu de go et la révolution de Monte Carlo
Auteur(s) : Coulom Rémi
Description : Une révolution technologique a permis aux ordinateurs de faire un pas en avant : les méthodes dites « de Monte Carlo ». Quels sont les principes de ces algorithmes, et comment s’appliquent-ils au go ?
Présentation de la ressource en auto-formation MoGo, maître du jeu de Go ? cours / présentation, démonstration
15/02/2007
MoGo, maître du jeu de Go ?
Auteur(s) : Gelly Sylvain, Jongwane Joanna
Description : Si tout le monde considère actuellement que les programmes joueurs d’échecs sont plus forts que la plupart des humains, on ne peut pas en dire autant pour un jeu comme le Go. Les programmes joueurs de Go peinent à atteindre un niveau moyen ! Mais grâce à la modélisation statistique, de grands pas ...