Apprentissage par renforcement profondL'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère le problème d'un agent informatique (par exemple, un robot, un agent conversationnel, un personnage dans un jeu vidéo, etc.) qui apprend à prendre des décisions par essais et erreurs.
Deep belief networkIn machine learning, a deep belief network (DBN) is a generative graphical model, or alternatively a class of deep neural network, composed of multiple layers of latent variables ("hidden units"), with connections between the layers but not between units within each layer. When trained on a set of examples without supervision, a DBN can learn to probabilistically reconstruct its inputs. The layers then act as feature detectors. After this learning step, a DBN can be further trained with supervision to perform classification.
Apprentissage par renforcementEn intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome ( robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps. L'agent est plongé au sein d'un environnement et prend ses décisions en fonction de son état courant. En retour, l'environnement procure à l'agent une récompense, qui peut être positive ou négative.
Q-learningvignette|400x400px|Dans le Q-learning, l'agent exécute une action a en fonction de l'état s et d'une fonction Q. Il perçoit alors le nouvel état s' et une récompense r de l'environnement. Il met alors à jour la fonction Q. Le nouvel état s' devient alors l'état s, et l'apprentissage continue. En intelligence artificielle, plus précisément en apprentissage automatique, le Q-learning est un algorithme d'apprentissage par renforcement. Il ne nécessite aucun modèle initial de l'environnement.
Agent biologiqueUn agent biologique est un micro-organisme (bactérie, spore de microchampignon, virus), un parasite, une culture cellulaire ou une toxine. On parle d'agent infectieux si cet agent est susceptible de provoquer une infection, une allergie ou une intoxication chez son hôte. Cet agent peut être vivant ou non (ex : les virus ne sont pas vivants, ni le prion pathogène, mais ils sont classés parmi les agents biologiques).
CerveletLe cervelet (du cerebellum, « petit cerveau ») est une structure de l'encéphale des vertébrés qui joue un rôle important dans le contrôle moteur et est impliqué, dans une moindre mesure, dans certaines fonctions cognitives, telles que l'attention, le langage et la régulation des réactions de peur et de plaisir. Le cervelet n'est généralement pas à l'origine du mouvement, il contribue à la coordination et la synchronisation des gestes, et à la précision des mouvements.