Q-learningvignette|400x400px|Dans le Q-learning, l'agent exécute une action a en fonction de l'état s et d'une fonction Q. Il perçoit alors le nouvel état s' et une récompense r de l'environnement. Il met alors à jour la fonction Q. Le nouvel état s' devient alors l'état s, et l'apprentissage continue. En intelligence artificielle, plus précisément en apprentissage automatique, le Q-learning est un algorithme d'apprentissage par renforcement. Il ne nécessite aucun modèle initial de l'environnement.
Propulsion magnéto-plasmique à impulsion spécifique variabledroite|vignette|250px|Illustration d'un vaisseau interplanétaire futuriste à propulsion magnéto-plasmique à impulsion spécifique variable. La propulsion magnéto-plasmique à impulsion spécifique variable ou VASIMR (acronyme en anglais de Variable specific impulse magnetoplasma rocket) est un type de propulseur spatial à plasma. Il utilise des champs et des rayonnements électromagnétiques variables (sans électrodes) pour chauffer, ioniser et accélérer un gaz (hydrogène, argon ou hélium).