Grand modèle de langageUn grand modèle de langage, grand modèle linguistique, grand modèle de langue, modèle massif de langage ou encore modèle de langage de grande taille (LLM, pour l'anglais large language model) est un modèle de langage possédant un grand nombre de paramètres (généralement de l'ordre du milliard de poids ou plus). Ce sont des réseaux de neurones profonds entraînés sur de grandes quantités de texte non étiqueté utilisant l'apprentissage auto-supervisé ou l'apprentissage semi-supervisé.
Apprentissage automatiqueL'apprentissage automatique (en anglais : machine learning, « apprentissage machine »), apprentissage artificiel ou apprentissage statistique est un champ d'étude de l'intelligence artificielle qui se fonde sur des approches mathématiques et statistiques pour donner aux ordinateurs la capacité d'« apprendre » à partir de données, c'est-à-dire d'améliorer leurs performances à résoudre des tâches sans être explicitement programmés pour chacune. Plus largement, il concerne la conception, l'analyse, l'optimisation, le développement et l'implémentation de telles méthodes.
Apprentissage profondL'apprentissage profond ou apprentissage en profondeur (en anglais : deep learning, deep structured learning, hierarchical learning) est un sous-domaine de l’intelligence artificielle qui utilise des réseaux neuronaux pour résoudre des tâches complexes grâce à des architectures articulées de différentes transformations non linéaires. Ces techniques ont permis des progrès importants et rapides dans les domaines de l'analyse du signal sonore ou visuel et notamment de la reconnaissance faciale, de la reconnaissance vocale, de la vision par ordinateur, du traitement automatisé du langage.
Réseau bayésienEn informatique et en statistique, un réseau bayésien est un modèle graphique probabiliste représentant un ensemble de variables aléatoires sous la forme d'un graphe orienté acyclique. Intuitivement, un réseau bayésien est à la fois : un modèle de représentation des connaissances ; une « machine à calculer » des probabilités conditionnelles une base pour des systèmes d'aide à la décision Pour un domaine donné (par exemple médical), on décrit les relations causales entre variables d'intérêt par un graphe.
DonnéeUne donnée est ce qui est connu et qui sert de point de départ à un raisonnement ayant pour objet la détermination d'une solution à un problème en relation avec cette donnée. Cela peut être une description élémentaire qui vise à objectiver une réalité, le résultat d'une comparaison entre deux événements du même ordre (mesure) soit en d'autres termes une observation ou une mesure. La donnée brute est dépourvue de tout raisonnement, supposition, constatation, probabilité.
Système de recommandationLes systèmes de recommandation sont une forme spécifique de filtrage de l'information (SI) visant à présenter les éléments d'information (films, musique, livres, news, images, pages Web, etc) qui sont susceptibles d'intéresser l'utilisateur. Généralement, un système de recommandation permet de comparer le profil d'un utilisateur à certaines caractéristiques de référence, et cherche à prédire l'« avis » que donnerait un utilisateur.
Variational Bayesian methodsVariational Bayesian methods are a family of techniques for approximating intractable integrals arising in Bayesian inference and machine learning. They are typically used in complex statistical models consisting of observed variables (usually termed "data") as well as unknown parameters and latent variables, with various sorts of relationships among the three types of random variables, as might be described by a graphical model. As typical in Bayesian inference, the parameters and latent variables are grouped together as "unobserved variables".
Publicitéthumb|Times Square, à New York, l'un des lieux de plus forte concentration d'affichage urbain. thumb|Publicité pour le Coca-Cola, dans les années 1890. thumb|Publicité Renault d'octobre 1930, pour sa gamme Stella (Mona, Viva, Nerva, et Reina). La publicité est une forme de communication de masse, dont le but est de fixer l'attention d'une audience cible (consommateur, utilisateur, usager, électeur) afin de l'inciter à adopter un comportement souhaité : achat d'un produit, élection d'une personnalité politique, incitation à l'économie d'énergie Évoquer, par exemple, le nom d'une entreprise, d'un magasin, ou encore d'une marque, n'implique pas automatiquement un acte publicitaire.
CiblageLe ciblage (en marketing) est une politique consistant à choisir des populations et produits sur lesquels concentrer l'effort de l'entreprise. Dans la pratique, le ciblage est un processus comportant plusieurs étapes : évaluer l'attrait relatif de : chaque segment de population où existe une demande potentielle, chaque type de produits et services pouvant être offerts à ces segments chaque canal et support de distribution de produits et services pouvant être offerts à ces segments choisir ceux sur lesquels l'entreprise concentrera ses efforts (cible), en cohérence avec ses objectifs, ses compétences et ses ressources.
Big dataLe big data ( « grosses données » en anglais), les mégadonnées ou les données massives, désigne les ressources d’informations dont les caractéristiques en termes de volume, de vélocité et de variété imposent l’utilisation de technologies et de méthodes analytiques particulières pour créer de la valeur, et qui dépassent en général les capacités d'une seule et unique machine et nécessitent des traitements parallélisés. L’explosion quantitative (et souvent redondante) des données numériques permet une nouvelle approche pour analyser le monde.
Publicité en ligneLa publicité en ligne (ou e-publicité) désigne toute action visant à promouvoir un produit, service (économie), une marque ou une organisation auprès d'un groupe d'internautes et/ou de mobinautes contre une rémunération. La publicité en ligne est souvent rémunérée selon le nombre de clics faits par les internautes sur la publicité.
Analyse des donnéesL’analyse des données (aussi appelée analyse exploratoire des données ou AED) est une famille de méthodes statistiques dont les principales caractéristiques sont d'être multidimensionnelles et descriptives. Dans l'acception française, la terminologie « analyse des données » désigne donc un sous-ensemble de ce qui est appelé plus généralement la statistique multivariée. Certaines méthodes, pour la plupart géométriques, aident à faire ressortir les relations pouvant exister entre les différentes données et à en tirer une information statistique qui permet de décrire de façon plus succincte les principales informations contenues dans ces données.
Advertising media selectionAdvertising media selection is the process of choosing the most efficient media for an advertising campaign. To evaluate media efficiency, planners consider a range of factors including: the required coverage and number of exposures in a target audience; the relative cost of the media advertising and the media environment. Media planning may also involve buying media space. Media planners require an intricate understanding of the strengths and weaknesses of each of the main media options.
Filtrage collaboratifvignette|Illustration d'un filtrage collaboratif où un système de recommandation doit prédire l'évaluation d'un objet par un utilisateur en se basant sur les évaluations existantes. Le filtrage collaboratif (de l’anglais : en) regroupe l'ensemble des méthodes qui visent à construire des systèmes de recommandation utilisant les opinions et évaluations d'un groupe pour aider l'individu. Il existe trois principaux axes de recherche dans ce domaine, dépendant chacun des données recueillies sur les utilisateurs du système : le filtrage collaboratif actif ; le filtrage collaboratif passif ; le filtrage basé sur le contenu.
Matrix decompositionIn the mathematical discipline of linear algebra, a matrix decomposition or matrix factorization is a factorization of a matrix into a product of matrices. There are many different matrix decompositions; each finds use among a particular class of problems. In numerical analysis, different decompositions are used to implement efficient matrix algorithms. For instance, when solving a system of linear equations , the matrix A can be decomposed via the LU decomposition.
Advertising managementAdvertising management is a planned managerial process designed to oversee and control the various advertising activities involved in a program to communicate with a firm's target market and which is ultimately designed to influence the consumer's purchase decisions. Advertising is just one element in a company's promotional mix and as such, must be integrated with the overall marketing communications program. Advertising is, however, the most expensive of all the promotional elements and therefore must be managed with care and accountability.
Search engineA search engine is a software system that finds web pages that match a web search. They search the World Wide Web in a systematic way for particular information specified in a textual web search query. The search results are generally presented in a line of results, often referred to as search engine results pages (SERPs). The information may be a mix of hyperlinks to web pages, images, videos, infographics, articles, and other types of files. Some search engines also mine data available in databases or open directories.
Bayesian epistemologyBayesian epistemology is a formal approach to various topics in epistemology that has its roots in Thomas Bayes' work in the field of probability theory. One advantage of its formal method in contrast to traditional epistemology is that its concepts and theorems can be defined with a high degree of precision. It is based on the idea that beliefs can be interpreted as subjective probabilities. As such, they are subject to the laws of probability theory, which act as the norms of rationality.
Robot d'indexationalt=Architecture d'un robot d'indexation|vignette|270x270px|Architecture d'un robot d'indexation Un robot d'indexation (en anglais web crawler ou web spider, littéralement araignée du Web) est un logiciel qui explore automatiquement le Web. Il est généralement conçu pour collecter les ressources (pages Web, , vidéos, documents Word, PDF ou PostScript, etc.), afin de permettre à un moteur de recherche de les indexer.
Alcohol advertisingAlcohol advertising is the promotion of alcoholic beverages by alcohol producers through a variety of media. Along with nicotine advertising, alcohol advertising is one of the most highly regulated forms of marketing. Some or all forms of alcohol advertising are banned in some countries. There have been some important studies about alcohol advertising published, such as J.P. Nelson's in 2000. Scientific research, health agencies and universities have, over the decades, been able to demonstrate a correlation between alcohol beverage advertising and alcohol consumption, especially among initially non-drinking youth.