Entrepôt de donnéesvignette|redresse=1.5|Vue d'ensemble d'une architecture entrepôt de données. Le terme entrepôt de données ou EDD (ou base de données décisionnelle ; en anglais, data warehouse ou DWH) désigne une base de données utilisée pour collecter, ordonner, journaliser et stocker des informations provenant de base de données opérationnelles et fournir ainsi un socle à l'aide à la décision en entreprise. Un entrepôt de données est une base de données regroupant une partie ou l'ensemble des données fonctionnelles d'une entreprise.
Modèle de donnéesEn informatique, un modèle de données est un modèle qui décrit la manière dont sont représentées les données dans une organisation métier, un système d'information ou une base de données. Le terme modèle de données peut avoir deux significations : Un modèle de données théorique, c'est-à-dire une description formelle ou un modèle mathématique. Voir aussi modèle de base de données Un modèle de données instance, c'est-à-dire qui applique un modèle de données théorique (modélisation des données) pour créer un modèle de données instance.
DonnéeUne donnée est ce qui est connu et qui sert de point de départ à un raisonnement ayant pour objet la détermination d'une solution à un problème en relation avec cette donnée. Cela peut être une description élémentaire qui vise à objectiver une réalité, le résultat d'une comparaison entre deux événements du même ordre (mesure) soit en d'autres termes une observation ou une mesure. La donnée brute est dépourvue de tout raisonnement, supposition, constatation, probabilité.
Science des donnéesLa science des données est l'étude de l’extraction automatisée de connaissance à partir de grands ensembles de données. Plus précisément, la science des données est un domaine interdisciplinaire qui utilise des méthodes, des processus, des algorithmes et des systèmes scientifiques pour extraire des connaissances et des idées à partir de nombreuses données structurées ou non . Elle est souvent associée aux données massives et à l'analyse des données.
Analyse des donnéesL’analyse des données (aussi appelée analyse exploratoire des données ou AED) est une famille de méthodes statistiques dont les principales caractéristiques sont d'être multidimensionnelles et descriptives. Dans l'acception française, la terminologie « analyse des données » désigne donc un sous-ensemble de ce qui est appelé plus généralement la statistique multivariée. Certaines méthodes, pour la plupart géométriques, aident à faire ressortir les relations pouvant exister entre les différentes données et à en tirer une information statistique qui permet de décrire de façon plus succincte les principales informations contenues dans ces données.
Big dataLe big data ( « grosses données » en anglais), les mégadonnées ou les données massives, désigne les ressources d’informations dont les caractéristiques en termes de volume, de vélocité et de variété imposent l’utilisation de technologies et de méthodes analytiques particulières pour créer de la valeur, et qui dépassent en général les capacités d'une seule et unique machine et nécessitent des traitements parallélisés. L’explosion quantitative (et souvent redondante) des données numériques permet une nouvelle approche pour analyser le monde.
Parametric equationIn mathematics, a parametric equation defines a group of quantities as functions of one or more independent variables called parameters. Parametric equations are commonly used to express the coordinates of the points that make up a geometric object such as a curve or surface, called parametric curve and parametric surface, respectively. In such cases, the equations are collectively called a parametric representation, or parametric system, or parameterization (alternatively spelled as parametrisation) of the object.
Élément de donnéeDans les métadonnées, un élément est une unité de donnée élémentaire qui a : une identification telle que nom d'élément (data element name) ; une définition claire ; un ou plusieurs termes de représentation ; des valeurs optionnelles énumérées (code (métadonnée)) ; une liste de synonymes des éléments dans d'autres registres de métadonnées (:en:Synonym ring). On peut découvrir l'usage des éléments de donnée en inspectant les logiciels applicatifs ou les fichiers de données de l'application par un processus manuel ou automatique de découverte et compréhension de l'application.
Area of a circleIn geometry, the area enclosed by a circle of radius r is πr2. Here the Greek letter pi represents the constant ratio of the circumference of any circle to its diameter, approximately equal to 3.14159. One method of deriving this formula, which originated with Archimedes, involves viewing the circle as the limit of a sequence of regular polygons with an increasing number of sides.
Modélisation des donnéesDans la conception d'un système d'information, la modélisation des données est l'analyse et la conception de l'information contenue dans le système afin de représenter la structure de ces informations et de structurer le stockage et les traitements informatiques. Il s'agit essentiellement d'identifier les entités logiques et les dépendances logiques entre ces entités.
Gestion des donnéesLa gestion des données est une discipline de gestion qui tend à valoriser les données en tant que ressources numériques. La gestion des données permet d'envisager le développement d'architectures, de réglementations, de pratiques et de procédures qui gèrent correctement les besoins des organismes sur le plan de tout le cycle de vie des données. Les données sont, avec les traitements, l'un des deux aspects des systèmes d'information traditionnellement identifiés, et l'un ne peut aller sans l'autre pour un management du système d'information cohérent.
Aire (géométrie)thumb|L'aire du carré vaut ici 4. En mathématiques, l'aire est une grandeur relative à certaines figures du plan ou des surfaces en géométrie dans l'espace. Le développement de cette notion mathématique est lié à la rationalisation du calcul de grandeur de surfaces agricoles, par des techniques d'arpentage. Cette évaluation assortie d'une unité de mesure est aujourd'hui plutôt appelée superficie. Informellement, l'aire permet d'exprimer un rapport de grandeur d'une figure relativement à une unité, par le biais de découpages et recollements, de déplacements et retournements et de passage à la limite par approximation.
Problème inversevignette|une somme de plusieurs nombres donne le nombre 27, mais peut-on les deviner à partir de 27 ? En science, un problème inverse est une situation dans laquelle on tente de déterminer les causes d'un phénomène à partir des observations expérimentales de ses effets. Par exemple, en sismologie, la localisation de l'origine d'un tremblement de terre à partir de mesures faites par plusieurs stations sismiques réparties sur la surface du globe terrestre est un problème inverse.
DatamartUn datamart (parfois traduit magasin de données ou comptoir de données) est un sous-ensemble d’un entrepôt de données (data warehouse en anglais) destiné à fournir des données aux utilisateurs, et souvent spécialisé vers un groupe ou un type d'affaire. Techniquement, c'est une base de données relationnelle utilisée en informatique décisionnelle et exploitée en entreprise pour restituer des informations ciblées sur un métier spécifique, constituant pour ce dernier un ensemble d’indicateurs utilisés pour le pilotage de l’activité et l’aide à la décision.
Exploration de donnéesL’exploration de données, connue aussi sous l'expression de fouille de données, forage de données, prospection de données, data mining, ou encore extraction de connaissances à partir de données, a pour objet l’extraction d'un savoir ou d'une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques.
Longueur d'un arcthumb|Camille Jordan est l'auteur de la définition la plus courante de la longueur d'un arc. En géométrie, la question de la longueur d'un arc est simple à concevoir (intuitive). L'idée d'arc correspond à celle d'une ligne, ou d'une trajectoire d'un point dans un plan ou l'espace par exemple. Sa longueur peut être vue comme la distance parcourue par un point matériel suivant cette trajectoire ou encore comme la longueur d'un fil prenant exactement la place de cette ligne. La longueur d'un arc est, soit un nombre positif, soit l'infini.
Courbe développanteIn mathematics, an involute (also known as an evolvent) is a particular type of curve that is dependent on another shape or curve. An involute of a curve is the locus of a point on a piece of taut string as the string is either unwrapped from or wrapped around the curve. The evolute of an involute is the original curve. It is generalized by the roulette family of curves. That is, the involutes of a curve are the roulettes of the curve generated by a straight line.
Data wranglingData wrangling, sometimes referred to as data munging, is the process of transforming and mapping data from one "raw" data form into another format with the intent of making it more appropriate and valuable for a variety of downstream purposes such as analytics. The goal of data wrangling is to assure quality and useful data. Data analysts typically spend the majority of their time in the process of data wrangling compared to the actual analysis of the data.
Hémogrammevignette|redresse=1.5|Prise de sang dans un hôpital de La Nouvelle-Orléans. L'hémogramme, aussi appelé numération de la formule sanguine (NFS), formule sanguine complète (FSC), ou examen hématologique complet (hémato complet), est l'analyse quantitative (numération) et qualitative (formule) des éléments figurés du sang : hématies (globules rouges ou érythrocytes), leucocytes (globules blancs) et thrombocytes (plaquettes). L'analyse se fait de nos jours par un automate d'analyses médicales, à partir d'échantillons prélevés lors d'une prise de sang, et conservés au moyen d'un anticoagulant.
Fonction poidsUne fonction poids est un outil mathématique pour le calcul de sommes, d'intégrales ou de moyennes dans lesquelles certains éléments auront plus d'importance ou d'influence que d'autres sur le même ensemble. On parle alors pour le résultat de somme pondérée ou de moyenne pondérée. Les fonctions poids sont couramment utilisées en statistique et en analyse, et peuvent être rapprochées du concept de mesure. Le concept a été étendu pour développer le « calcul différentiel pondéré » et le « méta-calcul différentiel ».