Nombre de sujets nécessairesEn statistique, la détermination du nombre de sujets nécessaires est l'acte de choisir le nombre d'observations ou de répétitions à inclure dans un échantillon statistique. Ce choix est très important pour pouvoir faire de l'inférence sur une population. En pratique, la taille de l'échantillon utilisé dans une étude est déterminée en fonction du coût de la collecte des données et de la nécessité d'avoir une puissance statistique suffisante.
Chemical propertyA chemical property is any of a material's properties that becomes evident during, or after, a chemical reaction; that is, any quality that can be established only by changing a substance's chemical identity. Simply speaking, chemical properties cannot be determined just by viewing or touching the substance; the substance's internal structure must be affected greatly for its chemical properties to be investigated. When a substance goes under a chemical reaction, the properties will change drastically, resulting in chemical change.
Substance chimiquethumb|Différentes substances chimiques de la famille des lanthanides. Une substance chimique, ou produit chimique (parfois appelée substance pure), est tout échantillon de matière de composition chimique définie et présentant des propriétés caractéristiques (couleur, odeur, densité, point de fusion), indépendamment de son origine. Il n'est pas toujours aisé de donner une définition précise d'une substance chimique. De manière générale, cette notion désigne un produit manufacturé (synthétisé) par l'Homme (n'existant pas dans la nature ou copiant des molécules existant dans la nature).
Data PreprocessingData preprocessing can refer to manipulation or dropping of data before it is used in order to ensure or enhance performance, and is an important step in the data mining process. The phrase "garbage in, garbage out" is particularly applicable to data mining and machine learning projects. Data collection methods are often loosely controlled, resulting in out-of-range values, impossible data combinations, and missing values, amongst other issues. Analyzing data that has not been carefully screened for such problems can produce misleading results.
Relative species abundanceRelative species abundance is a component of biodiversity and is a measure of how common or rare a species is relative to other species in a defined location or community. Relative abundance is the percent composition of an organism of a particular kind relative to the total number of organisms in the area. Relative species abundances tend to conform to specific patterns that are among the best-known and most-studied patterns in macroecology. Different populations in a community exist in relative proportions; this idea is known as relative abundance.
Taux d'intérêtLe taux d'intérêt d'un prêt ou d'un emprunt fixe la rémunération du capital prêté (exprimée en pourcentage du montant prêté) versée par l'emprunteur au prêteur. Le taux et les modalités de versement de cette rémunération sont fixés lors de la conclusion du contrat de prêt. Ce pourcentage tient compte de la durée du prêt, de la nature des risques encourus et des garanties offertes par le prêteur. Les taux d'intérêt sont utilisés dans de multiples domaines, des instruments financiers jusqu'aux produits d'épargne (compte d'épargne), en passant par les obligations.
Abondance naturelleL'abondance naturelle est le pourcentage en nombre d'atomes, pour un élément donné, de chacun des isotopes par rapport à l'ensemble des isotopes (naturels) trouvés sur une planète ou une étoile. Cette notion est donc relative à la matière considérée, étoile, planète, et dans le cas de la Terre, réservoir ou roche considérés. La somme des masses atomiques de chacun des isotopes, pondérées par leur abondance naturelle, donne la masse atomique moyenne de l'élément, telle qu'on la trouve dans le tableau périodique.
Data wranglingData wrangling, sometimes referred to as data munging, is the process of transforming and mapping data from one "raw" data form into another format with the intent of making it more appropriate and valuable for a variety of downstream purposes such as analytics. The goal of data wrangling is to assure quality and useful data. Data analysts typically spend the majority of their time in the process of data wrangling compared to the actual analysis of the data.
Exploration de donnéesL’exploration de données, connue aussi sous l'expression de fouille de données, forage de données, prospection de données, data mining, ou encore extraction de connaissances à partir de données, a pour objet l’extraction d'un savoir ou d'une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques.
Specified complexitySpecified complexity is a creationist argument introduced by William Dembski, used by advocates to promote the pseudoscience of intelligent design. According to Dembski, the concept can formalize a property that singles out patterns that are both specified and complex, where in Dembski's terminology, a specified pattern is one that admits short descriptions, whereas a complex pattern is one that is unlikely to occur by chance. Proponents of intelligent design use specified complexity as one of their two main arguments, alongside irreducible complexity.
Composition chimiqueLa matière étant constituée en général de plusieurs corps purs (composés chimiques et corps simples), la composition chimique d'un produit fournit la quantité ou la proportion de chacun des corps purs qui le composent ; on les appelle de manière générique des composants. On parle de : composition qualitative lorsque l'on se contente simplement d'identifier les composants. Par exemple, l'air est essentiellement composé de diazote et de dioxygène ; composition quantitative lorsqu'on leur adjoint les concentrations, les quantités.
Analyse des donnéesL’analyse des données (aussi appelée analyse exploratoire des données ou AED) est une famille de méthodes statistiques dont les principales caractéristiques sont d'être multidimensionnelles et descriptives. Dans l'acception française, la terminologie « analyse des données » désigne donc un sous-ensemble de ce qui est appelé plus généralement la statistique multivariée. Certaines méthodes, pour la plupart géométriques, aident à faire ressortir les relations pouvant exister entre les différentes données et à en tirer une information statistique qui permet de décrire de façon plus succincte les principales informations contenues dans ces données.