Publication

SKA Science Data Challenge 2: analysis and results

Concepts associés (27)

Le big data ( « grosses données » en anglais), les mégadonnées ou les données massives, désigne les ressources d’informations dont les caractéristiques en termes de volume, de vélocité et de variété imposent l’utilisation de technologies et de méthodes analytiques particulières pour créer de la valeur, et qui dépassent en général les capacités d'une seule et unique machine et nécessitent des traitements parallélisés. L’explosion quantitative (et souvent redondante) des données numériques permet une nouvelle approche pour analyser le monde.

Open scientific data

Open scientific data or open research data is a type of open data focused on publishing observations and results of scientific activities available for anyone to analyze and reuse. A major purpose of the drive for open data is to allow the verification of scientific claims, by allowing others to look at the reproducibility of results, and to allow data from many sources to be integrated to give new knowledge. The modern concept of scientific data emerged in the second half of the 20th century, with the development of large knowledge infrastructure to compute scientific information and observation.

Communauté scientifique

La communauté scientifique désigne, dans un sens assez large, l'ensemble des chercheurs et autres personnalités dont les travaux ont pour objet les sciences et la recherche scientifique, selon des méthodes scientifiques. Parfois cette expression se réduit à un domaine scientifique particulier : la communauté des astrophysiciens pour l'astrophysique, par exemple. La sociologie des sciences s'intéresse à cette communauté, à la façon dont elle fonctionne et s'inscrit dans la société.

Science ouverte

La science ouverte (en ou en pour les anglophones) est un mouvement qui cherche à rendre la recherche scientifique et les données qu'elle produit accessibles à tous et dans tous les niveaux de la société. Pour cela, la science ouverte s'appuie fortement sur le recours à l'Internet ouvert, à l'open data, aux outils de travail collaboratif (dont Wikipédia, Wikiversité et Wikispecies font partie), à la formation en ligne et au web social de manière à rendre la recherche scientifique et ses données accessibles à tous (amateurs et professionnels).

Méthode scientifique

La méthode scientifique désigne l'ensemble des canons guidant ou devant guider le processus de production des connaissances scientifiques, qu'il s'agisse d'observations, d'expériences, de raisonnements, ou de calculs théoriques. Très souvent, le terme de « méthode » engage l'idée implicite de son unicité, tant auprès du grand public que de certains chercheurs, qui de surcroît la confondent parfois avec la seule méthode hypothético-déductive.

Apprentissage ensembliste

In statistics and machine learning, ensemble methods use multiple learning algorithms to obtain better predictive performance than could be obtained from any of the constituent learning algorithms alone. Unlike a statistical ensemble in statistical mechanics, which is usually infinite, a machine learning ensemble consists of only a concrete finite set of alternative models, but typically allows for much more flexible structure to exist among those alternatives.

Open research

Open research is research that is openly accessible by others. Those who publish research in this way are often concerned with making research more transparent, more collaborative, more wide-reaching, and more efficient. Open research aims to make both research methods and the resulting data freely available, often via the internet, in order to support reproducibility and, potentially, massively distributed research collaboration. In this regard, it is related to both open source software and citizen science.

Apprentissage automatique

L'apprentissage automatique (en anglais : machine learning, « apprentissage machine »), apprentissage artificiel ou apprentissage statistique est un champ d'étude de l'intelligence artificielle qui se fonde sur des approches mathématiques et statistiques pour donner aux ordinateurs la capacité d'« apprendre » à partir de données, c'est-à-dire d'améliorer leurs performances à résoudre des tâches sans être explicitement programmés pour chacune. Plus largement, il concerne la conception, l'analyse, l'optimisation, le développement et l'implémentation de telles méthodes.

Science

thumb|Allégorie de la Science par Jules Blanchard, située sur le parvis de l'hôtel de ville de Paris. La (du latin scientia, « connaissance », ) est dans son sens premier « la somme des connaissances » et plus spécifiquement une entreprise systématique de construction et d'organisation des connaissances sous la forme d'explications et de prédictions testables.

Consensus scientifique

vignette|Julian Huxley donne en 1942 son nom à la théorie synthétique de l'évolution, laquelle fait aujourd'hui largement consensus dans la communauté scientifique. Le consensus scientifique est le jugement, la position, et l'opinion collectifs des personnes de la communauté scientifique qui travaillent sur un domaine particulier d'étude. Le consensus implique un accord général, mais pas nécessairement à l'unanimité. Un consensus scientifique peut être considéré comme controversé dans la sphère publique alors qu'il est accepté par la communauté scientifique.

Science de la nature

Les sciences de la nature, ou sciences naturelles, ont pour objet le monde naturel. Il s'agit de termes surtout utilisés dans le domaine de l'enseignement scolaire. Les termes « sciences de la nature », « sciences naturelles » et « histoire naturelle » sont en réalité équivalents. La nuance sémantique qui les différencie consiste en ce que « sciences de la nature » et « sciences naturelles » sont des termes qui mettent l'accent sur un ensemble de sciences, chacune spécialisée, alors que le terme « histoire naturelle », le plus ancien des trois, est toujours exprimé au singulier en signifiant ainsi davantage l'unicité des sciences qui étudient la nature plutôt que leur diversité en tant que telle.

Sciences numériques

Les sciences numériques (traduction de l'anglais computational sciences), autrement dénommées calcul scientifique ou informatique scientifique, ont pour objet la construction de modèles mathématiques et de méthodes d'analyse quantitative, en se basant sur l'utilisation des sciences du numérique, pour analyser et résoudre des problèmes scientifiques. Cette approche scientifique basée sur un recours massif aux modélisations informatiques et mathématiques et à la simulation se décline en : médecine numérique, biologie numérique, archéologie numérique, mécanique numérique, par exemple.

Science des données

La science des données est l'étude de l’extraction automatisée de connaissance à partir de grands ensembles de données. Plus précisément, la science des données est un domaine interdisciplinaire qui utilise des méthodes, des processus, des algorithmes et des systèmes scientifiques pour extraire des connaissances et des idées à partir de nombreuses données structurées ou non . Elle est souvent associée aux données massives et à l'analyse des données.

Données ouvertes

vignette|Autocollants utilisés par les militants des données ouvertes. Les données ouvertes (en anglais : open data) sont des données numériques dont l'accès et l'usage sont laissés libres aux usagers, qui peuvent être d'origine privée mais surtout publique, produites notamment par une collectivité ou un établissement public. Elles sont diffusées de manière structurée selon une méthode et une licence ouverte garantissant leur libre accès et leur réutilisation par tous, sans restriction technique, juridique ou financière.

Algorithme d'apprentissage incrémental

En informatique, un algorithme d'apprentissage incrémental ou incrémentiel est un algorithme d'apprentissage qui a la particularité d'être online, c'est-à-dire qui apprend à partir de données reçues au fur et à mesure du temps. À chaque incrément il reçoit des données d'entrées et un résultat, l'algorithme calcule alors une amélioration du calcul fait pour prédire le résultat à partir des données d'entrées.

Apprentissage de représentations

En apprentissage automatique, l'apprentissage des caractéristiques ou apprentissage des représentations est un ensemble de techniques qui permet à un système de découvrir automatiquement les représentations nécessaires à la détection ou à la classification des caractéristiques à partir de données brutes. Cela remplace l'ingénierie manuelle des fonctionnalités et permet à une machine d'apprendre les fonctionnalités et de les utiliser pour effectuer une tâche spécifique.

Apprentissage non supervisé

Dans le domaine informatique et de l'intelligence artificielle, l'apprentissage non supervisé désigne la situation d'apprentissage automatique où les données ne sont pas étiquetées (par exemple étiquetées comme « balle » ou « poisson »). Il s'agit donc de découvrir les structures sous-jacentes à ces données non étiquetées. Puisque les données ne sont pas étiquetées, il est impossible à l'algorithme de calculer de façon certaine un score de réussite.

Center for Open Science

Le Center for Open Science (littéralement Centre pour la science ouverte) est un organisme à but non lucratif situé à Charlottesville, en Virginie. Il a pour but de « favoriser l'ouverture, l'intégrité et la reproductibilité de la recherche scientifique ». et Jeffrey Spies ont fondé cet organisme officiellement en janvier 2013, avec un financement apporté par la . Le Centre a entamé ses travaux de reproductibilité dans le domaine de la recherche en psychologie.

Histoire des sciences

L'histoire des sciences est l’étude de l'évolution de la connaissance scientifique. La science, en tant que corpus de connaissances, mais également comme manière d'aborder et de comprendre le monde, s'est constituée progressivement depuis plusieurs millénaires. C'est aux époques protohistoriques qu'ont commencé à se développer les spéculations intellectuelles visant à élucider les mystères de l'univers. L'histoire des sciences est une discipline qui étudie le mouvement progressif de transformation de ces spéculations et l'accumulation des connaissances qui l'accompagne.

Apprentissage profond

L'apprentissage profond ou apprentissage en profondeur (en anglais : deep learning, deep structured learning, hierarchical learning) est un sous-domaine de l’intelligence artificielle qui utilise des réseaux neuronaux pour résoudre des tâches complexes grâce à des architectures articulées de différentes transformations non linéaires. Ces techniques ont permis des progrès importants et rapides dans les domaines de l'analyse du signal sonore ou visuel et notamment de la reconnaissance faciale, de la reconnaissance vocale, de la vision par ordinateur, du traitement automatisé du langage.