ActualitéNews is information about current events. This may be provided through many different media: word of mouth, printing, postal systems, broadcasting, electronic communication, or through the testimony of observers and witnesses to events. News is sometimes called "hard news" to differentiate it from soft media. Common topics for news reports include war, government, politics, education, health, the environment, economy, business, fashion, entertainment, and sport, as well as quirky or unusual events.
Infoxvignette|Manifestation aux États-Unis en 2017 contre la prolifération des infox. Les infox, fausses nouvelles, fausses informations, informations fallacieuses, canards, fake news (), sont des nouvelles mensongères diffusées dans le but de manipuler ou de tromper le public. Les articles contenant de fausses nouvelles emploient souvent des titres accrocheurs ou des informations entièrement fabriquées en vue d'augmenter le nombre de lecteurs et de partages en ligne.
Opinion miningEn informatique, l'opinion mining (aussi appelé sentiment analysis) est l'analyse des sentiments à partir de sources textuelles dématérialisées sur de grandes quantités de données (big data). Ce procédé apparait au début des années 2000 et connait un succès grandissant dû à l'abondance de données provenant de réseaux sociaux, notamment celles fournies par Twitter. L'objectif de l’opinion mining est d'analyser une grande quantité de données afin d'en déduire les différents sentiments qui y sont exprimés.
Agence de presseUne agence de presse est une organisation qui vend aux médias de l'information (textes, photos, vidéos, etc.) à la manière d'un grossiste fournissant des détaillants, ce qui permet à ces médias de s'informer sur des pays dans lesquels ils n'ont pas, ou pas assez, de correspondants, et dans des domaines (musique, sport, économie) où l'agence peut compléter ou renforcer leur propre production.
Fake news websiteFake news websites (also referred to as hoax news websites) are websites on the Internet that deliberately publish fake news—hoaxes, propaganda, and disinformation purporting to be real news—often using social media to drive web traffic and amplify their effect. Unlike news satire, fake news websites deliberately seek to be perceived as legitimate and taken at face value, often for financial or political gain. Such sites have promoted political falsehoods in India, Germany, Indonesia and the Philippines, Sweden, Mexico, Myanmar, and the United States.
News mediaThe news media or news industry are forms of mass media that focus on delivering news to the general public. These include news agencies, newspapers, news magazines, news channels etc. Some of the first news circulations occurred in Renaissance Europe. These handwritten newsletters contained news about wars, economic conditions, and social customs and were circulated among merchants. The first printed news appeared by the late 1400s in German pamphlets that contained content that was often highly sensationalized.
Journal télévisévignette|Plateau d'enregistrement d'un journal télévisé de . Un journal télévisé (terme utilisé principalement en France et en Belgique et abrégé en JT), ou téléjournal (principalement au Canada et en Suisse, abrégé en TJ), dit également bulletin d'information, est une émission d'information diffusée à la télévision et généralement animée par un journaliste présentateur unique ou un couple de présentateurs récurrents, qui introduit des reportages ou des séquences sur des sujets locaux, nationaux ou internationaux et des chroniques comme la météo.
Reconnaissance d'entités nomméesLa reconnaissance d'entités nommées est une sous-tâche de l'activité d'extraction d'information dans des corpus documentaires. Elle consiste à rechercher des objets textuels (c'est-à-dire un mot, ou un groupe de mots) catégorisables dans des classes telles que noms de personnes, noms d'organisations ou d'entreprises, noms de lieux, quantités, distances, valeurs, dates, etc. À titre d'exemple, on pourrait donner le texte qui suit, étiqueté par un système de reconnaissance d'entités nommées utilisé lors de la campagne d'évaluation MUC: Henri a acheté 300 actions de la société AMD en 2006 Henri a acheté 300 actions de la société AMD en 2006.
Désinformation sur la pandémie de Covid-19Des campagnes de désinformation sur la pandémie de Covid-19 font suite au déclenchement de l'épidémie de maladie à coronavirus 2019 (Covid-19) causée par le SARS-CoV-2. Un très grand nombre de théories du complot, infox et cas de désinformation ont été relevés, amenant l'Organisation mondiale de la santé à parler d'infodémie.
Journalthumb|Journal coréen du .|alt= vignette|Homme lisant un journal au Népal en 2019. Un journal est une publication périodique recensant des événements présentés sous la forme d'articles relatifs à une période donnée, généralement une journée, d'où son nom. Par métonymie, ce terme peut désigner des périodiques imprimés à des fréquences de parution différentes, ainsi que des formats audiovisuels du type journal télévisé, ou téléjournal (en Suisse romande et au Canada).
Traitement automatique du langage naturelLe traitement automatique du langage naturel (TALN), en anglais natural language processing ou NLP, est un domaine multidisciplinaire impliquant la linguistique, l'informatique et l'intelligence artificielle, qui vise à créer des outils de traitement du langage naturel pour diverses applications. Il ne doit pas être confondu avec la linguistique informatique, qui vise à comprendre les langues au moyen d'outils informatiques.
Annotation sémantiqueL'annotation sémantique est l'opération consistant à relier le contenu d'un texte à des entités dans une ontologie. Par exemple, pour la phrase «Paris est la capitale de la France.», l'annotation correcte de Paris serait Paris et non Paris Hilton. L'annotation sémantique est une variante plus détaillée mais moins exacte de la méthode des entitiés nommées, car ces dernières décrivent seulement la catégorie de l'entité (Paris est une ville, sans la relier à la bonne page Wikipédia).
Informationvignette|redresse=0.6|Pictogramme représentant une information. L’information est un de la discipline des sciences de l'information et de la communication (SIC). Au sens étymologique, l'« information » est ce qui donne une forme à l'esprit. Elle vient du verbe latin « informare », qui signifie « donner forme à » ou « se former une idée de ». L'information désigne à la fois le message à communiquer et les symboles utilisés pour l'écrire. Elle utilise un code de signes porteurs de sens tels qu'un alphabet de lettres, une base de chiffres, des idéogrammes ou pictogrammes.
Multimodal sentiment analysisMultimodal sentiment analysis is a technology for traditional text-based sentiment analysis, which includes modalities such as audio and visual data. It can be bimodal, which includes different combinations of two modalities, or trimodal, which incorporates three modalities. With the extensive amount of social media data available online in different forms such as videos and images, the conventional text-based sentiment analysis has evolved into more complex models of multimodal sentiment analysis, which can be applied in the development of virtual assistants, analysis of YouTube movie reviews, analysis of news videos, and emotion recognition (sometimes known as emotion detection) such as depression monitoring, among others.
Natural Language ToolkitThe Natural Language Toolkit, or more commonly NLTK, is a suite of libraries and programs for symbolic and statistical natural language processing (NLP) for English written in the Python programming language. It supports classification, tokenization, stemming, tagging, parsing, and semantic reasoning functionalities. It was developed by Steven Bird and Edward Loper in the Department of Computer and Information Science at the University of Pennsylvania. NLTK includes graphical demonstrations and sample data.
Sciences de l'information et des bibliothèquesLes sciences de l'information et des bibliothèques (SIB) sont la convergence des deux champs disciplinaires que sont la bibliothéconomie et la science de l'information. Elles regroupent l'ensemble des savoirs et savoir-faire utiles à la gestion de l'information consignée. La notion de sciences de l'information se retrouve de plus en plus, depuis la fin du , dans les intitulés d'écoles ou de formations pour les professionnels de l'information consignée (personnes chargées de gérer une bibliothèque, un centre d'archives ou un service de documentation par exemple).
RisqueLe risque est la possibilité de survenue d'un événement indésirable, la probabilité d’occurrence d'un péril probable ou d'un aléa. Le risque est une notion complexe, de définitions multiples car d'usage multidisciplinaire. Néanmoins, il est un concept très usité depuis le , par exemple sous la forme de l'expression , notamment pour qualifier, dans le sens commun, un événement, un inconvénient qu'il est raisonnable de prévenir ou de redouter l'éventualité.
Natural-language user interfaceNatural-language user interface (LUI or NLUI) is a type of computer human interface where linguistic phenomena such as verbs, phrases and clauses act as UI controls for creating, selecting and modifying data in software applications. In interface design, natural-language interfaces are sought after for their speed and ease of use, but most suffer the challenges to understanding wide varieties of ambiguous input. Natural-language interfaces are an active area of study in the field of natural-language processing and computational linguistics.