Littérature persaneLa littérature persane (en ادبیات فارسی) est la littérature écrite en persan. Certains considèrent que la littérature persane inclut les travaux écrits par des Perses en d'autres langues, comme le grec et l'arabe. Le persan est une langue indo-européenne et s'écrit généralement au moyen de l'alphabet perso-arabe, variante de l'alphabet arabe. Les travaux subsistants écrits en langues persanes (comme le vieux-persan ou le moyen-persan) remontent aussi loin qu'en 650 av. J.-C., date des inscriptions achéménides les plus anciennes retrouvées.
Désambiguïsation lexicaleLa désambiguïsation lexicale ou désambigüisation lexicale est la détermination du sens d'un mot dans une phrase lorsque ce mot peut avoir plusieurs sens possibles. Dans la linguistique informatique, la désambiguïsation lexicale est un problème non résolu dans le traitement des langues naturelles et de l'ontologie informatique. La résolution de ce problème permettrait des avancées importantes dans d'autres champs de la linguistique informatique comme l'analyse du discours, l'amélioration de la pertinence des résultats des moteurs de recherche, la résolution des anaphores, la cohérence, l'inférence, etc.
Compréhension du langage naturelvignette|L'apprentissage de la lecture par Sigurður málari, siècle. La compréhension du langage naturel (NLU en anglais) ou linterprétation en langage naturel (NLI) est une sous-rubrique du traitement de la langue naturelle en intelligence artificielle qui traite de la compréhension en lecture automatique. La compréhension du langage naturel est considérée comme un problème difficile en IA. Il existe un intérêt commercial considérable dans ce domaine en raison de son application à la collecte de nouvelles, à la catégorisation des textes, à l'activation vocale, à l'archivage et à l'analyse de contenu à grande échelle.
Génération automatique de textesLa génération automatique de texte (GAT) est une sous discipline de la linguistique computationnelle qui vise à exprimer sous une forme textuelle, syntaxiquement et sémantiquement correcte, une représentation formelle d'un contenu. Outre ses nombreuses applications existantes ou potentielles - par exemple pour produire automatiquement des bulletins météorologiques, ou des rapports automatisés - elle offre par ailleurs un cadre d'investigation des théories linguistiques, et particulièrement de ses mécanismes de production.
PersanLe persan (autonyme : فارسی, fārsī, ou پارسی, Langue|fa-Latn|pārsī) est une langue indo-européenne. C'est la langue officielle et majoritaire de l'Iran (centre, centre-sud, nord-est), de l'Afghanistan et du Tadjikistan. Le persan est une langue notable mais minoritaire au Pakistan, à Bahreïn, en Irak, en Oman, au Qatar et aux Émirats arabes unis. Le dari, dialecte du persan, également appelé persan afghan ou persan oriental, est une langue officielle en Afghanistan ; il est parlé également en Iran et au Pakistan.
Traitement automatique du langage naturelLe traitement automatique du langage naturel (TALN), en anglais natural language processing ou NLP, est un domaine multidisciplinaire impliquant la linguistique, l'informatique et l'intelligence artificielle, qui vise à créer des outils de traitement du langage naturel pour diverses applications. Il ne doit pas être confondu avec la linguistique informatique, qui vise à comprendre les langues au moyen d'outils informatiques.
Mort d'une langueEn linguistique, la mort d'une langue survient quand disparaissent les d'une langue maternelle. Par extension, lextinction d'une langue est le stade où cette langue n'est plus connue, pas même comme langue seconde. D'autres termes proches sont le linguicide, c'est-à-dire la mort d'une langue pour des motifs naturels ou politiques et, plus rarement, la « glottophagie », phénomène où une langue peu parlée est absorbée ou remplacée par une autre, comptant des locuteurs plus nombreux.
LangageLe langage est la capacité d'exprimer une pensée et de communiquer au moyen d'un système de signes (vocaux, gestuel, graphiques, tactiles, olfactifs, etc.) doté d'une sémantique, et le plus souvent d'une syntaxe — mais ce n'est pas systématique (la cartographie est un exemple de langage non syntaxique). Fruit d'une acquisition, la langue est une des nombreuses manifestations du langage. Les langages sont constitués de signaux correspondant au support physique de l'information.
TadjikLe tadjik (nom local : ; cyrillique : Тоҷикӣ, translittération ISO-9 : toçiki ou Форсии Тоҷикӣ, translittération : forsii toçiki ; écriture latine : todžikī ; alphabet perso-arabe : تاجکی, translittération : tôjikī ; ) est la variété du persan parlée au Tadjikistan. C'est une langue appartenant au groupe iranien de la famille des langues indo-européennes ; elle est très similaire au dari, qui est lui-même une variété du persan. Le tadjik est parlé en Asie centrale au Tadjikistan, dont il est la langue officielle.
Langue éteinteUne langue éteinte ou finie est une langue qui n'a plus de locuteurs natifs. Cela se produit généralement lorsqu'une langue est sujette à l' extinction linguistique et est directement remplacée par une autre langue, par exemple le copte remplacé par l'arabe et de nombreuses langues amérindiennes, remplacé par l'anglais, le français, l'espagnol et le portugais . Le terme « langue morte » se réfère aussi couramment à une langue plus ancienne qui a considérablement changé et a évolué vers un nouveau groupe linguistique autonome, dont le processus de séparation linguistique est maintenant terminé.
Moyen perseLe moyen perse ou pehlevi, pèhlevî ou pahlavi, est une langue iranienne qui était parlée à l'époque sassanide. Elle descend du vieux perse. Le moyen perse était habituellement écrit en utilisant l'écriture pehlevi. La langue était aussi écrite à l'aide de l'écriture manichéenne par les manichéens de Perse. Le descendant du moyen perse est le persan moderne, qui s'en distingue entre autres par l'écriture avec un alphabet différent, l'alphabet perso-arabe, et par de nombreux mots empruntés de l'arabe.
Langue secondeLa notion de langue seconde a deux interprétations principales. L’une provient de la sociolinguistique anglo-saxone, conformément à laquelle une langue seconde est simplement une langue acquise chronologiquement juste après la première, c’est-à-dire après la langue maternelle. Selon une autre interprétation, la notion de langue seconde est englobée dans celle de langue étrangère au sens où c’est une langue autre que la langue maternelle mais se distingue de la langue étrangère par son statut social et, éventuellement, juridique.
Langues en IndeLes langues en Inde sont très diverses et appartiennent à plusieurs familles linguistiques. Le recensement de 2011 a comptabilisé 270 langues maternelles dans le pays, dont 122 langues importantes. La Constitution indienne reconnaît 22 langues officielles. 77 % des Indiens parlent une langue indo-aryenne (dont la plus parlée du pays, le hindi, est la langue maternelle de d'Indiens, soit 41 % de la population), 20 % une langue dravidienne. Les autres familles représentées sont les langues austroasiatiques, sino-tibétaines et tai-kadai ainsi que quelques isolats.
Revitalisation linguistiqueLa revitalisation linguistique est un processus cherchant à empêcher une langue de disparaître et à la faire revivre. Le nombre de s'élève actuellement à quelques dizaines: aïnou, arabe andalou, barngarla, chochenyo, cornique, dalmate, diyari, hawaïen, kaurna, latin, laze, live, léonais, manx, māori, mutsun, gascon, vieux-prussien, palawa kani, sanskrit, wampanoag. Cette liste est ouverte, et des dizaines d'autres langues pourraient y être incluses, tant les efforts de revitalisation linguistique sont répandus dans le monde.
PersansLes Persans, Perses ou Persans occidentaux sont un peuple iranien, originaire de l'Iran, qui parle le persan et qui partage une culture et une histoire commune. Des populations importantes de Persans résident désormais en dehors d'Iran. Les plus grandes communautés étant concentrées aux États-Unis, en Allemagne, au Canada, en Suède et aux Émirats arabes unis et en Angleterre. Les termes de Perse ou Persan peuvent prêter à confusion.
Langue construitevignette|Le drapeau des langues construites, représentant la tour de Babel. Une langue construite ou planifiée (ou idéolangue, parfois dénommée langue artificielle, ou conlang pour constructed language en anglais) est une langue créée par une ou plusieurs personnes dans un temps relativement bref, contrairement aux langues naturelles dont l'élaboration est en grande partie spontanée et sans plan d'ensemble. Il est donc parfois difficile de cloisonner les langues dans ces deux catégories.
Speaker typesWithin the linguistic study of endangered languages, sociolinguists distinguish between different speaker types based on the type of competence they have acquired of the endangered language. Often when a community is gradually shifting away from an endangered language to a majority language, not all speakers acquire full linguistic competence; instead, speakers have varying degrees and types of competence depending on their exposure to the minority language in their upbringing.
Langue des signesthumb|Lettre V en langue des signes. Les langues des signes sont les langues visuo-gestuelles (produites par les mouvements des mains, du visage et du corps dans son ensemble) qui ont émergé au contact des personnes sourdes entre elles et dont l'évolution au cours du temps résulte de la pratique de leurs locuteurs. Elles assurent toutes les fonctions remplies par les langues vocales. Les langues des signes sont des langues naturelles, qui, au même titre que les langues vocales, ont émergé et évolué spontanément au cours du temps par la pratique de leurs locuteurs, sans planification ni prescription consciente ou explicite.
Indigenous languageAn indigenous language, or autochthonous language, is a language that is native to a region and spoken by indigenous peoples. This language is from a linguistically distinct community that originated in the area. Indigenous languages are not necessarily national languages but they can be; for example, Aymara is an official language of Bolivia. Also, national languages are not necessarily indigenous to the country.
Langue maternelleLa langue maternelle, par extension comprise comme langue natale, désigne la première langue qu'un enfant apprend. Dans certains cas, lorsque l'enfant est éduqué par des parents ou des personnes parlant des langues différentes, il peut acquérir ces langues simultanément, chacune pouvant être considérée comme une langue natale. Il sera peut-être alors en situation de bilinguisme parental.