Concept

Corpus

Séances de cours associées (31)

Indexation sémantique latente : concepts et applications

Explore l'indexation sémantique latente, la construction de vocabulaire, la création de matrices de documents, la transformation de requêtes et la récupération de documents en utilisant la similarité cosinus.

Réseaux neuronaux pour la PNL

Couvre les approches modernes du réseau neuronal en matière de PNL, en mettant l'accent sur l'intégration de mots, les réseaux neuronaux pour les tâches de PNL et les futures techniques d'apprentissage par transfert.

Traitement de texte: Humanités Informatique et Linguistique

Explore le traitement de grands textes numériques, révélant des modèles et des structures cachés, et la convergence des sciences humaines et de la linguistique computationnelle.

Introduction au NLP et au cours

Couvre les bases du traitement des langues naturelles, y compris les défis, les niveaux de traitement des langues et l'impact des lois sur le pouvoir.

Word Embeddings: Présentation et applications

Introduit des intégrations de mots, expliquant comment ils capturent les significations des mots en fonction du contexte et de leurs applications dans les tâches de traitement du langage naturel.

Traitement de données texte: bases et techniques

Présente les bases du traitement de données textuelles, couvrant la récupération de documents, la classification, l'analyse des sentiments et la détection de sujets.

Taxonomie Induction : Relations Extraction et Construction Graphique

Couvre l'extraction des relations et la construction de graphes dans l'induction de la taxonomie, en mettant l'accent sur la réduction du bruit pour des graphes précis.

Texte de manipulation : Récupération de documents, classification, analyse des sentiments

Explore la recherche de documents, la classification, l'analyse des sentiments, les matrices TF-IDF, les méthodes de voisinage les plus proches, la factorisation matricielle, la régularisation, LDA, les vecteurs de mots contextualisés et BERT.

Récupération de texte : classement des documents

Couvre les tâches de recherche de texte avec le classement et le re-classement des documents, en utilisant un grand corpus pour l'évaluation.

Recherche d'informations : Fagin's Algorithm

Couvre la mise en œuvre de l'algorithme de Fagin pour la récupération d'informations, en mettant l'accent sur la récupération efficace de documents.

Indexation pour la récupération d'informations

Explore les techniques d'indexation, les fichiers inversés, les modèles map-reduce et l'utilisation de trie pour une récupération d'informations efficace.

Phrase clé Extraction

Couvre l'extraction de phrases clés, une méthode pour extraire des phrases importantes du texte pour la synthèse, l'indexation et la recherche de documents.

Traitement de texte : Analyse de grandes collections de texte numérique

Plongez dans le traitement de grandes collections de textes numériques, en explorant les régularités cachées, la réutilisation du texte et l'analyse TF-IDF.

Prétraitement PNL: Tokenization, Stop Words, Lemmatization

Couvre la tokenisation, la suppression des mots d'arrêt et la lemmatisation pour les tâches PNL.

Récupération d'information: espace vectoriel

Couvre les bases de la récupération d'informations à l'aide de modèles d'espace vectoriel et d'exercices pratiques sur la rétroaction de pertinence et la numérisation de la liste de publication.

Récupération probabiliste

Couvre la récupération d'informations probabilistes, la pertinence de la modélisation en tant que probabilité, l'expansion des requêtes et la génération automatique de thésaurus.

Extraction de l'information : approches et techniques

Couvre les approches d'extraction d'informations, y compris les modèles écrits à la main et l'apprentissage supervisé.

Traitement du langage naturel: comprendre les transformateurs et la tokenisation

Fournit un aperçu du traitement du langage naturel, en se concentrant sur les transformateurs, la tokenisation et les mécanismes d'auto-attention pour une analyse et une synthèse efficaces du langage.

Compréhension de texte

Explore la compréhension du texte, en se concentrant sur les entités nommées, l'extraction d'informations et les méthodes de lecture automatique.

Encodage de texte : Unicode et XML

Explore l'évolution de l'encodage de texte, Unicode, XML, OCR, HTR et la gestion des variations orthographiques dans les textes historiques.