Titre : | Extraction d'information à partir des données textuelles par les méthodes de text mining application à la langue arabe |
Auteurs : | Abdelhalim Saadi ; Mohamed Touahria, Directeur de thèse |
Type de document : | texte imprimé |
Editeur : | Sétif : Universite ferhat abbas faculté des sciences de l’ingénieur département d’informatique, 2007 |
ISBN/ISSN/EAN : | TS4/7500 |
Format : | 1 vol. (84 f.) / ill. |
Note générale : | Bibliogr. |
Langues: | Français |
Catégories : | |
Note de contenu : |
Sommaire: Remerciement Table des matieres: Introduction -Chapitre 01 : Etat de l'art 1.1 Extraction de l'information 1.2 Applications de l'extraction de l'information 1.3 Les approches De L'extraction de l'information 1.4 Motivations pour les systèmes d'extraction d'information de la Langue Arabe -Chapitre 02 : La Fouille de texte 2.1 La fouille de texte (Text Mining) 2.2 Origines de la fouille de texte 2.2.1 La recherche documentaire (IR) 2.2.2 Traitement du langage naturel (NLP) 2.3 Architecture générale des systèmes de Text Mining 2.3.1 Architecture fonctionnelle 2.3.1.1 Les tâches de prétraitement 2.3.1.1.1 Approches orientée-tâche 2.3.1.1.2 Objectifs généraux du NLP 2.3.1.2 Les opérations de fouille du noyau 2.3.1.3 Les composants de la couche de présentation 2.3.1.4 Techniques d'amélioration 2.3.2 Processus de la fouille de texte 2.3.2.1 La préparation de données 2.3.2.2 L'analyse statistique 2.3.2.3 Les représentations graphiques 2.4 Conclusion -Chapitre 03 : Modélisation statistique de la langue 3.1 Introduction 3.2 Les modèles N-grammes 3.3 Pourquoi l'usage seulement de Bi- ou tri- grammes? 3.4 Problème du manque de données d'apprentissage 3.4.1 Énoncé du problème 3.4.2 Backoff Smoothing Katz 3.5 Conclusion -Chapitre 04 : Modèles de markov cachés (HMM) 4.1 Introduction 4.2 Principe de modèles de Markov Cachés (HMM's) 4.3 Les trois problèmes fondamentaux d'un HMM 4.4 Principe de l'Algorithme de Viterbi 4.5 Les formules de ré-estimation 4.6 Conclusion -Chapitre 05 : L'analyse morphologique de la langue arabe 5.1 Introduction 5.2 Caractéristiques morphologiques de la langue arabe 5.3 L'analyse morphologiques de l'arabe a. Principe de l'analyseur b. Dictionnaire des schèmes c. Dictionnaire des racines d. Dictionnaire des mots outils e. Dictionnaire des mots spécifiques f. Dictionnaire des mots vides du domaine 5.4 Méthodologie utilisée 5.4.1 Découpage 5.4.1.1 Techniques de segmentation 5.4.1.2 Notion de proclitique / enclitique 5.4.1.3 Comparaison des différentes techniques 5.4.1.4 Principe de l'analyse 5.4.1.5 Reconnaissance des préfixes et des suffixes 5.4.2 Recherche de schème et de la racine 5.4.2.1Méthode de recherche de schème 5.4.2.2 Recherche de la racine 5.4.3 Interprétation 5.5 Conclusion -Chapitre 06 : Etiquetage des parties de discours (pos tagging) 6.1 Introduction 6.2 Description de l'ensemble de POS tag (les étiquettes des parties de discours) 6.2.1 Les Noms 6.2.2 Les Pronoms 6.2.3 Les Verbes 6.2.4 Les Particules 6.3 Approches des étiqueteurs 6.4 Les étiqueteurs à base des règles 6.5 L'étiqueteur de Brill (Brill's Tagger) 6.6 Les étiqueteurs probabilistes 6.7 Conclusion -Chapitre07 :Utilisation des méthodes statistiques pour l'extraction de l'information 7.1 Introduction 7.2 Le problème des analyses 7.3 L'approche pour l'extraction de l'information 7.4 Le Module de NLP 7.5 Conclusion Conclusion Listesdes figures Listesdes tableaux Listes des abreviations Bibiliographie |
Exemplaires (1)
Cote | Support | Localisation | Disponibilité |
---|---|---|---|
TS4/7500 | Thèse | Bibliothèque centrale | Disponible |
Accueil