University Sétif 1 FERHAT ABBAS Faculty of Sciences
Détail de l'auteur
Auteur Kara-Mohamed ,Chafia |
Documents disponibles écrits par cet auteur
Ajouter le résultat dans votre panier Affiner la recherche
Titre : Le prétraitement dans la classification des textes Type de document : texte imprimé Auteurs : Boufedji, Nour-El-Houda, Auteur ; Kara-Mohamed ,Chafia, Directeur de thèse Editeur : Setif:UFA Année de publication : 2021 Importance : 1 vol (59 f .) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Prétraitement de texte arabe
Classification du texte arabeIndex. décimale : 004 - Informatique Résumé :
La langue arabe est l’une des langues les plus anciennes et les plus complexes du monde. En raison de sa complexité, elle présente des défis majeurs pour de nombreuses applications de traitement en langage naturel.
Les pipelines de classification de texte représentent une séquence de tâches à effectuer pour classer les documents dans un ensemble de catégories prédéfinies. La phase de prétraitement (avant training) de ces pipelines implique différentes manières de transformer et de manipuler les documents pour la phase suivante (d'apprentissage).
Dans ce mémoire, nous introduisons une nouvelle étape dans la phase de prétraitement de la classification de texte pipelines. L'étape en est génération des méta-caractéristiques (MC) vise à réduire la dimensionnalité de la matrice d'origine terme-document, tout en produisant un espace potentiellement plus informatif qui exploite explicitement les informations étiquetées discriminantes. Pour la classification, nous utilisons algorithme SVM (support vector Machine).
Les expériences montrent que le pipeline de prétraitement étendu proposé produit une exactitude (accuracy) de 99% et avec un temps beaucoup plus court.Côte titre : MAI/0534 En ligne : https://drive.google.com/file/d/1YvjbRr5U8DdFJk0btxVHziTI-mH5TTJo/view?usp=shari [...] Format de la ressource électronique : Le prétraitement dans la classification des textes [texte imprimé] / Boufedji, Nour-El-Houda, Auteur ; Kara-Mohamed ,Chafia, Directeur de thèse . - [S.l.] : Setif:UFA, 2021 . - 1 vol (59 f .) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Prétraitement de texte arabe
Classification du texte arabeIndex. décimale : 004 - Informatique Résumé :
La langue arabe est l’une des langues les plus anciennes et les plus complexes du monde. En raison de sa complexité, elle présente des défis majeurs pour de nombreuses applications de traitement en langage naturel.
Les pipelines de classification de texte représentent une séquence de tâches à effectuer pour classer les documents dans un ensemble de catégories prédéfinies. La phase de prétraitement (avant training) de ces pipelines implique différentes manières de transformer et de manipuler les documents pour la phase suivante (d'apprentissage).
Dans ce mémoire, nous introduisons une nouvelle étape dans la phase de prétraitement de la classification de texte pipelines. L'étape en est génération des méta-caractéristiques (MC) vise à réduire la dimensionnalité de la matrice d'origine terme-document, tout en produisant un espace potentiellement plus informatif qui exploite explicitement les informations étiquetées discriminantes. Pour la classification, nous utilisons algorithme SVM (support vector Machine).
Les expériences montrent que le pipeline de prétraitement étendu proposé produit une exactitude (accuracy) de 99% et avec un temps beaucoup plus court.Côte titre : MAI/0534 En ligne : https://drive.google.com/file/d/1YvjbRr5U8DdFJk0btxVHziTI-mH5TTJo/view?usp=shari [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0534 MAI/0534 Mémoire Bibliothéque des sciences Français Disponible
Disponible