Catalogue en ligne

University Sétif 1 FERHAT ABBAS Faculty of Sciences

Nouvelle recherche

Détail de l'auteur

Auteur Kara-Mohamed ,Chafia

Documents disponibles écrits par cet auteur

Ajouter le résultat dans votre panier Affiner la recherche

Le prétraitement dans la classification des textes / Boufedji, Nour-El-Houda

Public

ISBD

Titre : Le prétraitement dans la classification des textes
Type de document : texte imprimé
Auteurs : Boufedji, Nour-El-Houda, Auteur ; Kara-Mohamed ,Chafia, Directeur de thèse
Editeur : Setif:UFA
Année de publication : 2021
Importance : 1 vol (59 f .)
Format : 29 cm
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique

Mots-clés : Prétraitement de texte arabe
Classification du texte arabe
Index. décimale : 004 - Informatique
Résumé :
La langue arabe est l’une des langues les plus anciennes et les plus complexes du monde. En raison de sa complexité, elle présente des défis majeurs pour de nombreuses applications de traitement en langage naturel.
Les pipelines de classification de texte représentent une séquence de tâches à effectuer pour classer les documents dans un ensemble de catégories prédéfinies. La phase de prétraitement (avant training) de ces pipelines implique différentes manières de transformer et de manipuler les documents pour la phase suivante (d'apprentissage).
Dans ce mémoire, nous introduisons une nouvelle étape dans la phase de prétraitement de la classification de texte pipelines. L'étape en est génération des méta-caractéristiques (MC) vise à réduire la dimensionnalité de la matrice d'origine terme-document, tout en produisant un espace potentiellement plus informatif qui exploite explicitement les informations étiquetées discriminantes. Pour la classification, nous utilisons algorithme SVM (support vector Machine).
Les expériences montrent que le pipeline de prétraitement étendu proposé produit une exactitude (accuracy) de 99% et avec un temps beaucoup plus court.
Côte titre : MAI/0534
En ligne : https://drive.google.com/file/d/1YvjbRr5U8DdFJk0btxVHziTI-mH5TTJo/view?usp=shari [...]
Format de la ressource électronique : pdf

Le prétraitement dans la classification des textes [texte imprimé] / Boufedji, Nour-El-Houda, Auteur ; Kara-Mohamed ,Chafia, Directeur de thèse . - [S.l.] : Setif:UFA, 2021 . - 1 vol (59 f .) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique

Mots-clés : Prétraitement de texte arabe
Classification du texte arabe
Index. décimale : 004 - Informatique
Résumé :
La langue arabe est l’une des langues les plus anciennes et les plus complexes du monde. En raison de sa complexité, elle présente des défis majeurs pour de nombreuses applications de traitement en langage naturel.
Les pipelines de classification de texte représentent une séquence de tâches à effectuer pour classer les documents dans un ensemble de catégories prédéfinies. La phase de prétraitement (avant training) de ces pipelines implique différentes manières de transformer et de manipuler les documents pour la phase suivante (d'apprentissage).
Dans ce mémoire, nous introduisons une nouvelle étape dans la phase de prétraitement de la classification de texte pipelines. L'étape en est génération des méta-caractéristiques (MC) vise à réduire la dimensionnalité de la matrice d'origine terme-document, tout en produisant un espace potentiellement plus informatif qui exploite explicitement les informations étiquetées discriminantes. Pour la classification, nous utilisons algorithme SVM (support vector Machine).
Les expériences montrent que le pipeline de prétraitement étendu proposé produit une exactitude (accuracy) de 99% et avec un temps beaucoup plus court.
Côte titre : MAI/0534
En ligne : https://drive.google.com/file/d/1YvjbRr5U8DdFJk0btxVHziTI-mH5TTJo/view?usp=shari [...]
Format de la ressource électronique : pdf

Exemplaires (1)

Code-barres Cote Support Localisation Section Disponibilité
MAI/0534 MAI/0534 Mémoire Bibliothéque des sciences Français Disponible
Disponible