Titre : | Apprentissage statistique pour l’extraction des relations à partir de textes |
Auteurs : | Mouhoub Belazzoug, Auteur ; Abdallah Khababa, Directeur de thèse |
Type de document : | document électronique |
Editeur : | Sétif : Universite ferhat abbas faculté des sciences département d’informatique, 2021 |
ISBN/ISSN/EAN : | E-TH/1937 |
Format : | 1 vol. (107 f.) / ill. / CD |
Note générale : | Références |
Langues: | Français |
Catégories : | |
Résumé : |
Le modèle de sac de mots est couramment utilisé dans la catégorisation de textes. Le problème principal de ce dernier réside dans le grand nombre d’attributs extraits, cela influe négativement sur les performances des tâches de catégorisation. Pour résoudre ce problème, une méthode de sélection des fonctionnalités est nécessaire. La sélection des fonctionnalités est bénéfique pour réduire la dimensionnalité du problème, elle conduit à minimiser le temps de calcul et à améliorer les performances de la tâche de catégorisation. Dans cette thèse, nous proposons un nouvel algorithme amélioré de l’algorithme original de recherche Sinus Cosinus (SCA) pour la sélection des fonctionnalités, qui permet une meilleure exploration dans l'espace de recherche. Contrairement au SCA qui se concentre uniquement sur la meilleure solution pour générer une nouvelle solution, le nouvel algorithme (ISCA) de notre proposition prend en compte deux positions de la solution : (i) la position de la meilleure solution trouvée jusqu'à présent, et (ii) une position aléatoire appartenant à l'espace de recherche. Cette combinaison nous permet de proposer un algorithme simple capable d'éviter une convergence prématurée et d'obtenir des performances très satisfaisantes. Pour valider le nouvel algorithme ISCA, nous avons effectué une série d'expériences sur neuf collections de ,textes, où nous avons comparé les résultats expérimentaux avec plusieurs algorithmes de recherche, y compris l'algorithme SCA d'origine et certaines de ses versions améliorées, ainsi que l’algorithme d’optimisation Moth Flam (MFO). De plus, de l'état de l'art, les algorithmes génétiques (GA) ainsi que les colonies de fourmis (ACO) sont choisis dans notre étude comparative. Nos résultats d'évaluation démontrent la haute performance de notre algorithme ISCA proposé qui le rend très utile pour les problèmes de catégorisation de textes. |
En ligne : | http://dspace.univ-setif.dz:8888/jspui/retrieve/7446/Belazoug%20Th%c3%a8se%20Version%20Finale.pdf |
Exemplaires (1)
Cote | Support | Localisation | Disponibilité |
---|---|---|---|
E-TH/1937 | Thèse | Bibliothèque centrale | Disponible |
Accueil