Titre : |
Apprentissage statistique pour l’extraction des relations à partir de textes |
Type de document : |
texte imprimé |
Auteurs : |
Belazzoug,Mouhoub, Auteur ; Abdallah Khababa, Directeur de thèse |
Editeur : |
Setif:UFA |
Année de publication : |
2021 |
Importance : |
1 vol (101 f .) |
Format : |
29 cm |
Langues : |
Français (fre) |
Catégories : |
Thèses & Mémoires:Informatique
|
Mots-clés : |
Catégorisation des textes
Gain d'informations |
Index. décimale : |
004 - Informatique |
Résumé : |
Le modèle de sac de mots est couramment utilisé dans la catégorisation de textes. Le
problème principal de ce dernier réside dans le grand nombre d’attributs extraits, cela influe
négativement sur les performances des tâches de catégorisation. Pour résoudre ce problème,
une méthode de sélection des fonctionnalités est nécessaire. La sélection des fonctionnalités
est bénéfique pour réduire la dimensionnalité du problème, elle conduit à minimiser le temps
de calcul et à améliorer les performances de la tâche de catégorisation. Dans cette thèse, nous
proposons un nouvel algorithme amélioré de l’algorithme original de recherche Sinus
Cosinus (SCA) pour la sélection des fonctionnalités, qui permet une meilleure exploration
dans l'espace de recherche. Contrairement au SCA qui se concentre uniquement sur la
meilleure solution pour générer une nouvelle solution, le nouvel algorithme (ISCA) de notre
proposition prend en compte deux positions de la solution : (i) la position de la meilleure
solution trouvée jusqu'à présent, et (ii) une position aléatoire appartenant à l'espace de
recherche. Cette combinaison nous permet de proposer un algorithme simple capable d'éviter
une convergence prématurée et d'obtenir des performances très satisfaisantes. Pour valider le
nouvel algorithme ISCA, nous avons effectué une série d'expériences sur neuf collections de
textes, où nous avons comparé les résultats expérimentaux avec plusieurs algorithmes de
recherche, y compris l'algorithme SCA d'origine et certaines de ses versions améliorées, ainsi
que l’algorithme d’optimisation Moth-Flam (MFO). De plus, de l'état de l'art, les algorithmes
génétiques (GA) ainsi que les colonies de fourmis (ACO) sont choisis dans notre étude
comparative. Nos résultats d'évaluation démontrent la haute performance de notre algorithme
ISCA proposé qui le rend très utile pour les problèmes de catégorisation de textes. |
Côte titre : |
DI/0063 |
En ligne : |
http://dspace.univ-setif.dz:8888/jspui/bitstream/123456789/3845/1/Belazoug%20Th% [...] |
Format de la ressource électronique : |
PDF |
Apprentissage statistique pour l’extraction des relations à partir de textes [texte imprimé] / Belazzoug,Mouhoub, Auteur ; Abdallah Khababa, Directeur de thèse . - [S.l.] : Setif:UFA, 2021 . - 1 vol (101 f .) ; 29 cm. Langues : Français ( fre)
Catégories : |
Thèses & Mémoires:Informatique
|
Mots-clés : |
Catégorisation des textes
Gain d'informations |
Index. décimale : |
004 - Informatique |
Résumé : |
Le modèle de sac de mots est couramment utilisé dans la catégorisation de textes. Le
problème principal de ce dernier réside dans le grand nombre d’attributs extraits, cela influe
négativement sur les performances des tâches de catégorisation. Pour résoudre ce problème,
une méthode de sélection des fonctionnalités est nécessaire. La sélection des fonctionnalités
est bénéfique pour réduire la dimensionnalité du problème, elle conduit à minimiser le temps
de calcul et à améliorer les performances de la tâche de catégorisation. Dans cette thèse, nous
proposons un nouvel algorithme amélioré de l’algorithme original de recherche Sinus
Cosinus (SCA) pour la sélection des fonctionnalités, qui permet une meilleure exploration
dans l'espace de recherche. Contrairement au SCA qui se concentre uniquement sur la
meilleure solution pour générer une nouvelle solution, le nouvel algorithme (ISCA) de notre
proposition prend en compte deux positions de la solution : (i) la position de la meilleure
solution trouvée jusqu'à présent, et (ii) une position aléatoire appartenant à l'espace de
recherche. Cette combinaison nous permet de proposer un algorithme simple capable d'éviter
une convergence prématurée et d'obtenir des performances très satisfaisantes. Pour valider le
nouvel algorithme ISCA, nous avons effectué une série d'expériences sur neuf collections de
textes, où nous avons comparé les résultats expérimentaux avec plusieurs algorithmes de
recherche, y compris l'algorithme SCA d'origine et certaines de ses versions améliorées, ainsi
que l’algorithme d’optimisation Moth-Flam (MFO). De plus, de l'état de l'art, les algorithmes
génétiques (GA) ainsi que les colonies de fourmis (ACO) sont choisis dans notre étude
comparative. Nos résultats d'évaluation démontrent la haute performance de notre algorithme
ISCA proposé qui le rend très utile pour les problèmes de catégorisation de textes. |
Côte titre : |
DI/0063 |
En ligne : |
http://dspace.univ-setif.dz:8888/jspui/bitstream/123456789/3845/1/Belazoug%20Th% [...] |
Format de la ressource électronique : |
PDF |
|