Titre : | Apprentissage et fouille de données par les algorithmes bio-inspirés : application à la reconnaissance de caractères arabes manuscrits |
Auteurs : | Meriem Gagaoua ; Abdelouaheb Moussaoui, Directeur de thèse |
Type de document : | texte imprimé |
Editeur : | Sétif : Universite ferhat abbas faculté des sciences de l’ingénieur département d’informatique, 2012 |
ISBN/ISSN/EAN : | TS4/8248 |
Format : | 1 vol. (115 f.) / ill. |
Note générale : | Bibliogr.Annexes |
Langues: | Français |
Catégories : | |
Résumé : |
Dans Ce travail nous avons traiter la problématique de la reconnaissance de l’écriture arabe manuscrite. Nous avons couplé deux algorithmes bio-inspirés, un système immunitaire artificiel pour la reconnaissance de mots et un algorithme génétique pour la sélection d’attributs de classification. L’écriture arabe diffère des autres écritures par sa nature complexe `a savoir la forte cursivité, la présence de points diacritiques, présence de mots ligaturés, elle a plusieurs fontes(Kofi, Thuluth et Diwani) et etc. A part les professionnels, d’autres scripteurs ne peuvent pas suivre toutes les régles de l’écriture manuscrite ce qui cause plus de difficulté pour la reconnaissance et rend la conception d’un OCR(optical caracter regognition) pour cette langue une véritable problématique. Plusieurs travaux traitant l’écriture arabe ont ´et´e réalisés, que se soit imprimée ou manuscrite, en ligne ou hors ligne, suivant l’approche analytique ou holistique et en utilisant des techniques d’extraction de caractéristiques (structurelles, statistiques, bas´e sur les transformés et etc) et de reconnaissance (les techniques structurels, statistiques, bas´es les réseaux de neurones ou les chaines de Markov...) différentes. Pendant les derrières décennies l’inspiration des systèmes informatiques de la biologie a prouvé son succès dans la résolution des problèmes complexes ce qui a donné naissance aux algorithmes bioinspires tel que les systèmes immunitaires artificiels, les algorithmes génétiques, les réseaux de neurones, les fourmis artificiels et etc. Dans notre contribution nous avons adapté une nouvelle approche qui se base sur la méthode de fouille de données `a savoir la classification ainsi que ses techniques qui s’inspirent de la biologie en l’occurrence les algorithmes bio-inspirés. Notre algorithme hybride immuno-genetic se base sur les systèmes immunitaires artificiels et les algorithmes génétiques. Pour la reconnaissance des mots arabe, nous avons utilisé les systèmes immunitaires artificiels qui ont la faculté de mémorisation et de bon apprentissage, de plus ils sont bien utilisés dans le domaine de reconnaissance de formes, pour l’optimisation et l’amélioration des résultats de classification nous proédons par la sélection d’attributs de classification, pour se faire nous avons choisi d’utiliser les algorithmes génétiques, qui sont réputés être de bons optimiseurs et bien appliqués dans ce genre d’application. Nous avons organis´e notre m´emoire en quatre chapitres : Dans le chapitre 1: nous avons présent´e quelques généralité´es sur la fouille de données `a savoir ses composants, ses méthodes ses techniques ainsi que ses domaines d’application. Nous avons détaillé l’une des méthodes de la fouille de données qui est la classification car elle est la plus adaptée pour le cas de notre application (la reconnaissance de l’écriture arabe). Nous avons présent´e aussi les m´méthodes de sélection d’attributs. |
Exemplaires (2)
Cote | Support | Localisation | Disponibilité |
---|---|---|---|
TS4/8248 | Thèse | Bibliothèque centrale | Disponible |
TS4/8277 | Thèse | Bibliothèque centrale | Disponible |
Accueil