University Sétif 1 FERHAT ABBAS Faculty of Sciences
Détail de l'auteur
Auteur BEN ARAB, Achraf |
Documents disponibles écrits par cet auteur



Towards an ontology mapping algorithm based on similarity measures between entities / BEN ARAB, Achraf
![]()
Titre : Towards an ontology mapping algorithm based on similarity measures between entities Type de document : texte imprimé Auteurs : BEN ARAB, Achraf ; ALLAOUI,REFOUFI, Directeur de thèse Editeur : Setif:UFA Année de publication : 2016 Importance : 1 vol (68f.) Format : 29 cm Langues : Anglais (eng) Catégories : Thèses & Mémoires:Informatique Mots-clés : Génie Logiciel
ontologie
mapping
mesure de similarité
OWL
WordNetIndex. décimale : 004 Informatique Résumé : Résumé
L‟ontologie est devenue une composante essentielle pour la représentation des
connaissances dans plusieurs domaines et en particulier celui du web sémantique. Le
mapping d‟ontologies consiste à identifier les correspondances entre les concepts similaires
de deux ontologies du même domaine afin de résoudre les problèmes d‟hétérogénéité des
connaissances. Dans ce mémoire, nous proposons une méthode de mapping automatique
qui permet d‟aligner deux ontologies en utilisant diverses méthodes et approches pour le
calcul de la similarité entre les concepts. Ces mesures sont d‟ordre linguistique,
sémantique, et structurel, ainsi que d‟autres mesures qui améliorent l‟efficacité de notre
solution.
Finalement, nous donnons des résultats expérimentaux pour valider notre méthode et les
comparons avec les résultats obtenus par d‟autres systèmes sur plusieurs paires
d‟ontologies recommandées par l‟I3CON (Information Interpretation and Integration
Conference). Les résultats obtenus sont très satisfaisants.
Note de contenu : Table des matières
Liste des figures............................................................................................................. x
Liste des tableaux ..........................................................................................................xii
Introduction générale....................................................................................................... 1
Chapitre I: Problème de mapping
1 Introduction.................................................................................................................... 3
2 Hétérogénéité des ontologies..................................................................................................... 3
2.1 Hétérogénéité syntaxique......................................................................................................... 4
2.2 Hétérogénéité terminologique................................................................................................. 4
2.3 Hétérogénéité conceptuelle...................................................................................................... 4
2.4 Hétérogénéité sémiotique......................................................................................................... 4
3 Le processus d’alignement ............................................................................................................ 4
3.1 Définitions................................................................................................................................... 4
3.1.1 Processus de mapping (processus d‟alignement)....................................................... 4
3.1.2 Matching (appariement) .................................................................................................. 5
3.1.3 Correspondance................................................................................................................. 5
3.1.4 Un alignement (un mapping).......................................................................................... 6
3.2 Structure d‟un alignement........................................................................................................ 6
4 Cycle de vie d’un alignement........................................................................................................ 6
5 Méthodologie de mapping ............................................................................................................. 7
5.1 L‟identification des ontologies............................................................................................... 7
5.2 Récupération des alignements existants................................................................................ 8
5.3 Sélection et composition des matchers ................................................................................. 8
5.4 Matching des ontologies .......................................................................................................... 8
5.5 Evaluation de l‟alignement...................................................................................................... 8
5.6 Amélioration de l‟alignement ................................................................................................. 8
5.7 Stockage et partage........................................................................................................ 8
5.8 L‟interprétation ............................................................................................................ 9
6 Mesure de similarité .......................................................................................................... 9
6.1 Similarité ................................................................................................................. 9
6.1.1 Définition............................................................................................................... 9
6.1.2 Similarité normalisé ...................................................................................................... 10
6.2 Techniques de mesure de similarité..................................................................................... 10
6.2.1 Méthodes terminologiques............................................................................................ 10
6.2.1.1 Méthodes syntaxiques........................................................................................... 10
6.2.1.2 Méthodes linguistiques......................................................................................... 12
6.2.2 Techniques structurelles................................................................................................ 12
6.2.2.1 Techniques basés sur la structure interne.......................................................... 12
6.2.2.2 Techniques basées sur la structure externe....................................................... 12
6.2.3 Techniques sémantiques................................................................................................ 13
6.2.4 Techniques extensionnelles.......................................................................................... 13
7 Composition des matchers........................................................................................................... 13
7.1 Composition séquentielle....................................................................................................... 13
7.2 Composition parallèle............................................................................................................. 14
8 Agrégation des similarités ........................................................................................................... 14
8.1 La somme pondéré .................................................................................................................. 15
8.2 La moyenne pondérée............................................................................................................. 15
9 Représentation de mapping ........................................................................................................ 15
10 Evaluation des systèmes d’alignement .................................................................................. 16
10.1 Les dimensions du processus d‟évaluation des alignements........................................ 16
10.1.1 Les ontologies en entrée.............................................................................................. 16
10.1.2 L‟alignement initial...................................................................................................... 17
10.1.3 Les paramètres et les ressources................................................................................ 17
10.1.4 L‟alignement en sortie................................................................................................. 17
10.1.5 Le processus d‟alignement ......................................................................................... 17
10.2 Métriques d‟évaluation.................................................................................................. 17
10.2.1 Mesures de conformité ................................................................................................ 18
10.2.1.1 Précision ............................................................................................................ 19
10.2.1.2 Rappel ............................................................................................................. 19
10.2.1.3 F-measure ........................................................................................................ 20
10.2.1.4 Fallout ..................................................................................................... 20
10.2.2 Mesures de performance .......................................................................................... 20
11 Système existants................................................................................................. 20
11.1 Systèmes à base de schéma d'ontologie: .......................................................................... 20
11.1.1 Anchor-Prompt (Université de Stanford)................................................................ 21
11.1.2 COMA et COMA++ (Université de Leipzig)......................................................... 21
11.1.3 CtxMatch et CtxMatch2 (Université de Trento etITC-IRST)............................. 21
11.2 Systèmes à base d‟instance ................................................................................................. 22
11.2.1 GLUE (Université de Washington) .......................................................................... 22
11.2.2 FCA-Merge (Université de Karslruhe) .................................................................... 22
11.3 Mixte, systèmes à base de schéma et d‟instance............................................................. 23
11.3.1 AROMA (Université de Nantes)............................................................................... 23
11.3.2 RiMOM (Université de Tsinghua)............................................................................ 23
11.3.3 NOM et QOM (Université de Karslruhe)................................................................ 23
11.3.4 IF-Map (Université de Southampton et l‟université d‟Edinburgh).................... 24
12 Conclusion....................................................................................................... 24
Chapitre II: Algorithme de mapping
1 Introduction.................................................................................................. 25
2 Notre approche ...................................................................................................... 25
2.1 La similarité terminologique ........................................................................................ 29
2.1.1 La synonymie ................................................................................................. 30
2.1.2 L‟hyperonymie ................................................................................................. 31
2.1.2.1 Première approche pour le calcul de la similarité à base de l‟hyperonymie......... 32
2.1.2.2 Deuxième approche de la similarité à base de l‟hyperonymie ..................... 33
2.1.3 Similarité syntaxique........................................................................................... 34
2.1.3.1 La distance de Hamming...................................................................................... 34
2.1.3.2 La distance d‟édition ............................................................................................. 35
2.2 Similarité relationnelle ........................................................................................... 35
2.3 Similarité structurelle interne..................................................................................... 36
2.4 Similarité basé sur les instances................................................................................. 38
2.5 Similarité Structurelle externe ................................................................................... 40
2.5.1 Première approche pour le calcul de la similarité structurelle externe ................ 41
2.5.2 Deuxième approche pour le calcul de la similarité structurelle externe.............. 42
2.5.3 Troisième approche pour le calcul de la similarité structurelle externe .............. 43
2.6 Similarité entre des éléments de différents types.............................................................. 44
3 Conclusion...................................................................................................... 45
Chapitre III: Réalisation & implémentation
1 Introduction........................................................................................................ 46
2 Environnement, outils et langage de développement.......................................................... 46
2.1 Java................................................................................................................. 46
2.2 Jena................................................................................................................. 47
2.3 SPARQL....................................................................................................................... 47
2.4 WordNet .......................................................................................................... 47
2.5 Protégé .......................................................................................................... 47
3 Présentation du système........................................................................................... 48
4 Conclusion............................................................................................................ 51Côte titre : MAI/0090 En ligne : https://drive.google.com/file/d/1n6a-PMpVUBJ6icJeN84bhbH4FPXRg37x/view?usp=shari [...] Format de la ressource électronique : Towards an ontology mapping algorithm based on similarity measures between entities [texte imprimé] / BEN ARAB, Achraf ; ALLAOUI,REFOUFI, Directeur de thèse . - [S.l.] : Setif:UFA, 2016 . - 1 vol (68f.) ; 29 cm.
Langues : Anglais (eng)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Génie Logiciel
ontologie
mapping
mesure de similarité
OWL
WordNetIndex. décimale : 004 Informatique Résumé : Résumé
L‟ontologie est devenue une composante essentielle pour la représentation des
connaissances dans plusieurs domaines et en particulier celui du web sémantique. Le
mapping d‟ontologies consiste à identifier les correspondances entre les concepts similaires
de deux ontologies du même domaine afin de résoudre les problèmes d‟hétérogénéité des
connaissances. Dans ce mémoire, nous proposons une méthode de mapping automatique
qui permet d‟aligner deux ontologies en utilisant diverses méthodes et approches pour le
calcul de la similarité entre les concepts. Ces mesures sont d‟ordre linguistique,
sémantique, et structurel, ainsi que d‟autres mesures qui améliorent l‟efficacité de notre
solution.
Finalement, nous donnons des résultats expérimentaux pour valider notre méthode et les
comparons avec les résultats obtenus par d‟autres systèmes sur plusieurs paires
d‟ontologies recommandées par l‟I3CON (Information Interpretation and Integration
Conference). Les résultats obtenus sont très satisfaisants.
Note de contenu : Table des matières
Liste des figures............................................................................................................. x
Liste des tableaux ..........................................................................................................xii
Introduction générale....................................................................................................... 1
Chapitre I: Problème de mapping
1 Introduction.................................................................................................................... 3
2 Hétérogénéité des ontologies..................................................................................................... 3
2.1 Hétérogénéité syntaxique......................................................................................................... 4
2.2 Hétérogénéité terminologique................................................................................................. 4
2.3 Hétérogénéité conceptuelle...................................................................................................... 4
2.4 Hétérogénéité sémiotique......................................................................................................... 4
3 Le processus d’alignement ............................................................................................................ 4
3.1 Définitions................................................................................................................................... 4
3.1.1 Processus de mapping (processus d‟alignement)....................................................... 4
3.1.2 Matching (appariement) .................................................................................................. 5
3.1.3 Correspondance................................................................................................................. 5
3.1.4 Un alignement (un mapping).......................................................................................... 6
3.2 Structure d‟un alignement........................................................................................................ 6
4 Cycle de vie d’un alignement........................................................................................................ 6
5 Méthodologie de mapping ............................................................................................................. 7
5.1 L‟identification des ontologies............................................................................................... 7
5.2 Récupération des alignements existants................................................................................ 8
5.3 Sélection et composition des matchers ................................................................................. 8
5.4 Matching des ontologies .......................................................................................................... 8
5.5 Evaluation de l‟alignement...................................................................................................... 8
5.6 Amélioration de l‟alignement ................................................................................................. 8
5.7 Stockage et partage........................................................................................................ 8
5.8 L‟interprétation ............................................................................................................ 9
6 Mesure de similarité .......................................................................................................... 9
6.1 Similarité ................................................................................................................. 9
6.1.1 Définition............................................................................................................... 9
6.1.2 Similarité normalisé ...................................................................................................... 10
6.2 Techniques de mesure de similarité..................................................................................... 10
6.2.1 Méthodes terminologiques............................................................................................ 10
6.2.1.1 Méthodes syntaxiques........................................................................................... 10
6.2.1.2 Méthodes linguistiques......................................................................................... 12
6.2.2 Techniques structurelles................................................................................................ 12
6.2.2.1 Techniques basés sur la structure interne.......................................................... 12
6.2.2.2 Techniques basées sur la structure externe....................................................... 12
6.2.3 Techniques sémantiques................................................................................................ 13
6.2.4 Techniques extensionnelles.......................................................................................... 13
7 Composition des matchers........................................................................................................... 13
7.1 Composition séquentielle....................................................................................................... 13
7.2 Composition parallèle............................................................................................................. 14
8 Agrégation des similarités ........................................................................................................... 14
8.1 La somme pondéré .................................................................................................................. 15
8.2 La moyenne pondérée............................................................................................................. 15
9 Représentation de mapping ........................................................................................................ 15
10 Evaluation des systèmes d’alignement .................................................................................. 16
10.1 Les dimensions du processus d‟évaluation des alignements........................................ 16
10.1.1 Les ontologies en entrée.............................................................................................. 16
10.1.2 L‟alignement initial...................................................................................................... 17
10.1.3 Les paramètres et les ressources................................................................................ 17
10.1.4 L‟alignement en sortie................................................................................................. 17
10.1.5 Le processus d‟alignement ......................................................................................... 17
10.2 Métriques d‟évaluation.................................................................................................. 17
10.2.1 Mesures de conformité ................................................................................................ 18
10.2.1.1 Précision ............................................................................................................ 19
10.2.1.2 Rappel ............................................................................................................. 19
10.2.1.3 F-measure ........................................................................................................ 20
10.2.1.4 Fallout ..................................................................................................... 20
10.2.2 Mesures de performance .......................................................................................... 20
11 Système existants................................................................................................. 20
11.1 Systèmes à base de schéma d'ontologie: .......................................................................... 20
11.1.1 Anchor-Prompt (Université de Stanford)................................................................ 21
11.1.2 COMA et COMA++ (Université de Leipzig)......................................................... 21
11.1.3 CtxMatch et CtxMatch2 (Université de Trento etITC-IRST)............................. 21
11.2 Systèmes à base d‟instance ................................................................................................. 22
11.2.1 GLUE (Université de Washington) .......................................................................... 22
11.2.2 FCA-Merge (Université de Karslruhe) .................................................................... 22
11.3 Mixte, systèmes à base de schéma et d‟instance............................................................. 23
11.3.1 AROMA (Université de Nantes)............................................................................... 23
11.3.2 RiMOM (Université de Tsinghua)............................................................................ 23
11.3.3 NOM et QOM (Université de Karslruhe)................................................................ 23
11.3.4 IF-Map (Université de Southampton et l‟université d‟Edinburgh).................... 24
12 Conclusion....................................................................................................... 24
Chapitre II: Algorithme de mapping
1 Introduction.................................................................................................. 25
2 Notre approche ...................................................................................................... 25
2.1 La similarité terminologique ........................................................................................ 29
2.1.1 La synonymie ................................................................................................. 30
2.1.2 L‟hyperonymie ................................................................................................. 31
2.1.2.1 Première approche pour le calcul de la similarité à base de l‟hyperonymie......... 32
2.1.2.2 Deuxième approche de la similarité à base de l‟hyperonymie ..................... 33
2.1.3 Similarité syntaxique........................................................................................... 34
2.1.3.1 La distance de Hamming...................................................................................... 34
2.1.3.2 La distance d‟édition ............................................................................................. 35
2.2 Similarité relationnelle ........................................................................................... 35
2.3 Similarité structurelle interne..................................................................................... 36
2.4 Similarité basé sur les instances................................................................................. 38
2.5 Similarité Structurelle externe ................................................................................... 40
2.5.1 Première approche pour le calcul de la similarité structurelle externe ................ 41
2.5.2 Deuxième approche pour le calcul de la similarité structurelle externe.............. 42
2.5.3 Troisième approche pour le calcul de la similarité structurelle externe .............. 43
2.6 Similarité entre des éléments de différents types.............................................................. 44
3 Conclusion...................................................................................................... 45
Chapitre III: Réalisation & implémentation
1 Introduction........................................................................................................ 46
2 Environnement, outils et langage de développement.......................................................... 46
2.1 Java................................................................................................................. 46
2.2 Jena................................................................................................................. 47
2.3 SPARQL....................................................................................................................... 47
2.4 WordNet .......................................................................................................... 47
2.5 Protégé .......................................................................................................... 47
3 Présentation du système........................................................................................... 48
4 Conclusion............................................................................................................ 51Côte titre : MAI/0090 En ligne : https://drive.google.com/file/d/1n6a-PMpVUBJ6icJeN84bhbH4FPXRg37x/view?usp=shari [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0090 MAI/0090 Mémoire Bibliothéque des sciences Anglais Disponible
Disponible