University Sétif 1 FERHAT ABBAS Faculty of Sciences
Détail de l'auteur
Auteur Abderrahim Lakehal |
Documents disponibles écrits par cet auteur
Ajouter le résultat dans votre panier Affiner la rechercheApproche sémantique de génération automatique d’applications agiles en environnement pervasif / Abderrahim Lakehal
![]()
Titre : Approche sémantique de génération automatique d’applications agiles en environnement pervasif Type de document : texte imprimé Auteurs : Abderrahim Lakehal, Auteur ; Alti,Adel, Directeur de thèse Editeur : Setif:UFA Année de publication : 2020 Importance : 1 vol (182 f .) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Ontologies
Objets connectés hétérogènes
Environnements omniprésentsIndex. décimale : 004 - Informatique Résumé :
Avec l’apparition abondante d’objets connectés dans les environnements pervasif, les utilisateurs ont tendance à récupérer les informations contextuelles directement, depuis l'environnement physique, pour mieux répondre à leurs besoins et gérer idéalement leurs situations. Cependant, avec la croissance rapide de la taille des données et du nombre d'appareils dans les environnements pervasif, l'identification d'un grand nombre de situations d'utilisateurs devient une tâche difficile. En effet, l'identification de situations dans des environnements pervasif implique une interprétation sémantique des données brutes contextuelles fournies par divers objets hétérogènes, ce qui nécessite de nouvelles solutions agiles dans la gestion des situations composites. Aucune des approches existantes n'est en mesure de gérer et d'identifier efficacement les situations d'urgence composites centrées sur l'utilisateur. Elles manquent de flexibilité pour évoluer et s’adapter en fonction du contexte actuel de l’utilisateur et des exigences de l’environnement. Les systèmes actuels perdent en performance face à la complexité de la gestion d'un grand nombre de situations ou de la recherche de services adaptés tout en respectant les délais. Notre objectif est de fournir une approche sémantique agile dans le contexte du smart-* (maison, santé, etc.). Cette approche agile met l'accent sur la gestion efficace des situations quotidiennes et urgentes via des applications mobiles et la génération automatiquement des actions de reconfigurations en fonction du profil de l'utilisateur, de ses besoins et situations actuels. Tout d'abord, nous avons proposé un modèle d’ontologie multicouche appelé Multi-OCSM pour modéliser formellement des services intelligents des domaines des utilisateurs, des situations et des priorités entre situations. Il permet également une reconfiguration automatique des applications pervasive avec une meilleure autonomie. Ensuite, nous avons proposé une nouvelle architecture pour spécifier des opérateurs de composition tels que parallèle, séquence, alternative et récurrence entre des situations basées composants. A partir de la spécification de situations à base de composants, nous générons l'orchestration des services à partir des règles sémantiques et scénarios de mouvements. Nous avons aussi proposé une nouvelle approche basée sur les microservices pour la gestion et l’identification des situations composites en temps réel. Un système de recommandation basé sur une ontologie sensible au contexte pour l'enrichissement et l'adaptation des règles de situation est également proposé. Enfin, pour valider l'efficacité de notre approche, nous proposons un prototype de gestion des situations avec plusieurs expérimentations. Les résultats expérimentaux montrent que l'approche proposée est efficace en termes de gestion et d'identification des situations composites où l'utilisation des microservices factorisés améliore le temps d'exécution du système.Côte titre : DI/0054 En ligne : http://dspace.univ-setif.dz:8888/jspui/bitstream/123456789/3758/1/Thesis%20Final [...] Format de la ressource électronique : Approche sémantique de génération automatique d’applications agiles en environnement pervasif [texte imprimé] / Abderrahim Lakehal, Auteur ; Alti,Adel, Directeur de thèse . - [S.l.] : Setif:UFA, 2020 . - 1 vol (182 f .) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Ontologies
Objets connectés hétérogènes
Environnements omniprésentsIndex. décimale : 004 - Informatique Résumé :
Avec l’apparition abondante d’objets connectés dans les environnements pervasif, les utilisateurs ont tendance à récupérer les informations contextuelles directement, depuis l'environnement physique, pour mieux répondre à leurs besoins et gérer idéalement leurs situations. Cependant, avec la croissance rapide de la taille des données et du nombre d'appareils dans les environnements pervasif, l'identification d'un grand nombre de situations d'utilisateurs devient une tâche difficile. En effet, l'identification de situations dans des environnements pervasif implique une interprétation sémantique des données brutes contextuelles fournies par divers objets hétérogènes, ce qui nécessite de nouvelles solutions agiles dans la gestion des situations composites. Aucune des approches existantes n'est en mesure de gérer et d'identifier efficacement les situations d'urgence composites centrées sur l'utilisateur. Elles manquent de flexibilité pour évoluer et s’adapter en fonction du contexte actuel de l’utilisateur et des exigences de l’environnement. Les systèmes actuels perdent en performance face à la complexité de la gestion d'un grand nombre de situations ou de la recherche de services adaptés tout en respectant les délais. Notre objectif est de fournir une approche sémantique agile dans le contexte du smart-* (maison, santé, etc.). Cette approche agile met l'accent sur la gestion efficace des situations quotidiennes et urgentes via des applications mobiles et la génération automatiquement des actions de reconfigurations en fonction du profil de l'utilisateur, de ses besoins et situations actuels. Tout d'abord, nous avons proposé un modèle d’ontologie multicouche appelé Multi-OCSM pour modéliser formellement des services intelligents des domaines des utilisateurs, des situations et des priorités entre situations. Il permet également une reconfiguration automatique des applications pervasive avec une meilleure autonomie. Ensuite, nous avons proposé une nouvelle architecture pour spécifier des opérateurs de composition tels que parallèle, séquence, alternative et récurrence entre des situations basées composants. A partir de la spécification de situations à base de composants, nous générons l'orchestration des services à partir des règles sémantiques et scénarios de mouvements. Nous avons aussi proposé une nouvelle approche basée sur les microservices pour la gestion et l’identification des situations composites en temps réel. Un système de recommandation basé sur une ontologie sensible au contexte pour l'enrichissement et l'adaptation des règles de situation est également proposé. Enfin, pour valider l'efficacité de notre approche, nous proposons un prototype de gestion des situations avec plusieurs expérimentations. Les résultats expérimentaux montrent que l'approche proposée est efficace en termes de gestion et d'identification des situations composites où l'utilisation des microservices factorisés améliore le temps d'exécution du système.Côte titre : DI/0054 En ligne : http://dspace.univ-setif.dz:8888/jspui/bitstream/123456789/3758/1/Thesis%20Final [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité DI/0054 DI/0054 Thèse Bibliothèque des sciences Français Disponible
DisponibleContrôle autonomique contextualise guide par les ontologies des applications mobiles multimodales / Abderrahim Lakehal
![]()
Titre : Contrôle autonomique contextualise guide par les ontologies des applications mobiles multimodales Type de document : texte imprimé Auteurs : Abderrahim Lakehal ; Alti,Adel, Directeur de thèse Editeur : Setif:UFA Année de publication : 2016 Importance : 1 vol (87f.) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Réseaux
Systèmes Distribués
Profil utilisateur
Contexte
Contrainte
Autonomique
Ontologie
AdaptationIndex. décimale : 004 Informatique Résumé : RESUME
Actuellement, les applications mobiles ont été largement utilisées dans divers domaines. Les
applications mobiles ubiquitaires ont pour objectif d’accompagner les utilisateurs à tout
moment, en tout lieu et en toute circonstance. Elles sont développées en blocs qui s’exécutent
sur des Smartphones, des laptops et des tablettes. La mobilité tient compte des contraintes
inhérentes au caractère multimédia. Ce contexte soulève, entre autre, des problèmes liés Ã
l’hétérogénéité des contenus (documents, données, flux de données ou autres données liées Ã
des services), aux terminaux (capteurs domestiques), aux préférences des utilisateurs et leurs
contextes d’usages (profils).Dans ce travail, nous tenons compte de l’ensemble de ces
problèmes en nous focalisant particulièrement sur les applications mobiles sensibles aux
contextes. Pour ce faire, nous proposons une architecture basée sur une ontologie générique
qui fournit des services sémantiquement équivalents et appropriés au contexte spécifique
d’une personne via des règles d’inférences. Afin de valider notre proposition, nous avons
utilisé les technologies issues du Web sémantique et l’intergicielKalimucho pour la
spécification et l’expérimentation des profils des utilisateurs sur plusieurs plates-formes.Note de contenu : Table des matières
INTRODUCTION GENERALE ........................................................................................ 1
Chapitre 1 : Système Ambiant Autonomique Et Web Sémantique
1. Introduction.................................................................................. 3
2. Systèmes ambiants ................................................................................... 4
2.1 Définition............................................................................................ 4
2.2 Caractéristique des systèmes ambiants................................................................ 5
2.3 Architecture des systèmes ambiants.................................................................... 5
2.4 Hétérogénéité et mobilité .................................................................................. 6
3. Contexte et Sensibilité au contexte .................................................................. 7
3.1 Définition......................................................................................... 7
3.2 Contexte et l’informatique ambiante ................................................................... 7
3.3 Sensibilité au contexte.............................................................................. 7
4. Profils utilisateurs et ses contraintes ................................................................. 8
4.1 Définition............................................................................................. 8
4.2 Modélisation du profil ............................................................................. 8
5. Système ambiant autonomique....................................................................... 9
5.1 Définition............................................................................................. 9
5.2 Boucle CADA (Collection, Analysis, Decision and Action)........................................... 10
6. Web sémantique ....................................................................................... 11
6.1 Ontologie ................................................................................................. 12
6.2 La structure d’une ontologie ................................................................................. 12
7. Conclusion ............................................................................................ 14
Chapitre 2 : Etat de l’art
1. Introduction................................................................................................. 15
2. Travaux connexes...................................................................................... 15
2.1 Architectures contextuelles pour le déploiement de services........................................ 16
2.2 Les plates-formes existantes .......................................................................................... 17
2.3 Les techniques d'adaptation .......................................................................................... 18
3. Synthèse et discussion ................................................................................................ 21
4. Conclusion ................................................................................................. 24
Chapitre 3 : Conception et ontologie développée
1. Introduction...................................................................................................... 25
2. Présentation de la solution AESCR ........................................................................... 25
3. Ontologie développée du modèle de contexte............................................................ 26
3.1 Ontologie de noyau ........................................................................................................ 26
3.2 Ontologie de domaine de contexte ................................................................................. 27
3.3 Ontologie des contraintes............................................................................................... 32
3.4 Ontologie des propriétés de contextes ........................................................................... 33
3.5 Ontologie des services contextuels................................................................................. 34
3.6 Ontologie des Evénements............................................................................................. 34
3.7 Ontologie des Situations................................................................................................. 35
4. Plateforme Kalimucho-smart .................................................................................... 36
4.1 Démarche d’intégration à Kalimucho........................................................................... 36
4.2 Architecture de la plateforme Kalimucho-smart...................................................... 36
4.3 Schéma fonctionnel............................................................................................ 40
5. Simulation de la plateforme....................................................................................... 41
6. Conclusion ................................................................................. 46
Chapitre 4 : REALISATION PROTOTYPE et EVALUATION
1. Introduction............................................................................................. 47
2. Les langages utilisés et les outils d'implémentations................................................. 48
2.1 Les langages utilisées ................................................................................................ 48
2.1.1 Langage Java.........................................................................................................48
2.1.2 Langage SQL (Structured Query Language)..................................................................................48
2.1.3 Langage PHP...............................................................................................48
2.1.4 Langage OWL (Ontology Web Language) ...................................................................................48
2.1.5 Langage SWRL (Semantic Web Rule Language).......................................................................................49
2.2 Les outils utilisés.................................................................................... 49
2.2.1 Eclipse..................................................................................49
2.2.2 Android Studio .................................................................................49
2.2.3 MySQL..............................................................................................49
2.2.4 EasyPHP................................................................................................50
2.2.5 Protégé..................................................................................................50
2.2.6 Plateforme Kalimucho .........................................................................................50
3. Implémentations et Structures de données utilisées ................................................. 51
3.1 Structure de la base de donnée «BDContext»............................................................... 51
3.2 L'implémentation de l'ontologie Smart-Adaptation-Context....................................... 55
3.3 L'implémentation des services contextuels.................................................................... 58
3.4 Architecture et fonctionnement générale de la plateforme........................................... 58
3.5 Modèle de fonctionnement de la plateforme ................................................................. 61
3.6 Description des classes java et packages AESCR ......................................................... 63
3.6.1 Package AESCR..................................................................................................63
3.6.2 Package ContextConstraintManager.................................................................................63
3.6.3 Package ContextServiceManager.............................................................................63
3.6.4 Package ContextUserManager.......................................................................................64
3.6.5 Package ContextReasoner.............................................................................................64
3.6.6 Package Repository ...........................................................................................................64
3.6.7 Package ServiceController............................................................................................64
4. Scénario d’illustration et validation .......................................................................... 65
5. Conclusion .................................................................................................................. 75
CONCLUSION GENERALE ........................................................................................... 76
Bibliographies.................................................................................................................... 77
Annexes.............................................................................................................................. 82Côte titre : MAI/0125 En ligne : https://drive.google.com/file/d/1tlvVAZTXGZXjPAV1d0_4o851IexKm45E/view?usp=shari [...] Format de la ressource électronique : Contrôle autonomique contextualise guide par les ontologies des applications mobiles multimodales [texte imprimé] / Abderrahim Lakehal ; Alti,Adel, Directeur de thèse . - [S.l.] : Setif:UFA, 2016 . - 1 vol (87f.) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Réseaux
Systèmes Distribués
Profil utilisateur
Contexte
Contrainte
Autonomique
Ontologie
AdaptationIndex. décimale : 004 Informatique Résumé : RESUME
Actuellement, les applications mobiles ont été largement utilisées dans divers domaines. Les
applications mobiles ubiquitaires ont pour objectif d’accompagner les utilisateurs à tout
moment, en tout lieu et en toute circonstance. Elles sont développées en blocs qui s’exécutent
sur des Smartphones, des laptops et des tablettes. La mobilité tient compte des contraintes
inhérentes au caractère multimédia. Ce contexte soulève, entre autre, des problèmes liés Ã
l’hétérogénéité des contenus (documents, données, flux de données ou autres données liées Ã
des services), aux terminaux (capteurs domestiques), aux préférences des utilisateurs et leurs
contextes d’usages (profils).Dans ce travail, nous tenons compte de l’ensemble de ces
problèmes en nous focalisant particulièrement sur les applications mobiles sensibles aux
contextes. Pour ce faire, nous proposons une architecture basée sur une ontologie générique
qui fournit des services sémantiquement équivalents et appropriés au contexte spécifique
d’une personne via des règles d’inférences. Afin de valider notre proposition, nous avons
utilisé les technologies issues du Web sémantique et l’intergicielKalimucho pour la
spécification et l’expérimentation des profils des utilisateurs sur plusieurs plates-formes.Note de contenu : Table des matières
INTRODUCTION GENERALE ........................................................................................ 1
Chapitre 1 : Système Ambiant Autonomique Et Web Sémantique
1. Introduction.................................................................................. 3
2. Systèmes ambiants ................................................................................... 4
2.1 Définition............................................................................................ 4
2.2 Caractéristique des systèmes ambiants................................................................ 5
2.3 Architecture des systèmes ambiants.................................................................... 5
2.4 Hétérogénéité et mobilité .................................................................................. 6
3. Contexte et Sensibilité au contexte .................................................................. 7
3.1 Définition......................................................................................... 7
3.2 Contexte et l’informatique ambiante ................................................................... 7
3.3 Sensibilité au contexte.............................................................................. 7
4. Profils utilisateurs et ses contraintes ................................................................. 8
4.1 Définition............................................................................................. 8
4.2 Modélisation du profil ............................................................................. 8
5. Système ambiant autonomique....................................................................... 9
5.1 Définition............................................................................................. 9
5.2 Boucle CADA (Collection, Analysis, Decision and Action)........................................... 10
6. Web sémantique ....................................................................................... 11
6.1 Ontologie ................................................................................................. 12
6.2 La structure d’une ontologie ................................................................................. 12
7. Conclusion ............................................................................................ 14
Chapitre 2 : Etat de l’art
1. Introduction................................................................................................. 15
2. Travaux connexes...................................................................................... 15
2.1 Architectures contextuelles pour le déploiement de services........................................ 16
2.2 Les plates-formes existantes .......................................................................................... 17
2.3 Les techniques d'adaptation .......................................................................................... 18
3. Synthèse et discussion ................................................................................................ 21
4. Conclusion ................................................................................................. 24
Chapitre 3 : Conception et ontologie développée
1. Introduction...................................................................................................... 25
2. Présentation de la solution AESCR ........................................................................... 25
3. Ontologie développée du modèle de contexte............................................................ 26
3.1 Ontologie de noyau ........................................................................................................ 26
3.2 Ontologie de domaine de contexte ................................................................................. 27
3.3 Ontologie des contraintes............................................................................................... 32
3.4 Ontologie des propriétés de contextes ........................................................................... 33
3.5 Ontologie des services contextuels................................................................................. 34
3.6 Ontologie des Evénements............................................................................................. 34
3.7 Ontologie des Situations................................................................................................. 35
4. Plateforme Kalimucho-smart .................................................................................... 36
4.1 Démarche d’intégration à Kalimucho........................................................................... 36
4.2 Architecture de la plateforme Kalimucho-smart...................................................... 36
4.3 Schéma fonctionnel............................................................................................ 40
5. Simulation de la plateforme....................................................................................... 41
6. Conclusion ................................................................................. 46
Chapitre 4 : REALISATION PROTOTYPE et EVALUATION
1. Introduction............................................................................................. 47
2. Les langages utilisés et les outils d'implémentations................................................. 48
2.1 Les langages utilisées ................................................................................................ 48
2.1.1 Langage Java.........................................................................................................48
2.1.2 Langage SQL (Structured Query Language)..................................................................................48
2.1.3 Langage PHP...............................................................................................48
2.1.4 Langage OWL (Ontology Web Language) ...................................................................................48
2.1.5 Langage SWRL (Semantic Web Rule Language).......................................................................................49
2.2 Les outils utilisés.................................................................................... 49
2.2.1 Eclipse..................................................................................49
2.2.2 Android Studio .................................................................................49
2.2.3 MySQL..............................................................................................49
2.2.4 EasyPHP................................................................................................50
2.2.5 Protégé..................................................................................................50
2.2.6 Plateforme Kalimucho .........................................................................................50
3. Implémentations et Structures de données utilisées ................................................. 51
3.1 Structure de la base de donnée «BDContext»............................................................... 51
3.2 L'implémentation de l'ontologie Smart-Adaptation-Context....................................... 55
3.3 L'implémentation des services contextuels.................................................................... 58
3.4 Architecture et fonctionnement générale de la plateforme........................................... 58
3.5 Modèle de fonctionnement de la plateforme ................................................................. 61
3.6 Description des classes java et packages AESCR ......................................................... 63
3.6.1 Package AESCR..................................................................................................63
3.6.2 Package ContextConstraintManager.................................................................................63
3.6.3 Package ContextServiceManager.............................................................................63
3.6.4 Package ContextUserManager.......................................................................................64
3.6.5 Package ContextReasoner.............................................................................................64
3.6.6 Package Repository ...........................................................................................................64
3.6.7 Package ServiceController............................................................................................64
4. Scénario d’illustration et validation .......................................................................... 65
5. Conclusion .................................................................................................................. 75
CONCLUSION GENERALE ........................................................................................... 76
Bibliographies.................................................................................................................... 77
Annexes.............................................................................................................................. 82Côte titre : MAI/0125 En ligne : https://drive.google.com/file/d/1tlvVAZTXGZXjPAV1d0_4o851IexKm45E/view?usp=shari [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0125 MAI/0125 Mémoire Bibliothèque des sciences Français Disponible
Disponible
Titre : Deep Generative Models in Omics Data Augmentation for Disease Classification Type de document : texte imprimé Auteurs : Boutheyna Khenouche, Auteur ; Imene Madoui ; Abderrahim Lakehal, Directeur de thèse Editeur : Setif:UFA Année de publication : 2024 Importance : 1 vol (115 f .) Format : 29 cm Langues : Anglais (eng) Catégories : Thèses & Mémoires:Informatique Mots-clés : Informatique Index. décimale : 004 - Informatique Résumé : The intersection of bioinformatics and machine learning has opened new possibilities
in cancer research, particularly in the analysis and classification of omics
data, which is often which are frequently limited and diverse. This thesis explores
the application of deep generative models, specifically Generative Adversarial Networks
(GANs), to augment omics data, including both gene and protein expression
data, for improved disease classification. Cancer, being one of the most prevalent
and complex diseases, presents significant challenges that require advanced analytical
approaches. Traditional machine learning methods often struggle with highdimensional
and limited datasets, whereas deep learning offers a promising alternative
due to its ability to learn intricate patterns. Our approach involves collecting
and preprocessing gene expression data from 11,070 samples and protein expression
data from 7,790 samples, generating synthetic data through GANs , and training
classifiers like Convolutional Neural Networks (CNNs) and Multi-Layer Perceptrons
(MLPs) on the augmented datasets for the prediction of overall survival (OS) and
progression-free interval (PFI). We validate the data generated by our GAN through
biological classification of genes and proteins, and by comprehensive data visualization
techniques.Note de contenu : Sommaire
1 Bioinformatics , Machine Learning and Deep Learning 10
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2 Bioinformatics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.1 Origin of Bioinformatics . . . . . . . . . . . . . . . . . . . . . 11
1.2.2 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.3 Bioinformatics Subfields . . . . . . . . . . . . . . . . . . . . . 12
1.2.4 Bioinformatics data types and Databases . . . . . . . . . . . . 13
1.2.5 Bioinfromatics Application Domain . . . . . . . . . . . . . . . 15
1.2.6 Benefits of Bioinformatics in Healthcare . . . . . . . . . . . . 16
1.3 Machine Learning: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3.2 Machine learning techniques . . . . . . . . . . . . . . . . . . 17
1.4 Deep Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.4.1 definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.4.2 Neural Network in Deep Learning . . . . . . . . . . . . . . . . 20
1.5 Generative Models in machine Learning and deep learning . . . . . . 22
1.5.1 Generative Adversarial Networks (GANs) . . . . . . . . . . . . 22
1.5.2 Variational AutoEncoders (VAEs) . . . . . . . . . . . . . . . . 25
1.6 Machine Learning Vs Deep Learning . . . . . . . . . . . . . . . . . . 27
1.7 Application Domain of ML and DL in Health Care . . . . . . . . . . 29
1.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2 Disease classification and data augmentation: Literature review 31
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.2 Omics data, Machine learning and medical research . . . . . . . . . . 32
2.2.1 Omics data: Definition and types . . . . . . . . . . . . . . . . 32
2.2.2 Overview on omics data and machine learning . . . . . . . . . 32
2.3 Related work in Generative model for data augmentation . . . . . . . 33
2.4 Generative models for spatial data augmentation . . . . . . . . . . . 34
2.5 Generative model for omics data augmentation . . . . . . . . . . . . . 41
2.6 Generative adversarial network for omics data augmentation in cancer
classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3 Deep Generative models for omics data augmentation: Cancer case
study 46
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.2 Analyzing Gene and Protein Data: From Collection to Insight . . . . 47
3.3 Proposed Architecture for Data Augmentation and Classification . . 47
3.4 Data Collection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.5 Data Preprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.5.1 Gene Expression data . . . . . . . . . . . . . . . . . . . . . . 50
3.5.2 Protein Expression Data Pre-processing . . . . . . . . . . . . . 53
3.6 Dimensionality Reduction for Gene Expression Data: . . . . . . . . . 54
3.7 Generative adversarial network for data augmentation . . . . . . . . 56
3.7.1 Data preparation . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.7.2 Model elaboration . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.7.3 Training and evaluation . . . . . . . . . . . . . . . . . . . . . 57
3.8 Convolutional Neural Networks. . . . . . . . . . . . . . . . . . . . . . 58
3.8.1 Data Preparation . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.8.2 Model Definition and Building . . . . . . . . . . . . . . . . . 58
3.8.3 Model Training and Evaluation . . . . . . . . . . . . . . . . . 58
3.9 Biological Classification of Genes and Proteins . . . . . . . . . . . . . 59
3.9.1 Objective and Methodology . . . . . . . . . . . . . . . . . . . 59
3.10 Multi-Layer Perceptron Implementation . . . . . . . . . . . . . . . . 59
3.10.1 Data Preparation . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.10.2 Data Splitting . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.10.3 Model Building and Predictions for OS . . . . . . . . . . . . . 59
3.10.4 Model Building and Predictions for PFI . . . . . . . . . . . . 59
3.10.5 Synthetic Data . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.11 conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4 Implementation and evaluation 61
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.2 Experimental tools and Packages . . . . . . . . . . . . . . . . . . . . 62
4.2.1 PYTHON . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.3 Evaluation Metrics for Classification Models . . . . . . . . . . . . . . 64
4.3.1 Precision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.2 Recall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.3 Accuracy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.4 F1-Score . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.5 Matthews Correlation Coefficient (MCC) . . . . . . . . . . . 65
4.4 Datasets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.5 Implementation and Dataset Evaluation . . . . . . . . . . . . . . . . 66
4.5.1 Pre-processing:Gene Expression . . . . . . . . . . . . . . 66
4.5.2 Pre-processing :Protein Expression . . . . . . . . . . . . 67
4.5.3 Dimensionality Reduction: Gene Expression . . . . . . 68
4.5.4 Implement Generative Adversarial Networks (GANs) . . . . . 70
4.5.5 Implement Convolutional Neural Networks . . . . . . . . . . . 75
4.6 Implement Multi-Layer Perceptron . . . . . . . . . . . . . . . . . . . 79
4.7 Biological Classification of Genes and Proteins . . . . . . . . . . . . . 82
4.7.1 Tools and Techniques . . . . . . . . . . . . . . . . . . . . . . . 82
4.8 MLP Model for Distinguishing Upregulated and Downregulated Genes/Proteins 83
4.9 Evaluating Prediction Accuracy and Updating Gene and Protein Expression
Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.10 Data Visualisation and Interpretation . . . . . . . . . . . . . . . . . . 86
4.12 Comparison of CNN and MLP Performance on Augmented Gene Expression
Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.12.1 Gene Expression Data . . . . . . . . . . . . . . . . . . . . . 90
4.12.2 Protein Expression Data . . . . . . . . . . . . . . . . . . . . . 91
4.13 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
.1 First Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
.1.1 Pre-processing:Gene Expression . . . . . . . . . . . . . . 95
.1.2 Pre-processing :Protein Expression . . . . . . . . . . . . 100
.2 Second Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
.2.1 Implement Generative Adversarial Networks (GANs) . . . . . 105
.3 Third Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
.3.1 Implementing Predictions and Labeling for Generated Data . 106Côte titre : MAI/0926
Deep Generative Models in Omics Data Augmentation for Disease Classification [texte imprimé] / Boutheyna Khenouche, Auteur ; Imene Madoui ; Abderrahim Lakehal, Directeur de thèse . - [S.l.] : Setif:UFA, 2024 . - 1 vol (115 f .) ; 29 cm.
Langues : Anglais (eng)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Informatique Index. décimale : 004 - Informatique Résumé : The intersection of bioinformatics and machine learning has opened new possibilities
in cancer research, particularly in the analysis and classification of omics
data, which is often which are frequently limited and diverse. This thesis explores
the application of deep generative models, specifically Generative Adversarial Networks
(GANs), to augment omics data, including both gene and protein expression
data, for improved disease classification. Cancer, being one of the most prevalent
and complex diseases, presents significant challenges that require advanced analytical
approaches. Traditional machine learning methods often struggle with highdimensional
and limited datasets, whereas deep learning offers a promising alternative
due to its ability to learn intricate patterns. Our approach involves collecting
and preprocessing gene expression data from 11,070 samples and protein expression
data from 7,790 samples, generating synthetic data through GANs , and training
classifiers like Convolutional Neural Networks (CNNs) and Multi-Layer Perceptrons
(MLPs) on the augmented datasets for the prediction of overall survival (OS) and
progression-free interval (PFI). We validate the data generated by our GAN through
biological classification of genes and proteins, and by comprehensive data visualization
techniques.Note de contenu : Sommaire
1 Bioinformatics , Machine Learning and Deep Learning 10
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2 Bioinformatics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.1 Origin of Bioinformatics . . . . . . . . . . . . . . . . . . . . . 11
1.2.2 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.3 Bioinformatics Subfields . . . . . . . . . . . . . . . . . . . . . 12
1.2.4 Bioinformatics data types and Databases . . . . . . . . . . . . 13
1.2.5 Bioinfromatics Application Domain . . . . . . . . . . . . . . . 15
1.2.6 Benefits of Bioinformatics in Healthcare . . . . . . . . . . . . 16
1.3 Machine Learning: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3.2 Machine learning techniques . . . . . . . . . . . . . . . . . . 17
1.4 Deep Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.4.1 definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.4.2 Neural Network in Deep Learning . . . . . . . . . . . . . . . . 20
1.5 Generative Models in machine Learning and deep learning . . . . . . 22
1.5.1 Generative Adversarial Networks (GANs) . . . . . . . . . . . . 22
1.5.2 Variational AutoEncoders (VAEs) . . . . . . . . . . . . . . . . 25
1.6 Machine Learning Vs Deep Learning . . . . . . . . . . . . . . . . . . 27
1.7 Application Domain of ML and DL in Health Care . . . . . . . . . . 29
1.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2 Disease classification and data augmentation: Literature review 31
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.2 Omics data, Machine learning and medical research . . . . . . . . . . 32
2.2.1 Omics data: Definition and types . . . . . . . . . . . . . . . . 32
2.2.2 Overview on omics data and machine learning . . . . . . . . . 32
2.3 Related work in Generative model for data augmentation . . . . . . . 33
2.4 Generative models for spatial data augmentation . . . . . . . . . . . 34
2.5 Generative model for omics data augmentation . . . . . . . . . . . . . 41
2.6 Generative adversarial network for omics data augmentation in cancer
classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3 Deep Generative models for omics data augmentation: Cancer case
study 46
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.2 Analyzing Gene and Protein Data: From Collection to Insight . . . . 47
3.3 Proposed Architecture for Data Augmentation and Classification . . 47
3.4 Data Collection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.5 Data Preprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.5.1 Gene Expression data . . . . . . . . . . . . . . . . . . . . . . 50
3.5.2 Protein Expression Data Pre-processing . . . . . . . . . . . . . 53
3.6 Dimensionality Reduction for Gene Expression Data: . . . . . . . . . 54
3.7 Generative adversarial network for data augmentation . . . . . . . . 56
3.7.1 Data preparation . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.7.2 Model elaboration . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.7.3 Training and evaluation . . . . . . . . . . . . . . . . . . . . . 57
3.8 Convolutional Neural Networks. . . . . . . . . . . . . . . . . . . . . . 58
3.8.1 Data Preparation . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.8.2 Model Definition and Building . . . . . . . . . . . . . . . . . 58
3.8.3 Model Training and Evaluation . . . . . . . . . . . . . . . . . 58
3.9 Biological Classification of Genes and Proteins . . . . . . . . . . . . . 59
3.9.1 Objective and Methodology . . . . . . . . . . . . . . . . . . . 59
3.10 Multi-Layer Perceptron Implementation . . . . . . . . . . . . . . . . 59
3.10.1 Data Preparation . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.10.2 Data Splitting . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.10.3 Model Building and Predictions for OS . . . . . . . . . . . . . 59
3.10.4 Model Building and Predictions for PFI . . . . . . . . . . . . 59
3.10.5 Synthetic Data . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.11 conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4 Implementation and evaluation 61
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.2 Experimental tools and Packages . . . . . . . . . . . . . . . . . . . . 62
4.2.1 PYTHON . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.3 Evaluation Metrics for Classification Models . . . . . . . . . . . . . . 64
4.3.1 Precision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.2 Recall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.3 Accuracy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.4 F1-Score . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.5 Matthews Correlation Coefficient (MCC) . . . . . . . . . . . 65
4.4 Datasets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.5 Implementation and Dataset Evaluation . . . . . . . . . . . . . . . . 66
4.5.1 Pre-processing:Gene Expression . . . . . . . . . . . . . . 66
4.5.2 Pre-processing :Protein Expression . . . . . . . . . . . . 67
4.5.3 Dimensionality Reduction: Gene Expression . . . . . . 68
4.5.4 Implement Generative Adversarial Networks (GANs) . . . . . 70
4.5.5 Implement Convolutional Neural Networks . . . . . . . . . . . 75
4.6 Implement Multi-Layer Perceptron . . . . . . . . . . . . . . . . . . . 79
4.7 Biological Classification of Genes and Proteins . . . . . . . . . . . . . 82
4.7.1 Tools and Techniques . . . . . . . . . . . . . . . . . . . . . . . 82
4.8 MLP Model for Distinguishing Upregulated and Downregulated Genes/Proteins 83
4.9 Evaluating Prediction Accuracy and Updating Gene and Protein Expression
Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.10 Data Visualisation and Interpretation . . . . . . . . . . . . . . . . . . 86
4.12 Comparison of CNN and MLP Performance on Augmented Gene Expression
Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.12.1 Gene Expression Data . . . . . . . . . . . . . . . . . . . . . 90
4.12.2 Protein Expression Data . . . . . . . . . . . . . . . . . . . . . 91
4.13 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
.1 First Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
.1.1 Pre-processing:Gene Expression . . . . . . . . . . . . . . 95
.1.2 Pre-processing :Protein Expression . . . . . . . . . . . . 100
.2 Second Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
.2.1 Implement Generative Adversarial Networks (GANs) . . . . . 105
.3 Third Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
.3.1 Implementing Predictions and Labeling for Generated Data . 106Côte titre : MAI/0926
Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0926 MAI/0926 Mémoire Bibliothèque des sciences Anglais Disponible
DisponibleDeep learning, and bioinspired optimization algorithms for genetic marker selection and disease classification. / Khaoula Chouder
Titre : Deep learning, and bioinspired optimization algorithms for genetic marker selection and disease classification. Type de document : document électronique Auteurs : Khaoula Chouder ; Maroua Kadri, Auteur ; Abderrahim Lakehal, Directeur de thèse Editeur : Setif:UFA Année de publication : 2025 Importance : 1 vol (73 f .) Format : 29 cm Langues : Anglais (eng) Catégories : Thèses & Mémoires:Informatique Mots-clés : Deep Learning
Cancer Classification
Feature Selection
Bio-Inspired Algorithms
Omics Data
Biomarker DiscoveryIndex. décimale : 004 Informatique Résumé :
AI-based cancer diagnosis and classification have emerged as a critical research field over the
past decade, especially with advancements in next-generation sequencing technologies. However,
omics datasets are often characterized by high dimensionality, complexity, and scalability
challenges. Deep learning has been increasingly adopted to address these issues due to its
strong predictive performance. Nonetheless, deep learning models remain largely black-box in
nature, lacking interpretability—a crucial factor in biological contexts where the identification
of biomarkers and selected features is essential for personalizing treatment protocols and guiding
drug prescription. Therefore, various feature selection methods are highly sought to enhance
interpretability. In this work, we propose a hybrid approach that combines deep learning with
bioinspired feature selection techniques. This report provides an overview of recent advances in
deep learning for oncology, particularly for analyzing omics data such as genomic and transcriptomic
profiles. Applications in cancer diagnosis, prognosis, and therapeutic decision-making
are explored, with a focus on the integration of multi-omics data for building clinical decision
support systems. The results of the experiments showed that the classification accuracy was
as much as 80% for single-omics models while deep neural networks and convolutional models
performed better after bioinspired optimization. Enrichment analysis also confirmed the biological
relevance of the selected features, affirming their use as clinically meaningful biomarkers.
These findings demonstrate the effectiveness of our method in both boosting prediction performance
and interpretability in cancer classification tasks.Note de contenu : Sommaire
List of Tables 6
List of Figures 8
1 Background 10
1.1 introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2 Introduction to Bioinformatic . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.2 Types . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.3 Applications of bioinformatics . . . . . . . . . . . . . . . . . . . . . . 14
1.2.4 Omic data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.2.5 Databases and repositories . . . . . . . . . . . . . . . . . . . . . . . . 15
1.2.6 Biomarkers and disease classification . . . . . . . . . . . . . . . . . . 16
1.3 Feature Selection and Bioinspired Algorithms . . . . . . . . . . . . . . . . . . 17
1.3.1 Feature Selection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3.2 Bioinspired Algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.3.3 Features selection using bioinspired algorithm . . . . . . . . . . . . . . 23
1.4 Machine learning and deep learning . . . . . . . . . . . . . . . . . . . . . . . 25
1.4.1 Machine learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.4.2 Deep learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2 Systematic Selective Review 29
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2 Paper selection and filtration . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3 Paper classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.1 Cancer classification using ML models . . . . . . . . . . . . . . . . . 21
2.3.2 Biomarker discovery using Features selection models in cancer . . . . 22
2.3.3 Biomarker discovery using bioinspired models in cancer . . . . . . . . 24
2.4 General discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3 Approach 30
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2 Problem Statement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.3 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.4 An overview on the general proposal . . . . . . . . . . . . . . . . . . . . . . 32
3.5 Data collection and preprocessing . . . . . . . . . . . . . . . . . . . . . . . . 32
3.5.1 Data Preparation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.5.2 Data Preprocessing Steps . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.6 Overview of the Feature Selection Phase . . . . . . . . . . . . . . . . . . . . . 34
3.7 What the Output Labels Mean . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.8 Bio-Inspired Feature Selection Initialization . . . . . . . . . . . . . . . . . . . 35
3.9 Pipeline Evaluation and Feature Assessment . . . . . . . . . . . . . . . . . . . 36
3.9.1 Functional Enrichment Resources . . . . . . . . . . . . . . . . . . . . 37
3.10 Enrichment Analysis Workflow . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.10.1 General Preparation . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.10.2 cBioPortal: Cancer Genomic Data Exploration . . . . . . . . . . . . . 38
3.10.3 ShinyGO: Functional Enrichment with Graphical Output . . . . . . . . 39
3.11 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4 Experimental results & discussion 40
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.2 Data collection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.3 Data preparation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.4 Data preprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.5 First stage feature selection using bio-inspired methods . . . . . . . . . . . . . 43
4.6 Single level omics analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.7 Multi level omics analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.7.1 Deep neural network . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.7.2 Convolution neural network . . . . . . . . . . . . . . . . . . . . . . . 52
4.8 Enrichment analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.9 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
.1 Programming Language . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
.2 Programming Environment . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
.3 Libraries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
Côte titre : MAI/1008 Deep learning, and bioinspired optimization algorithms for genetic marker selection and disease classification. [document électronique] / Khaoula Chouder ; Maroua Kadri, Auteur ; Abderrahim Lakehal, Directeur de thèse . - [S.l.] : Setif:UFA, 2025 . - 1 vol (73 f .) ; 29 cm.
Langues : Anglais (eng)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Deep Learning
Cancer Classification
Feature Selection
Bio-Inspired Algorithms
Omics Data
Biomarker DiscoveryIndex. décimale : 004 Informatique Résumé :
AI-based cancer diagnosis and classification have emerged as a critical research field over the
past decade, especially with advancements in next-generation sequencing technologies. However,
omics datasets are often characterized by high dimensionality, complexity, and scalability
challenges. Deep learning has been increasingly adopted to address these issues due to its
strong predictive performance. Nonetheless, deep learning models remain largely black-box in
nature, lacking interpretability—a crucial factor in biological contexts where the identification
of biomarkers and selected features is essential for personalizing treatment protocols and guiding
drug prescription. Therefore, various feature selection methods are highly sought to enhance
interpretability. In this work, we propose a hybrid approach that combines deep learning with
bioinspired feature selection techniques. This report provides an overview of recent advances in
deep learning for oncology, particularly for analyzing omics data such as genomic and transcriptomic
profiles. Applications in cancer diagnosis, prognosis, and therapeutic decision-making
are explored, with a focus on the integration of multi-omics data for building clinical decision
support systems. The results of the experiments showed that the classification accuracy was
as much as 80% for single-omics models while deep neural networks and convolutional models
performed better after bioinspired optimization. Enrichment analysis also confirmed the biological
relevance of the selected features, affirming their use as clinically meaningful biomarkers.
These findings demonstrate the effectiveness of our method in both boosting prediction performance
and interpretability in cancer classification tasks.Note de contenu : Sommaire
List of Tables 6
List of Figures 8
1 Background 10
1.1 introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2 Introduction to Bioinformatic . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.2 Types . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.3 Applications of bioinformatics . . . . . . . . . . . . . . . . . . . . . . 14
1.2.4 Omic data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.2.5 Databases and repositories . . . . . . . . . . . . . . . . . . . . . . . . 15
1.2.6 Biomarkers and disease classification . . . . . . . . . . . . . . . . . . 16
1.3 Feature Selection and Bioinspired Algorithms . . . . . . . . . . . . . . . . . . 17
1.3.1 Feature Selection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3.2 Bioinspired Algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.3.3 Features selection using bioinspired algorithm . . . . . . . . . . . . . . 23
1.4 Machine learning and deep learning . . . . . . . . . . . . . . . . . . . . . . . 25
1.4.1 Machine learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.4.2 Deep learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2 Systematic Selective Review 29
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2 Paper selection and filtration . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3 Paper classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.1 Cancer classification using ML models . . . . . . . . . . . . . . . . . 21
2.3.2 Biomarker discovery using Features selection models in cancer . . . . 22
2.3.3 Biomarker discovery using bioinspired models in cancer . . . . . . . . 24
2.4 General discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3 Approach 30
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2 Problem Statement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.3 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.4 An overview on the general proposal . . . . . . . . . . . . . . . . . . . . . . 32
3.5 Data collection and preprocessing . . . . . . . . . . . . . . . . . . . . . . . . 32
3.5.1 Data Preparation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.5.2 Data Preprocessing Steps . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.6 Overview of the Feature Selection Phase . . . . . . . . . . . . . . . . . . . . . 34
3.7 What the Output Labels Mean . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.8 Bio-Inspired Feature Selection Initialization . . . . . . . . . . . . . . . . . . . 35
3.9 Pipeline Evaluation and Feature Assessment . . . . . . . . . . . . . . . . . . . 36
3.9.1 Functional Enrichment Resources . . . . . . . . . . . . . . . . . . . . 37
3.10 Enrichment Analysis Workflow . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.10.1 General Preparation . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.10.2 cBioPortal: Cancer Genomic Data Exploration . . . . . . . . . . . . . 38
3.10.3 ShinyGO: Functional Enrichment with Graphical Output . . . . . . . . 39
3.11 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4 Experimental results & discussion 40
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.2 Data collection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.3 Data preparation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.4 Data preprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.5 First stage feature selection using bio-inspired methods . . . . . . . . . . . . . 43
4.6 Single level omics analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.7 Multi level omics analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.7.1 Deep neural network . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.7.2 Convolution neural network . . . . . . . . . . . . . . . . . . . . . . . 52
4.8 Enrichment analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.9 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
.1 Programming Language . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
.2 Programming Environment . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
.3 Libraries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
Côte titre : MAI/1008 Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/1008 MAI/1008 Mémoire Bibliothèque des sciences Anglais Disponible
DisponibleDeep learning for UML model classification, and the analysis of UML class and activity diagrams. / Meriem Mami
Titre : Deep learning for UML model classification, and the analysis of UML class and activity diagrams. Type de document : texte imprimé Auteurs : Meriem Mami, Auteur ; Imene Bensalah ; Abderrahim Lakehal, Directeur de thèse Editeur : Setif:UFA Année de publication : 2024 Importance : 1 vol (88 f .) Format : 29 cm Langues : Anglais (eng) Catégories : Thèses & Mémoires:Informatique Mots-clés : UML : Unified Modeling Language
CD : Class diagram
CNN : Convolutional
Neural Networks
DL : Deep learning
TL : Transfer Learning.Index. décimale : 004 - Informatique Résumé :
UML diagrams are crucial for visualizing and understanding the design and structure
of software systems. Accurately classifying and identifying UML components is essential to
maintain the quality and efficiency of software development processes.
This thesis discusses the application of CNNs in classifying UML diagrams. The thesis focuses
on utilizing DL techniques to accurately classify UML diagrams into different categories,
including UML and non-UML classes, while addressing multi-label and multi-classification challenges.
The dataset consists of 11 folders containing UML diagrams and non-UML images, presenting
a challenging classification task due to the complexity and variability of UML diagrams.
The study emphasizes the importance of data preprocessing, including image normalization and
augmentation, to enhance the model’s ability to generalize. Additionally, transfer learning techniques
are explored to leverage pre-trained models and improve classification performance, given
the limited size of the dataset. The performance of the CNN model is evaluated using standard
evaluation metrics, such as accuracy, precision, recall, and F1 score, to assess its effectiveness
in multi-label and multi-class classification of UML diagrams.
Furthermore, comparisons are made with existing techniques to highlight the advantages of
using CNNs for UML image classification with multi-label and multi-classification. The results
demonstrate the CNN model’s ability to achieve high classification accuracy, indicating its potential
for automating the classification of UML diagrams in real-world applications. This study
contributes to the field of AI in software engineering by demonstrating the effectiveness of deep
learning techniques for UML diagram classification with multi-labeling and multi-classification,
paving the way for future research in this area.Note de contenu :
Sommaire
1 Introduction into UML modelling, and machine learning 12
1.1 Introduction: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2 UML definition: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3 UML history: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4 UML concept and components : . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4.1 UML Diagrams : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4.1.1 Structural diagrams in UML : . . . . . . . . . . . . . . . . . . . 15
1.4.1.2 Behavioral diagrams in UML : . . . . . . . . . . . . . . . . . . . 15
1.4.2 Relationships in UML: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.4.3 Class diagram in UML: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.4 Activity diagram in UML: . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5 Deep learning and Machine learning : . . . . . . . . . . . . . . . . . . . . . . . . 18
1.5.1 Machine Learning : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.5.1.1 Approaches in Machine Learning : . . . . . . . . . . . . . . . . 19
1.5.1.2 Machine Learning Process : . . . . . . . . . . . . . . . . . . . . 20
1.6 Concepts : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.6.0.1 Cross Validation : . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.6.0.2 Splitting the dataset : . . . . . . . . . . . . . . . . . . . . . . . 24
1.6.0.3 Overfitting and Underfitting : . . . . . . . . . . . . . . . . . . . 25
1.7 Deep Learning : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.8 Deep Learning Workflow: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.9 Optimization in deep learning: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.10 Regularization for Deep Learning: . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.10.1 Dropout: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.10.2 Batch Normalization: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.11 Deep Learning Models: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.11.1 Multi-layer Perceptron (MLP): . . . . . . . . . . . . . . . . . . . . . . . 31
1.11.2 Autoencoders (AE): . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.11.3 Convolutional neural network (CNN): . . . . . . . . . . . . . . . . . . . . 32
1.11.3.1 General Model Of Convolutional neural network (CNN): . . . . 33
1.12 Machine Learning and Deep learning Applications : . . . . . . . . . . . . . . . . 37
1.13 Conclusions: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2 Machine learning and UML model Classification: literature review 41
2.1 Introduction : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.2 The use of machine learning and deep learning in UML model classification: . . 43
2.3 the benefits of using machine learning and deep learning in uml model classification: 43
2.4 Advancements in ML, DL, and CNN Models in UML Classification : . . . . . . 44
2.4.1 Challenges : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.5 Related work : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.6 Conclusion: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3 CNN for UML class classification: multi labelling and multiclassification 55
3.1 Introduction: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2 Data preprocessing: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2.1 UML diagrams: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.2.2 Class diagrams: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.2.3 Activity diagrams: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.3 Transfer learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.3.1 Pretrained Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.3.1.1 AlexNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.3.1.2 AlexNet architecture . . . . . . . . . . . . . . . . . . . . . . . . 59
3.3.2 Training: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.4 CNN model for UML class prediction: Multiclassification: . . . . . . . . . . . . . 62
3.4.1 Architecture: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.4.2 Training: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.5 CNN model for Class diagram component prediction: Multi-labelling . . . . . . 63
3.5.1 Architecture: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.5.2 Training: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.6 CNN model for Activity diagram component prediction: Multi-labelling . . . . 64
3.6.1 Architecture: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.6.2 Training: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.7 Model Evaluation Metrics: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.7.1 Accuracy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.7.2 Recall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.7.3 Precision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.7.4 F1-score . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.8 Conclusion: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4 Experiments and results 68
4.1 Introduction: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.2 Implementation frameworks and tools: . . . . . . . . . . . . . . . . . . . . . . . 69
4.2.1 Python . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.2.2 Tensorflow . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.2.3 Keras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.2.4 Kaggle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.2.5 pytorch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.2.6 Google Colab . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.3 Datasets Description: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.4 Classification : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.4.1 Transfer learning Results : . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.4.1.1 AlexNet: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.4.2 The CNN Results : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.4.2.1 CNN model for UML class prediction:Multiclassification . . . . 76
4.4.3 Detailed Analysis: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.4.3.1 Observations: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.4.3.2 Recommendations: . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.5 Models comparison : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.5.1 The CNN multilabeling Architecture Results : . . . . . . . . . . . . . . . 79
4.5.1.1 CNN model for Activity diagram component prediction: Multilabelling
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.5.1.2 CNN model for Class diagram component prediction: Multilabelling
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.6 Conclusion : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81Côte titre : MAI/0886 Deep learning for UML model classification, and the analysis of UML class and activity diagrams. [texte imprimé] / Meriem Mami, Auteur ; Imene Bensalah ; Abderrahim Lakehal, Directeur de thèse . - [S.l.] : Setif:UFA, 2024 . - 1 vol (88 f .) ; 29 cm.
Langues : Anglais (eng)
Catégories : Thèses & Mémoires:Informatique Mots-clés : UML : Unified Modeling Language
CD : Class diagram
CNN : Convolutional
Neural Networks
DL : Deep learning
TL : Transfer Learning.Index. décimale : 004 - Informatique Résumé :
UML diagrams are crucial for visualizing and understanding the design and structure
of software systems. Accurately classifying and identifying UML components is essential to
maintain the quality and efficiency of software development processes.
This thesis discusses the application of CNNs in classifying UML diagrams. The thesis focuses
on utilizing DL techniques to accurately classify UML diagrams into different categories,
including UML and non-UML classes, while addressing multi-label and multi-classification challenges.
The dataset consists of 11 folders containing UML diagrams and non-UML images, presenting
a challenging classification task due to the complexity and variability of UML diagrams.
The study emphasizes the importance of data preprocessing, including image normalization and
augmentation, to enhance the model’s ability to generalize. Additionally, transfer learning techniques
are explored to leverage pre-trained models and improve classification performance, given
the limited size of the dataset. The performance of the CNN model is evaluated using standard
evaluation metrics, such as accuracy, precision, recall, and F1 score, to assess its effectiveness
in multi-label and multi-class classification of UML diagrams.
Furthermore, comparisons are made with existing techniques to highlight the advantages of
using CNNs for UML image classification with multi-label and multi-classification. The results
demonstrate the CNN model’s ability to achieve high classification accuracy, indicating its potential
for automating the classification of UML diagrams in real-world applications. This study
contributes to the field of AI in software engineering by demonstrating the effectiveness of deep
learning techniques for UML diagram classification with multi-labeling and multi-classification,
paving the way for future research in this area.Note de contenu :
Sommaire
1 Introduction into UML modelling, and machine learning 12
1.1 Introduction: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2 UML definition: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3 UML history: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4 UML concept and components : . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4.1 UML Diagrams : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4.1.1 Structural diagrams in UML : . . . . . . . . . . . . . . . . . . . 15
1.4.1.2 Behavioral diagrams in UML : . . . . . . . . . . . . . . . . . . . 15
1.4.2 Relationships in UML: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.4.3 Class diagram in UML: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.4 Activity diagram in UML: . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5 Deep learning and Machine learning : . . . . . . . . . . . . . . . . . . . . . . . . 18
1.5.1 Machine Learning : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.5.1.1 Approaches in Machine Learning : . . . . . . . . . . . . . . . . 19
1.5.1.2 Machine Learning Process : . . . . . . . . . . . . . . . . . . . . 20
1.6 Concepts : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.6.0.1 Cross Validation : . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.6.0.2 Splitting the dataset : . . . . . . . . . . . . . . . . . . . . . . . 24
1.6.0.3 Overfitting and Underfitting : . . . . . . . . . . . . . . . . . . . 25
1.7 Deep Learning : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.8 Deep Learning Workflow: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.9 Optimization in deep learning: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.10 Regularization for Deep Learning: . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.10.1 Dropout: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.10.2 Batch Normalization: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.11 Deep Learning Models: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.11.1 Multi-layer Perceptron (MLP): . . . . . . . . . . . . . . . . . . . . . . . 31
1.11.2 Autoencoders (AE): . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.11.3 Convolutional neural network (CNN): . . . . . . . . . . . . . . . . . . . . 32
1.11.3.1 General Model Of Convolutional neural network (CNN): . . . . 33
1.12 Machine Learning and Deep learning Applications : . . . . . . . . . . . . . . . . 37
1.13 Conclusions: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2 Machine learning and UML model Classification: literature review 41
2.1 Introduction : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.2 The use of machine learning and deep learning in UML model classification: . . 43
2.3 the benefits of using machine learning and deep learning in uml model classification: 43
2.4 Advancements in ML, DL, and CNN Models in UML Classification : . . . . . . 44
2.4.1 Challenges : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.5 Related work : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.6 Conclusion: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3 CNN for UML class classification: multi labelling and multiclassification 55
3.1 Introduction: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2 Data preprocessing: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2.1 UML diagrams: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.2.2 Class diagrams: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.2.3 Activity diagrams: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.3 Transfer learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.3.1 Pretrained Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.3.1.1 AlexNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.3.1.2 AlexNet architecture . . . . . . . . . . . . . . . . . . . . . . . . 59
3.3.2 Training: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.4 CNN model for UML class prediction: Multiclassification: . . . . . . . . . . . . . 62
3.4.1 Architecture: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.4.2 Training: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.5 CNN model for Class diagram component prediction: Multi-labelling . . . . . . 63
3.5.1 Architecture: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.5.2 Training: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.6 CNN model for Activity diagram component prediction: Multi-labelling . . . . 64
3.6.1 Architecture: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.6.2 Training: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.7 Model Evaluation Metrics: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.7.1 Accuracy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.7.2 Recall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.7.3 Precision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.7.4 F1-score . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.8 Conclusion: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4 Experiments and results 68
4.1 Introduction: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.2 Implementation frameworks and tools: . . . . . . . . . . . . . . . . . . . . . . . 69
4.2.1 Python . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.2.2 Tensorflow . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.2.3 Keras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.2.4 Kaggle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.2.5 pytorch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.2.6 Google Colab . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.3 Datasets Description: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.4 Classification : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.4.1 Transfer learning Results : . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.4.1.1 AlexNet: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.4.2 The CNN Results : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.4.2.1 CNN model for UML class prediction:Multiclassification . . . . 76
4.4.3 Detailed Analysis: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.4.3.1 Observations: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.4.3.2 Recommendations: . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.5 Models comparison : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.5.1 The CNN multilabeling Architecture Results : . . . . . . . . . . . . . . . 79
4.5.1.1 CNN model for Activity diagram component prediction: Multilabelling
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.5.1.2 CNN model for Class diagram component prediction: Multilabelling
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.6 Conclusion : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81Côte titre : MAI/0886 Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0886 MAI/0886 Mémoire Bibliothèque des sciences Anglais Disponible
DisponiblePermalink

