University Sétif 1 FERHAT ABBAS Faculty of Sciences
Détail de l'auteur
Auteur Abderrahim Lakehal |
Documents disponibles écrits par cet auteur



Approche sémantique de génération automatique d’applications agiles en environnement pervasif / Abderrahim Lakehal
![]()
Titre : Approche sémantique de génération automatique d’applications agiles en environnement pervasif Type de document : texte imprimé Auteurs : Abderrahim Lakehal, Auteur ; Alti,Adel, Directeur de thèse Editeur : Setif:UFA Année de publication : 2020 Importance : 1 vol (182 f .) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Ontologies
Objets connectés hétérogènes
Environnements omniprésentsIndex. décimale : 004 - Informatique Résumé :
Avec l’apparition abondante d’objets connectés dans les environnements pervasif, les utilisateurs ont tendance à récupérer les informations contextuelles directement, depuis l'environnement physique, pour mieux répondre à leurs besoins et gérer idéalement leurs situations. Cependant, avec la croissance rapide de la taille des données et du nombre d'appareils dans les environnements pervasif, l'identification d'un grand nombre de situations d'utilisateurs devient une tâche difficile. En effet, l'identification de situations dans des environnements pervasif implique une interprétation sémantique des données brutes contextuelles fournies par divers objets hétérogènes, ce qui nécessite de nouvelles solutions agiles dans la gestion des situations composites. Aucune des approches existantes n'est en mesure de gérer et d'identifier efficacement les situations d'urgence composites centrées sur l'utilisateur. Elles manquent de flexibilité pour évoluer et s’adapter en fonction du contexte actuel de l’utilisateur et des exigences de l’environnement. Les systèmes actuels perdent en performance face à la complexité de la gestion d'un grand nombre de situations ou de la recherche de services adaptés tout en respectant les délais. Notre objectif est de fournir une approche sémantique agile dans le contexte du smart-* (maison, santé, etc.). Cette approche agile met l'accent sur la gestion efficace des situations quotidiennes et urgentes via des applications mobiles et la génération automatiquement des actions de reconfigurations en fonction du profil de l'utilisateur, de ses besoins et situations actuels. Tout d'abord, nous avons proposé un modèle d’ontologie multicouche appelé Multi-OCSM pour modéliser formellement des services intelligents des domaines des utilisateurs, des situations et des priorités entre situations. Il permet également une reconfiguration automatique des applications pervasive avec une meilleure autonomie. Ensuite, nous avons proposé une nouvelle architecture pour spécifier des opérateurs de composition tels que parallèle, séquence, alternative et récurrence entre des situations basées composants. A partir de la spécification de situations à base de composants, nous générons l'orchestration des services à partir des règles sémantiques et scénarios de mouvements. Nous avons aussi proposé une nouvelle approche basée sur les microservices pour la gestion et l’identification des situations composites en temps réel. Un système de recommandation basé sur une ontologie sensible au contexte pour l'enrichissement et l'adaptation des règles de situation est également proposé. Enfin, pour valider l'efficacité de notre approche, nous proposons un prototype de gestion des situations avec plusieurs expérimentations. Les résultats expérimentaux montrent que l'approche proposée est efficace en termes de gestion et d'identification des situations composites où l'utilisation des microservices factorisés améliore le temps d'exécution du système.Côte titre : DI/0054 En ligne : http://dspace.univ-setif.dz:8888/jspui/bitstream/123456789/3758/1/Thesis%20Final [...] Format de la ressource électronique : Approche sémantique de génération automatique d’applications agiles en environnement pervasif [texte imprimé] / Abderrahim Lakehal, Auteur ; Alti,Adel, Directeur de thèse . - [S.l.] : Setif:UFA, 2020 . - 1 vol (182 f .) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Ontologies
Objets connectés hétérogènes
Environnements omniprésentsIndex. décimale : 004 - Informatique Résumé :
Avec l’apparition abondante d’objets connectés dans les environnements pervasif, les utilisateurs ont tendance à récupérer les informations contextuelles directement, depuis l'environnement physique, pour mieux répondre à leurs besoins et gérer idéalement leurs situations. Cependant, avec la croissance rapide de la taille des données et du nombre d'appareils dans les environnements pervasif, l'identification d'un grand nombre de situations d'utilisateurs devient une tâche difficile. En effet, l'identification de situations dans des environnements pervasif implique une interprétation sémantique des données brutes contextuelles fournies par divers objets hétérogènes, ce qui nécessite de nouvelles solutions agiles dans la gestion des situations composites. Aucune des approches existantes n'est en mesure de gérer et d'identifier efficacement les situations d'urgence composites centrées sur l'utilisateur. Elles manquent de flexibilité pour évoluer et s’adapter en fonction du contexte actuel de l’utilisateur et des exigences de l’environnement. Les systèmes actuels perdent en performance face à la complexité de la gestion d'un grand nombre de situations ou de la recherche de services adaptés tout en respectant les délais. Notre objectif est de fournir une approche sémantique agile dans le contexte du smart-* (maison, santé, etc.). Cette approche agile met l'accent sur la gestion efficace des situations quotidiennes et urgentes via des applications mobiles et la génération automatiquement des actions de reconfigurations en fonction du profil de l'utilisateur, de ses besoins et situations actuels. Tout d'abord, nous avons proposé un modèle d’ontologie multicouche appelé Multi-OCSM pour modéliser formellement des services intelligents des domaines des utilisateurs, des situations et des priorités entre situations. Il permet également une reconfiguration automatique des applications pervasive avec une meilleure autonomie. Ensuite, nous avons proposé une nouvelle architecture pour spécifier des opérateurs de composition tels que parallèle, séquence, alternative et récurrence entre des situations basées composants. A partir de la spécification de situations à base de composants, nous générons l'orchestration des services à partir des règles sémantiques et scénarios de mouvements. Nous avons aussi proposé une nouvelle approche basée sur les microservices pour la gestion et l’identification des situations composites en temps réel. Un système de recommandation basé sur une ontologie sensible au contexte pour l'enrichissement et l'adaptation des règles de situation est également proposé. Enfin, pour valider l'efficacité de notre approche, nous proposons un prototype de gestion des situations avec plusieurs expérimentations. Les résultats expérimentaux montrent que l'approche proposée est efficace en termes de gestion et d'identification des situations composites où l'utilisation des microservices factorisés améliore le temps d'exécution du système.Côte titre : DI/0054 En ligne : http://dspace.univ-setif.dz:8888/jspui/bitstream/123456789/3758/1/Thesis%20Final [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité DI/0054 DI/0054 Thèse Bibliothéque des sciences Français Disponible
DisponibleContrôle autonomique contextualise guide par les ontologies des applications mobiles multimodales / Abderrahim Lakehal
![]()
Titre : Contrôle autonomique contextualise guide par les ontologies des applications mobiles multimodales Type de document : texte imprimé Auteurs : Abderrahim Lakehal ; Alti,Adel, Directeur de thèse Editeur : Setif:UFA Année de publication : 2016 Importance : 1 vol (87f.) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Réseaux
Systèmes Distribués
Profil utilisateur
Contexte
Contrainte
Autonomique
Ontologie
AdaptationIndex. décimale : 004 Informatique Résumé : RESUME
Actuellement, les applications mobiles ont été largement utilisées dans divers domaines. Les
applications mobiles ubiquitaires ont pour objectif d’accompagner les utilisateurs à tout
moment, en tout lieu et en toute circonstance. Elles sont développées en blocs qui s’exécutent
sur des Smartphones, des laptops et des tablettes. La mobilité tient compte des contraintes
inhérentes au caractère multimédia. Ce contexte soulève, entre autre, des problèmes liés Ã
l’hétérogénéité des contenus (documents, données, flux de données ou autres données liées Ã
des services), aux terminaux (capteurs domestiques), aux préférences des utilisateurs et leurs
contextes d’usages (profils).Dans ce travail, nous tenons compte de l’ensemble de ces
problèmes en nous focalisant particulièrement sur les applications mobiles sensibles aux
contextes. Pour ce faire, nous proposons une architecture basée sur une ontologie générique
qui fournit des services sémantiquement équivalents et appropriés au contexte spécifique
d’une personne via des règles d’inférences. Afin de valider notre proposition, nous avons
utilisé les technologies issues du Web sémantique et l’intergicielKalimucho pour la
spécification et l’expérimentation des profils des utilisateurs sur plusieurs plates-formes.Note de contenu : Table des matières
INTRODUCTION GENERALE ........................................................................................ 1
Chapitre 1 : Système Ambiant Autonomique Et Web Sémantique
1. Introduction.................................................................................. 3
2. Systèmes ambiants ................................................................................... 4
2.1 Définition............................................................................................ 4
2.2 Caractéristique des systèmes ambiants................................................................ 5
2.3 Architecture des systèmes ambiants.................................................................... 5
2.4 Hétérogénéité et mobilité .................................................................................. 6
3. Contexte et Sensibilité au contexte .................................................................. 7
3.1 Définition......................................................................................... 7
3.2 Contexte et l’informatique ambiante ................................................................... 7
3.3 Sensibilité au contexte.............................................................................. 7
4. Profils utilisateurs et ses contraintes ................................................................. 8
4.1 Définition............................................................................................. 8
4.2 Modélisation du profil ............................................................................. 8
5. Système ambiant autonomique....................................................................... 9
5.1 Définition............................................................................................. 9
5.2 Boucle CADA (Collection, Analysis, Decision and Action)........................................... 10
6. Web sémantique ....................................................................................... 11
6.1 Ontologie ................................................................................................. 12
6.2 La structure d’une ontologie ................................................................................. 12
7. Conclusion ............................................................................................ 14
Chapitre 2 : Etat de l’art
1. Introduction................................................................................................. 15
2. Travaux connexes...................................................................................... 15
2.1 Architectures contextuelles pour le déploiement de services........................................ 16
2.2 Les plates-formes existantes .......................................................................................... 17
2.3 Les techniques d'adaptation .......................................................................................... 18
3. Synthèse et discussion ................................................................................................ 21
4. Conclusion ................................................................................................. 24
Chapitre 3 : Conception et ontologie développée
1. Introduction...................................................................................................... 25
2. Présentation de la solution AESCR ........................................................................... 25
3. Ontologie développée du modèle de contexte............................................................ 26
3.1 Ontologie de noyau ........................................................................................................ 26
3.2 Ontologie de domaine de contexte ................................................................................. 27
3.3 Ontologie des contraintes............................................................................................... 32
3.4 Ontologie des propriétés de contextes ........................................................................... 33
3.5 Ontologie des services contextuels................................................................................. 34
3.6 Ontologie des Evénements............................................................................................. 34
3.7 Ontologie des Situations................................................................................................. 35
4. Plateforme Kalimucho-smart .................................................................................... 36
4.1 Démarche d’intégration à Kalimucho........................................................................... 36
4.2 Architecture de la plateforme Kalimucho-smart...................................................... 36
4.3 Schéma fonctionnel............................................................................................ 40
5. Simulation de la plateforme....................................................................................... 41
6. Conclusion ................................................................................. 46
Chapitre 4 : REALISATION PROTOTYPE et EVALUATION
1. Introduction............................................................................................. 47
2. Les langages utilisés et les outils d'implémentations................................................. 48
2.1 Les langages utilisées ................................................................................................ 48
2.1.1 Langage Java.........................................................................................................48
2.1.2 Langage SQL (Structured Query Language)..................................................................................48
2.1.3 Langage PHP...............................................................................................48
2.1.4 Langage OWL (Ontology Web Language) ...................................................................................48
2.1.5 Langage SWRL (Semantic Web Rule Language).......................................................................................49
2.2 Les outils utilisés.................................................................................... 49
2.2.1 Eclipse..................................................................................49
2.2.2 Android Studio .................................................................................49
2.2.3 MySQL..............................................................................................49
2.2.4 EasyPHP................................................................................................50
2.2.5 Protégé..................................................................................................50
2.2.6 Plateforme Kalimucho .........................................................................................50
3. Implémentations et Structures de données utilisées ................................................. 51
3.1 Structure de la base de donnée «BDContext»............................................................... 51
3.2 L'implémentation de l'ontologie Smart-Adaptation-Context....................................... 55
3.3 L'implémentation des services contextuels.................................................................... 58
3.4 Architecture et fonctionnement générale de la plateforme........................................... 58
3.5 Modèle de fonctionnement de la plateforme ................................................................. 61
3.6 Description des classes java et packages AESCR ......................................................... 63
3.6.1 Package AESCR..................................................................................................63
3.6.2 Package ContextConstraintManager.................................................................................63
3.6.3 Package ContextServiceManager.............................................................................63
3.6.4 Package ContextUserManager.......................................................................................64
3.6.5 Package ContextReasoner.............................................................................................64
3.6.6 Package Repository ...........................................................................................................64
3.6.7 Package ServiceController............................................................................................64
4. Scénario d’illustration et validation .......................................................................... 65
5. Conclusion .................................................................................................................. 75
CONCLUSION GENERALE ........................................................................................... 76
Bibliographies.................................................................................................................... 77
Annexes.............................................................................................................................. 82Côte titre : MAI/0125 En ligne : https://drive.google.com/file/d/1tlvVAZTXGZXjPAV1d0_4o851IexKm45E/view?usp=shari [...] Format de la ressource électronique : Contrôle autonomique contextualise guide par les ontologies des applications mobiles multimodales [texte imprimé] / Abderrahim Lakehal ; Alti,Adel, Directeur de thèse . - [S.l.] : Setif:UFA, 2016 . - 1 vol (87f.) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Réseaux
Systèmes Distribués
Profil utilisateur
Contexte
Contrainte
Autonomique
Ontologie
AdaptationIndex. décimale : 004 Informatique Résumé : RESUME
Actuellement, les applications mobiles ont été largement utilisées dans divers domaines. Les
applications mobiles ubiquitaires ont pour objectif d’accompagner les utilisateurs à tout
moment, en tout lieu et en toute circonstance. Elles sont développées en blocs qui s’exécutent
sur des Smartphones, des laptops et des tablettes. La mobilité tient compte des contraintes
inhérentes au caractère multimédia. Ce contexte soulève, entre autre, des problèmes liés Ã
l’hétérogénéité des contenus (documents, données, flux de données ou autres données liées Ã
des services), aux terminaux (capteurs domestiques), aux préférences des utilisateurs et leurs
contextes d’usages (profils).Dans ce travail, nous tenons compte de l’ensemble de ces
problèmes en nous focalisant particulièrement sur les applications mobiles sensibles aux
contextes. Pour ce faire, nous proposons une architecture basée sur une ontologie générique
qui fournit des services sémantiquement équivalents et appropriés au contexte spécifique
d’une personne via des règles d’inférences. Afin de valider notre proposition, nous avons
utilisé les technologies issues du Web sémantique et l’intergicielKalimucho pour la
spécification et l’expérimentation des profils des utilisateurs sur plusieurs plates-formes.Note de contenu : Table des matières
INTRODUCTION GENERALE ........................................................................................ 1
Chapitre 1 : Système Ambiant Autonomique Et Web Sémantique
1. Introduction.................................................................................. 3
2. Systèmes ambiants ................................................................................... 4
2.1 Définition............................................................................................ 4
2.2 Caractéristique des systèmes ambiants................................................................ 5
2.3 Architecture des systèmes ambiants.................................................................... 5
2.4 Hétérogénéité et mobilité .................................................................................. 6
3. Contexte et Sensibilité au contexte .................................................................. 7
3.1 Définition......................................................................................... 7
3.2 Contexte et l’informatique ambiante ................................................................... 7
3.3 Sensibilité au contexte.............................................................................. 7
4. Profils utilisateurs et ses contraintes ................................................................. 8
4.1 Définition............................................................................................. 8
4.2 Modélisation du profil ............................................................................. 8
5. Système ambiant autonomique....................................................................... 9
5.1 Définition............................................................................................. 9
5.2 Boucle CADA (Collection, Analysis, Decision and Action)........................................... 10
6. Web sémantique ....................................................................................... 11
6.1 Ontologie ................................................................................................. 12
6.2 La structure d’une ontologie ................................................................................. 12
7. Conclusion ............................................................................................ 14
Chapitre 2 : Etat de l’art
1. Introduction................................................................................................. 15
2. Travaux connexes...................................................................................... 15
2.1 Architectures contextuelles pour le déploiement de services........................................ 16
2.2 Les plates-formes existantes .......................................................................................... 17
2.3 Les techniques d'adaptation .......................................................................................... 18
3. Synthèse et discussion ................................................................................................ 21
4. Conclusion ................................................................................................. 24
Chapitre 3 : Conception et ontologie développée
1. Introduction...................................................................................................... 25
2. Présentation de la solution AESCR ........................................................................... 25
3. Ontologie développée du modèle de contexte............................................................ 26
3.1 Ontologie de noyau ........................................................................................................ 26
3.2 Ontologie de domaine de contexte ................................................................................. 27
3.3 Ontologie des contraintes............................................................................................... 32
3.4 Ontologie des propriétés de contextes ........................................................................... 33
3.5 Ontologie des services contextuels................................................................................. 34
3.6 Ontologie des Evénements............................................................................................. 34
3.7 Ontologie des Situations................................................................................................. 35
4. Plateforme Kalimucho-smart .................................................................................... 36
4.1 Démarche d’intégration à Kalimucho........................................................................... 36
4.2 Architecture de la plateforme Kalimucho-smart...................................................... 36
4.3 Schéma fonctionnel............................................................................................ 40
5. Simulation de la plateforme....................................................................................... 41
6. Conclusion ................................................................................. 46
Chapitre 4 : REALISATION PROTOTYPE et EVALUATION
1. Introduction............................................................................................. 47
2. Les langages utilisés et les outils d'implémentations................................................. 48
2.1 Les langages utilisées ................................................................................................ 48
2.1.1 Langage Java.........................................................................................................48
2.1.2 Langage SQL (Structured Query Language)..................................................................................48
2.1.3 Langage PHP...............................................................................................48
2.1.4 Langage OWL (Ontology Web Language) ...................................................................................48
2.1.5 Langage SWRL (Semantic Web Rule Language).......................................................................................49
2.2 Les outils utilisés.................................................................................... 49
2.2.1 Eclipse..................................................................................49
2.2.2 Android Studio .................................................................................49
2.2.3 MySQL..............................................................................................49
2.2.4 EasyPHP................................................................................................50
2.2.5 Protégé..................................................................................................50
2.2.6 Plateforme Kalimucho .........................................................................................50
3. Implémentations et Structures de données utilisées ................................................. 51
3.1 Structure de la base de donnée «BDContext»............................................................... 51
3.2 L'implémentation de l'ontologie Smart-Adaptation-Context....................................... 55
3.3 L'implémentation des services contextuels.................................................................... 58
3.4 Architecture et fonctionnement générale de la plateforme........................................... 58
3.5 Modèle de fonctionnement de la plateforme ................................................................. 61
3.6 Description des classes java et packages AESCR ......................................................... 63
3.6.1 Package AESCR..................................................................................................63
3.6.2 Package ContextConstraintManager.................................................................................63
3.6.3 Package ContextServiceManager.............................................................................63
3.6.4 Package ContextUserManager.......................................................................................64
3.6.5 Package ContextReasoner.............................................................................................64
3.6.6 Package Repository ...........................................................................................................64
3.6.7 Package ServiceController............................................................................................64
4. Scénario d’illustration et validation .......................................................................... 65
5. Conclusion .................................................................................................................. 75
CONCLUSION GENERALE ........................................................................................... 76
Bibliographies.................................................................................................................... 77
Annexes.............................................................................................................................. 82Côte titre : MAI/0125 En ligne : https://drive.google.com/file/d/1tlvVAZTXGZXjPAV1d0_4o851IexKm45E/view?usp=shari [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0125 MAI/0125 Mémoire Bibliothéque des sciences Français Disponible
Disponible
Titre : Deep Generative Models in Omics Data Augmentation for Disease Classification Type de document : texte imprimé Auteurs : Boutheyna Khenouche, Auteur ; Imene Madoui ; Abderrahim Lakehal, Directeur de thèse Editeur : Setif:UFA Année de publication : 2024 Importance : 1 vol (115 f .) Format : 29 cm Langues : Anglais (eng) Catégories : Thèses & Mémoires:Informatique Mots-clés : Informatique Index. décimale : 004 - Informatique Résumé : The intersection of bioinformatics and machine learning has opened new possibilities
in cancer research, particularly in the analysis and classification of omics
data, which is often which are frequently limited and diverse. This thesis explores
the application of deep generative models, specifically Generative Adversarial Networks
(GANs), to augment omics data, including both gene and protein expression
data, for improved disease classification. Cancer, being one of the most prevalent
and complex diseases, presents significant challenges that require advanced analytical
approaches. Traditional machine learning methods often struggle with highdimensional
and limited datasets, whereas deep learning offers a promising alternative
due to its ability to learn intricate patterns. Our approach involves collecting
and preprocessing gene expression data from 11,070 samples and protein expression
data from 7,790 samples, generating synthetic data through GANs , and training
classifiers like Convolutional Neural Networks (CNNs) and Multi-Layer Perceptrons
(MLPs) on the augmented datasets for the prediction of overall survival (OS) and
progression-free interval (PFI). We validate the data generated by our GAN through
biological classification of genes and proteins, and by comprehensive data visualization
techniques.Note de contenu : Sommaire
1 Bioinformatics , Machine Learning and Deep Learning 10
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2 Bioinformatics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.1 Origin of Bioinformatics . . . . . . . . . . . . . . . . . . . . . 11
1.2.2 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.3 Bioinformatics Subfields . . . . . . . . . . . . . . . . . . . . . 12
1.2.4 Bioinformatics data types and Databases . . . . . . . . . . . . 13
1.2.5 Bioinfromatics Application Domain . . . . . . . . . . . . . . . 15
1.2.6 Benefits of Bioinformatics in Healthcare . . . . . . . . . . . . 16
1.3 Machine Learning: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3.2 Machine learning techniques . . . . . . . . . . . . . . . . . . 17
1.4 Deep Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.4.1 definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.4.2 Neural Network in Deep Learning . . . . . . . . . . . . . . . . 20
1.5 Generative Models in machine Learning and deep learning . . . . . . 22
1.5.1 Generative Adversarial Networks (GANs) . . . . . . . . . . . . 22
1.5.2 Variational AutoEncoders (VAEs) . . . . . . . . . . . . . . . . 25
1.6 Machine Learning Vs Deep Learning . . . . . . . . . . . . . . . . . . 27
1.7 Application Domain of ML and DL in Health Care . . . . . . . . . . 29
1.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2 Disease classification and data augmentation: Literature review 31
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.2 Omics data, Machine learning and medical research . . . . . . . . . . 32
2.2.1 Omics data: Definition and types . . . . . . . . . . . . . . . . 32
2.2.2 Overview on omics data and machine learning . . . . . . . . . 32
2.3 Related work in Generative model for data augmentation . . . . . . . 33
2.4 Generative models for spatial data augmentation . . . . . . . . . . . 34
2.5 Generative model for omics data augmentation . . . . . . . . . . . . . 41
2.6 Generative adversarial network for omics data augmentation in cancer
classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3 Deep Generative models for omics data augmentation: Cancer case
study 46
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.2 Analyzing Gene and Protein Data: From Collection to Insight . . . . 47
3.3 Proposed Architecture for Data Augmentation and Classification . . 47
3.4 Data Collection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.5 Data Preprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.5.1 Gene Expression data . . . . . . . . . . . . . . . . . . . . . . 50
3.5.2 Protein Expression Data Pre-processing . . . . . . . . . . . . . 53
3.6 Dimensionality Reduction for Gene Expression Data: . . . . . . . . . 54
3.7 Generative adversarial network for data augmentation . . . . . . . . 56
3.7.1 Data preparation . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.7.2 Model elaboration . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.7.3 Training and evaluation . . . . . . . . . . . . . . . . . . . . . 57
3.8 Convolutional Neural Networks. . . . . . . . . . . . . . . . . . . . . . 58
3.8.1 Data Preparation . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.8.2 Model Definition and Building . . . . . . . . . . . . . . . . . 58
3.8.3 Model Training and Evaluation . . . . . . . . . . . . . . . . . 58
3.9 Biological Classification of Genes and Proteins . . . . . . . . . . . . . 59
3.9.1 Objective and Methodology . . . . . . . . . . . . . . . . . . . 59
3.10 Multi-Layer Perceptron Implementation . . . . . . . . . . . . . . . . 59
3.10.1 Data Preparation . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.10.2 Data Splitting . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.10.3 Model Building and Predictions for OS . . . . . . . . . . . . . 59
3.10.4 Model Building and Predictions for PFI . . . . . . . . . . . . 59
3.10.5 Synthetic Data . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.11 conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4 Implementation and evaluation 61
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.2 Experimental tools and Packages . . . . . . . . . . . . . . . . . . . . 62
4.2.1 PYTHON . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.3 Evaluation Metrics for Classification Models . . . . . . . . . . . . . . 64
4.3.1 Precision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.2 Recall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.3 Accuracy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.4 F1-Score . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.5 Matthews Correlation Coefficient (MCC) . . . . . . . . . . . 65
4.4 Datasets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.5 Implementation and Dataset Evaluation . . . . . . . . . . . . . . . . 66
4.5.1 Pre-processing:Gene Expression . . . . . . . . . . . . . . 66
4.5.2 Pre-processing :Protein Expression . . . . . . . . . . . . 67
4.5.3 Dimensionality Reduction: Gene Expression . . . . . . 68
4.5.4 Implement Generative Adversarial Networks (GANs) . . . . . 70
4.5.5 Implement Convolutional Neural Networks . . . . . . . . . . . 75
4.6 Implement Multi-Layer Perceptron . . . . . . . . . . . . . . . . . . . 79
4.7 Biological Classification of Genes and Proteins . . . . . . . . . . . . . 82
4.7.1 Tools and Techniques . . . . . . . . . . . . . . . . . . . . . . . 82
4.8 MLP Model for Distinguishing Upregulated and Downregulated Genes/Proteins 83
4.9 Evaluating Prediction Accuracy and Updating Gene and Protein Expression
Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.10 Data Visualisation and Interpretation . . . . . . . . . . . . . . . . . . 86
4.12 Comparison of CNN and MLP Performance on Augmented Gene Expression
Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.12.1 Gene Expression Data . . . . . . . . . . . . . . . . . . . . . 90
4.12.2 Protein Expression Data . . . . . . . . . . . . . . . . . . . . . 91
4.13 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
.1 First Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
.1.1 Pre-processing:Gene Expression . . . . . . . . . . . . . . 95
.1.2 Pre-processing :Protein Expression . . . . . . . . . . . . 100
.2 Second Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
.2.1 Implement Generative Adversarial Networks (GANs) . . . . . 105
.3 Third Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
.3.1 Implementing Predictions and Labeling for Generated Data . 106Côte titre : MAI/0926
Deep Generative Models in Omics Data Augmentation for Disease Classification [texte imprimé] / Boutheyna Khenouche, Auteur ; Imene Madoui ; Abderrahim Lakehal, Directeur de thèse . - [S.l.] : Setif:UFA, 2024 . - 1 vol (115 f .) ; 29 cm.
Langues : Anglais (eng)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Informatique Index. décimale : 004 - Informatique Résumé : The intersection of bioinformatics and machine learning has opened new possibilities
in cancer research, particularly in the analysis and classification of omics
data, which is often which are frequently limited and diverse. This thesis explores
the application of deep generative models, specifically Generative Adversarial Networks
(GANs), to augment omics data, including both gene and protein expression
data, for improved disease classification. Cancer, being one of the most prevalent
and complex diseases, presents significant challenges that require advanced analytical
approaches. Traditional machine learning methods often struggle with highdimensional
and limited datasets, whereas deep learning offers a promising alternative
due to its ability to learn intricate patterns. Our approach involves collecting
and preprocessing gene expression data from 11,070 samples and protein expression
data from 7,790 samples, generating synthetic data through GANs , and training
classifiers like Convolutional Neural Networks (CNNs) and Multi-Layer Perceptrons
(MLPs) on the augmented datasets for the prediction of overall survival (OS) and
progression-free interval (PFI). We validate the data generated by our GAN through
biological classification of genes and proteins, and by comprehensive data visualization
techniques.Note de contenu : Sommaire
1 Bioinformatics , Machine Learning and Deep Learning 10
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2 Bioinformatics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.1 Origin of Bioinformatics . . . . . . . . . . . . . . . . . . . . . 11
1.2.2 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.3 Bioinformatics Subfields . . . . . . . . . . . . . . . . . . . . . 12
1.2.4 Bioinformatics data types and Databases . . . . . . . . . . . . 13
1.2.5 Bioinfromatics Application Domain . . . . . . . . . . . . . . . 15
1.2.6 Benefits of Bioinformatics in Healthcare . . . . . . . . . . . . 16
1.3 Machine Learning: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3.2 Machine learning techniques . . . . . . . . . . . . . . . . . . 17
1.4 Deep Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.4.1 definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.4.2 Neural Network in Deep Learning . . . . . . . . . . . . . . . . 20
1.5 Generative Models in machine Learning and deep learning . . . . . . 22
1.5.1 Generative Adversarial Networks (GANs) . . . . . . . . . . . . 22
1.5.2 Variational AutoEncoders (VAEs) . . . . . . . . . . . . . . . . 25
1.6 Machine Learning Vs Deep Learning . . . . . . . . . . . . . . . . . . 27
1.7 Application Domain of ML and DL in Health Care . . . . . . . . . . 29
1.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2 Disease classification and data augmentation: Literature review 31
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.2 Omics data, Machine learning and medical research . . . . . . . . . . 32
2.2.1 Omics data: Definition and types . . . . . . . . . . . . . . . . 32
2.2.2 Overview on omics data and machine learning . . . . . . . . . 32
2.3 Related work in Generative model for data augmentation . . . . . . . 33
2.4 Generative models for spatial data augmentation . . . . . . . . . . . 34
2.5 Generative model for omics data augmentation . . . . . . . . . . . . . 41
2.6 Generative adversarial network for omics data augmentation in cancer
classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3 Deep Generative models for omics data augmentation: Cancer case
study 46
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.2 Analyzing Gene and Protein Data: From Collection to Insight . . . . 47
3.3 Proposed Architecture for Data Augmentation and Classification . . 47
3.4 Data Collection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.5 Data Preprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.5.1 Gene Expression data . . . . . . . . . . . . . . . . . . . . . . 50
3.5.2 Protein Expression Data Pre-processing . . . . . . . . . . . . . 53
3.6 Dimensionality Reduction for Gene Expression Data: . . . . . . . . . 54
3.7 Generative adversarial network for data augmentation . . . . . . . . 56
3.7.1 Data preparation . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.7.2 Model elaboration . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.7.3 Training and evaluation . . . . . . . . . . . . . . . . . . . . . 57
3.8 Convolutional Neural Networks. . . . . . . . . . . . . . . . . . . . . . 58
3.8.1 Data Preparation . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.8.2 Model Definition and Building . . . . . . . . . . . . . . . . . 58
3.8.3 Model Training and Evaluation . . . . . . . . . . . . . . . . . 58
3.9 Biological Classification of Genes and Proteins . . . . . . . . . . . . . 59
3.9.1 Objective and Methodology . . . . . . . . . . . . . . . . . . . 59
3.10 Multi-Layer Perceptron Implementation . . . . . . . . . . . . . . . . 59
3.10.1 Data Preparation . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.10.2 Data Splitting . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.10.3 Model Building and Predictions for OS . . . . . . . . . . . . . 59
3.10.4 Model Building and Predictions for PFI . . . . . . . . . . . . 59
3.10.5 Synthetic Data . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.11 conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4 Implementation and evaluation 61
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.2 Experimental tools and Packages . . . . . . . . . . . . . . . . . . . . 62
4.2.1 PYTHON . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.3 Evaluation Metrics for Classification Models . . . . . . . . . . . . . . 64
4.3.1 Precision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.2 Recall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.3 Accuracy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.4 F1-Score . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.5 Matthews Correlation Coefficient (MCC) . . . . . . . . . . . 65
4.4 Datasets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.5 Implementation and Dataset Evaluation . . . . . . . . . . . . . . . . 66
4.5.1 Pre-processing:Gene Expression . . . . . . . . . . . . . . 66
4.5.2 Pre-processing :Protein Expression . . . . . . . . . . . . 67
4.5.3 Dimensionality Reduction: Gene Expression . . . . . . 68
4.5.4 Implement Generative Adversarial Networks (GANs) . . . . . 70
4.5.5 Implement Convolutional Neural Networks . . . . . . . . . . . 75
4.6 Implement Multi-Layer Perceptron . . . . . . . . . . . . . . . . . . . 79
4.7 Biological Classification of Genes and Proteins . . . . . . . . . . . . . 82
4.7.1 Tools and Techniques . . . . . . . . . . . . . . . . . . . . . . . 82
4.8 MLP Model for Distinguishing Upregulated and Downregulated Genes/Proteins 83
4.9 Evaluating Prediction Accuracy and Updating Gene and Protein Expression
Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.10 Data Visualisation and Interpretation . . . . . . . . . . . . . . . . . . 86
4.12 Comparison of CNN and MLP Performance on Augmented Gene Expression
Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.12.1 Gene Expression Data . . . . . . . . . . . . . . . . . . . . . 90
4.12.2 Protein Expression Data . . . . . . . . . . . . . . . . . . . . . 91
4.13 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
.1 First Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
.1.1 Pre-processing:Gene Expression . . . . . . . . . . . . . . 95
.1.2 Pre-processing :Protein Expression . . . . . . . . . . . . 100
.2 Second Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
.2.1 Implement Generative Adversarial Networks (GANs) . . . . . 105
.3 Third Appendix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
.3.1 Implementing Predictions and Labeling for Generated Data . 106Côte titre : MAI/0926
Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0926 MAI/0926 Mémoire Bibliothéque des sciences Anglais Disponible
DisponibleDeep learning for UML model classification, and the analysis of UML class and activity diagrams. / Meriem Mami
Titre : Deep learning for UML model classification, and the analysis of UML class and activity diagrams. Type de document : texte imprimé Auteurs : Meriem Mami, Auteur ; Imene Bensalah ; Abderrahim Lakehal, Directeur de thèse Editeur : Setif:UFA Année de publication : 2024 Importance : 1 vol (88 f .) Format : 29 cm Langues : Anglais (eng) Catégories : Thèses & Mémoires:Informatique Mots-clés : UML : Unified Modeling Language
CD : Class diagram
CNN : Convolutional
Neural Networks
DL : Deep learning
TL : Transfer Learning.Index. décimale : 004 - Informatique Résumé :
UML diagrams are crucial for visualizing and understanding the design and structure
of software systems. Accurately classifying and identifying UML components is essential to
maintain the quality and efficiency of software development processes.
This thesis discusses the application of CNNs in classifying UML diagrams. The thesis focuses
on utilizing DL techniques to accurately classify UML diagrams into different categories,
including UML and non-UML classes, while addressing multi-label and multi-classification challenges.
The dataset consists of 11 folders containing UML diagrams and non-UML images, presenting
a challenging classification task due to the complexity and variability of UML diagrams.
The study emphasizes the importance of data preprocessing, including image normalization and
augmentation, to enhance the model’s ability to generalize. Additionally, transfer learning techniques
are explored to leverage pre-trained models and improve classification performance, given
the limited size of the dataset. The performance of the CNN model is evaluated using standard
evaluation metrics, such as accuracy, precision, recall, and F1 score, to assess its effectiveness
in multi-label and multi-class classification of UML diagrams.
Furthermore, comparisons are made with existing techniques to highlight the advantages of
using CNNs for UML image classification with multi-label and multi-classification. The results
demonstrate the CNN model’s ability to achieve high classification accuracy, indicating its potential
for automating the classification of UML diagrams in real-world applications. This study
contributes to the field of AI in software engineering by demonstrating the effectiveness of deep
learning techniques for UML diagram classification with multi-labeling and multi-classification,
paving the way for future research in this area.Note de contenu :
Sommaire
1 Introduction into UML modelling, and machine learning 12
1.1 Introduction: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2 UML definition: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3 UML history: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4 UML concept and components : . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4.1 UML Diagrams : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4.1.1 Structural diagrams in UML : . . . . . . . . . . . . . . . . . . . 15
1.4.1.2 Behavioral diagrams in UML : . . . . . . . . . . . . . . . . . . . 15
1.4.2 Relationships in UML: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.4.3 Class diagram in UML: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.4 Activity diagram in UML: . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5 Deep learning and Machine learning : . . . . . . . . . . . . . . . . . . . . . . . . 18
1.5.1 Machine Learning : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.5.1.1 Approaches in Machine Learning : . . . . . . . . . . . . . . . . 19
1.5.1.2 Machine Learning Process : . . . . . . . . . . . . . . . . . . . . 20
1.6 Concepts : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.6.0.1 Cross Validation : . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.6.0.2 Splitting the dataset : . . . . . . . . . . . . . . . . . . . . . . . 24
1.6.0.3 Overfitting and Underfitting : . . . . . . . . . . . . . . . . . . . 25
1.7 Deep Learning : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.8 Deep Learning Workflow: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.9 Optimization in deep learning: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.10 Regularization for Deep Learning: . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.10.1 Dropout: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.10.2 Batch Normalization: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.11 Deep Learning Models: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.11.1 Multi-layer Perceptron (MLP): . . . . . . . . . . . . . . . . . . . . . . . 31
1.11.2 Autoencoders (AE): . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.11.3 Convolutional neural network (CNN): . . . . . . . . . . . . . . . . . . . . 32
1.11.3.1 General Model Of Convolutional neural network (CNN): . . . . 33
1.12 Machine Learning and Deep learning Applications : . . . . . . . . . . . . . . . . 37
1.13 Conclusions: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2 Machine learning and UML model Classification: literature review 41
2.1 Introduction : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.2 The use of machine learning and deep learning in UML model classification: . . 43
2.3 the benefits of using machine learning and deep learning in uml model classification: 43
2.4 Advancements in ML, DL, and CNN Models in UML Classification : . . . . . . 44
2.4.1 Challenges : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.5 Related work : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.6 Conclusion: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3 CNN for UML class classification: multi labelling and multiclassification 55
3.1 Introduction: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2 Data preprocessing: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2.1 UML diagrams: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.2.2 Class diagrams: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.2.3 Activity diagrams: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.3 Transfer learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.3.1 Pretrained Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.3.1.1 AlexNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.3.1.2 AlexNet architecture . . . . . . . . . . . . . . . . . . . . . . . . 59
3.3.2 Training: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.4 CNN model for UML class prediction: Multiclassification: . . . . . . . . . . . . . 62
3.4.1 Architecture: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.4.2 Training: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.5 CNN model for Class diagram component prediction: Multi-labelling . . . . . . 63
3.5.1 Architecture: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.5.2 Training: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.6 CNN model for Activity diagram component prediction: Multi-labelling . . . . 64
3.6.1 Architecture: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.6.2 Training: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.7 Model Evaluation Metrics: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.7.1 Accuracy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.7.2 Recall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.7.3 Precision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.7.4 F1-score . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.8 Conclusion: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4 Experiments and results 68
4.1 Introduction: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.2 Implementation frameworks and tools: . . . . . . . . . . . . . . . . . . . . . . . 69
4.2.1 Python . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.2.2 Tensorflow . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.2.3 Keras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.2.4 Kaggle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.2.5 pytorch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.2.6 Google Colab . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.3 Datasets Description: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.4 Classification : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.4.1 Transfer learning Results : . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.4.1.1 AlexNet: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.4.2 The CNN Results : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.4.2.1 CNN model for UML class prediction:Multiclassification . . . . 76
4.4.3 Detailed Analysis: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.4.3.1 Observations: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.4.3.2 Recommendations: . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.5 Models comparison : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.5.1 The CNN multilabeling Architecture Results : . . . . . . . . . . . . . . . 79
4.5.1.1 CNN model for Activity diagram component prediction: Multilabelling
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.5.1.2 CNN model for Class diagram component prediction: Multilabelling
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.6 Conclusion : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81Côte titre : MAI/0886 Deep learning for UML model classification, and the analysis of UML class and activity diagrams. [texte imprimé] / Meriem Mami, Auteur ; Imene Bensalah ; Abderrahim Lakehal, Directeur de thèse . - [S.l.] : Setif:UFA, 2024 . - 1 vol (88 f .) ; 29 cm.
Langues : Anglais (eng)
Catégories : Thèses & Mémoires:Informatique Mots-clés : UML : Unified Modeling Language
CD : Class diagram
CNN : Convolutional
Neural Networks
DL : Deep learning
TL : Transfer Learning.Index. décimale : 004 - Informatique Résumé :
UML diagrams are crucial for visualizing and understanding the design and structure
of software systems. Accurately classifying and identifying UML components is essential to
maintain the quality and efficiency of software development processes.
This thesis discusses the application of CNNs in classifying UML diagrams. The thesis focuses
on utilizing DL techniques to accurately classify UML diagrams into different categories,
including UML and non-UML classes, while addressing multi-label and multi-classification challenges.
The dataset consists of 11 folders containing UML diagrams and non-UML images, presenting
a challenging classification task due to the complexity and variability of UML diagrams.
The study emphasizes the importance of data preprocessing, including image normalization and
augmentation, to enhance the model’s ability to generalize. Additionally, transfer learning techniques
are explored to leverage pre-trained models and improve classification performance, given
the limited size of the dataset. The performance of the CNN model is evaluated using standard
evaluation metrics, such as accuracy, precision, recall, and F1 score, to assess its effectiveness
in multi-label and multi-class classification of UML diagrams.
Furthermore, comparisons are made with existing techniques to highlight the advantages of
using CNNs for UML image classification with multi-label and multi-classification. The results
demonstrate the CNN model’s ability to achieve high classification accuracy, indicating its potential
for automating the classification of UML diagrams in real-world applications. This study
contributes to the field of AI in software engineering by demonstrating the effectiveness of deep
learning techniques for UML diagram classification with multi-labeling and multi-classification,
paving the way for future research in this area.Note de contenu :
Sommaire
1 Introduction into UML modelling, and machine learning 12
1.1 Introduction: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2 UML definition: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3 UML history: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4 UML concept and components : . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4.1 UML Diagrams : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4.1.1 Structural diagrams in UML : . . . . . . . . . . . . . . . . . . . 15
1.4.1.2 Behavioral diagrams in UML : . . . . . . . . . . . . . . . . . . . 15
1.4.2 Relationships in UML: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.4.3 Class diagram in UML: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.4 Activity diagram in UML: . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5 Deep learning and Machine learning : . . . . . . . . . . . . . . . . . . . . . . . . 18
1.5.1 Machine Learning : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.5.1.1 Approaches in Machine Learning : . . . . . . . . . . . . . . . . 19
1.5.1.2 Machine Learning Process : . . . . . . . . . . . . . . . . . . . . 20
1.6 Concepts : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.6.0.1 Cross Validation : . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.6.0.2 Splitting the dataset : . . . . . . . . . . . . . . . . . . . . . . . 24
1.6.0.3 Overfitting and Underfitting : . . . . . . . . . . . . . . . . . . . 25
1.7 Deep Learning : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.8 Deep Learning Workflow: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.9 Optimization in deep learning: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.10 Regularization for Deep Learning: . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.10.1 Dropout: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.10.2 Batch Normalization: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.11 Deep Learning Models: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.11.1 Multi-layer Perceptron (MLP): . . . . . . . . . . . . . . . . . . . . . . . 31
1.11.2 Autoencoders (AE): . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.11.3 Convolutional neural network (CNN): . . . . . . . . . . . . . . . . . . . . 32
1.11.3.1 General Model Of Convolutional neural network (CNN): . . . . 33
1.12 Machine Learning and Deep learning Applications : . . . . . . . . . . . . . . . . 37
1.13 Conclusions: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2 Machine learning and UML model Classification: literature review 41
2.1 Introduction : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.2 The use of machine learning and deep learning in UML model classification: . . 43
2.3 the benefits of using machine learning and deep learning in uml model classification: 43
2.4 Advancements in ML, DL, and CNN Models in UML Classification : . . . . . . 44
2.4.1 Challenges : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.5 Related work : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.6 Conclusion: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3 CNN for UML class classification: multi labelling and multiclassification 55
3.1 Introduction: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2 Data preprocessing: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2.1 UML diagrams: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.2.2 Class diagrams: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.2.3 Activity diagrams: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.3 Transfer learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.3.1 Pretrained Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.3.1.1 AlexNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.3.1.2 AlexNet architecture . . . . . . . . . . . . . . . . . . . . . . . . 59
3.3.2 Training: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.4 CNN model for UML class prediction: Multiclassification: . . . . . . . . . . . . . 62
3.4.1 Architecture: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.4.2 Training: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.5 CNN model for Class diagram component prediction: Multi-labelling . . . . . . 63
3.5.1 Architecture: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.5.2 Training: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.6 CNN model for Activity diagram component prediction: Multi-labelling . . . . 64
3.6.1 Architecture: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.6.2 Training: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.7 Model Evaluation Metrics: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.7.1 Accuracy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.7.2 Recall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.7.3 Precision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.7.4 F1-score . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.8 Conclusion: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4 Experiments and results 68
4.1 Introduction: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.2 Implementation frameworks and tools: . . . . . . . . . . . . . . . . . . . . . . . 69
4.2.1 Python . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.2.2 Tensorflow . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.2.3 Keras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.2.4 Kaggle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.2.5 pytorch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.2.6 Google Colab . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.3 Datasets Description: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.4 Classification : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.4.1 Transfer learning Results : . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.4.1.1 AlexNet: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.4.2 The CNN Results : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.4.2.1 CNN model for UML class prediction:Multiclassification . . . . 76
4.4.3 Detailed Analysis: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.4.3.1 Observations: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.4.3.2 Recommendations: . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.5 Models comparison : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.5.1 The CNN multilabeling Architecture Results : . . . . . . . . . . . . . . . 79
4.5.1.1 CNN model for Activity diagram component prediction: Multilabelling
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.5.1.2 CNN model for Class diagram component prediction: Multilabelling
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.6 Conclusion : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81Côte titre : MAI/0886 Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0886 MAI/0886 Mémoire Bibliothéque des sciences Anglais Disponible
Disponible
Titre : Deep learning model for predicting cancer stage based on genomic data Type de document : texte imprimé Auteurs : Rayane Mesnata ; Roumaissa Laouarem ; Abderrahim Lakehal, Directeur de thèse Editeur : Setif:UFA Année de publication : 2023 Importance : 1 vol (134 f.) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Bio-Informatics Cancer Machine learning Deep learning mRNA data Cbioportal, Index. décimale : 004 Informatique Résumé : This abstract discusses the integration of artificial intelligence (AI) and deep learning (DL) in cancer
diagnosis and treatment. It emphasizes the use of genomic sequencing technologies and machine
learning techniques to predict cancer stage and identify molecular signatures associated with different
stages. The Cancer Genome Atlas (TCGA) project has played a crucial role in collecting comprehensive
genomic data for various cancer types. the study highlights the importance of data preprocessing,
including quality control, normalization, and integration, to ensure the accuracy and reliability of the
predictive model. The performance of the deep learning model is evaluated using appropriate evaluation
metrics, such as accuracy, precision, recall, and F1 score; As Gene filtering techniques are used
to reduce noise and dimensionality, identifying relevant genes for cancer progression and stage.
This study develops a deep learning model for predicting cancer stage based on genomic data;
As the model incorporates a Convolutional Neural Network (CNN) architecture and is trained on a
comprehensive dataset, to evaluate the performance of the deep learning model, two approaches are
compared: utilizing the cbioportal platform and applying feature selection techniques. The cbioportal
platform allows for the exploration and analysis of cancer genomics data, providing valuable insights
into potential biomarkers and cancer biology. On the other hand, feature selection techniques aim to
identify the most informative genes or features for cancer stage prediction.
In conclusion, the experimental results demonstrate that the deep learning model, utilizing the
cbioportal platform, outperforms feature selection techniques in accurately predicting cancer stage;
As The model’s ability to automatically learn complex patterns and interactions from genomic data
contributes to its superior performance. These findings underscore the potential of deep learning in
advancing cancer diagnosis and treatment planning.Côte titre : MAI/0763 En ligne : https://drive.google.com/file/d/1zJ5Z2D54pTWUGV0dC7gU78uObVf0nEvc/view?usp=drive [...] Format de la ressource électronique : Deep learning model for predicting cancer stage based on genomic data [texte imprimé] / Rayane Mesnata ; Roumaissa Laouarem ; Abderrahim Lakehal, Directeur de thèse . - [S.l.] : Setif:UFA, 2023 . - 1 vol (134 f.) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Bio-Informatics Cancer Machine learning Deep learning mRNA data Cbioportal, Index. décimale : 004 Informatique Résumé : This abstract discusses the integration of artificial intelligence (AI) and deep learning (DL) in cancer
diagnosis and treatment. It emphasizes the use of genomic sequencing technologies and machine
learning techniques to predict cancer stage and identify molecular signatures associated with different
stages. The Cancer Genome Atlas (TCGA) project has played a crucial role in collecting comprehensive
genomic data for various cancer types. the study highlights the importance of data preprocessing,
including quality control, normalization, and integration, to ensure the accuracy and reliability of the
predictive model. The performance of the deep learning model is evaluated using appropriate evaluation
metrics, such as accuracy, precision, recall, and F1 score; As Gene filtering techniques are used
to reduce noise and dimensionality, identifying relevant genes for cancer progression and stage.
This study develops a deep learning model for predicting cancer stage based on genomic data;
As the model incorporates a Convolutional Neural Network (CNN) architecture and is trained on a
comprehensive dataset, to evaluate the performance of the deep learning model, two approaches are
compared: utilizing the cbioportal platform and applying feature selection techniques. The cbioportal
platform allows for the exploration and analysis of cancer genomics data, providing valuable insights
into potential biomarkers and cancer biology. On the other hand, feature selection techniques aim to
identify the most informative genes or features for cancer stage prediction.
In conclusion, the experimental results demonstrate that the deep learning model, utilizing the
cbioportal platform, outperforms feature selection techniques in accurately predicting cancer stage;
As The model’s ability to automatically learn complex patterns and interactions from genomic data
contributes to its superior performance. These findings underscore the potential of deep learning in
advancing cancer diagnosis and treatment planning.Côte titre : MAI/0763 En ligne : https://drive.google.com/file/d/1zJ5Z2D54pTWUGV0dC7gU78uObVf0nEvc/view?usp=drive [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0763 MAI/0763 Mémoire Bibliothéque des sciences Anglais Disponible
Disponible