Catalogue en ligne

University Sétif 1 FERHAT ABBAS Faculty of Sciences

Nouvelle recherche

Détail de l'auteur

Auteur Abdelouahab Moussaoui

Documents disponibles écrits par cet auteur

Ajouter le résultat dans votre panier Affiner la recherche

Advancing Medical Image Analysis: Integrating U-Net, SegFormer, and SAM Models for Enhanced Semantic Segmentation / Taranim Attallah

Public

ISBD

Titre : Advancing Medical Image Analysis: Integrating U-Net, SegFormer, and SAM Models for Enhanced Semantic Segmentation
Type de document : document électronique
Auteurs : Taranim Attallah, Auteur ; Mohamed Fadhel Mansouri, Auteur ; Abdelouahab Moussaoui, Directeur de thèse
Editeur : Sétif:UFA1
Année de publication : 2024
Importance : 1 vol (60 f .)
Format : 29 cm
Langues : Anglais (eng)
Catégories : Thèses & Mémoires:Informatique

Mots-clés : Colorectal Cancer
Artificial Intelligence in Healthcare
Deep Learning
Medical Image Segmentation
Index. décimale : 004 Informatique
Résumé :
This study presents an innovative approach for colorectal cancer detection based on
the CoNIC Challenge dataset. We have developed an ensemble model that uses the
architectures U-Net, Segformer, and SAM for segmentation and classification. Data
preprocessing and augmentation techniques are employed to enhance the model’s generalization
and robustness. Comparative analysis with traditional deep learning models
demonstrates the performance of the proposed model in terms of precision, recall, and
F1-score, achieving a precision of 98.15% and an accuracy of 96.69%. Furthermore, the
model exhibits efficient execution performance, making it suitable for real-world clinical
applications. This research contributes to the advancement of medical diagnostics
by providing a promising solution for colorectal cancer detection.
Note de contenu : Sommaire
Abstract i
Resumé ii
Table of contents ix
List of figures x
List of tables xi
Abbreviations xii
Introduction 1
1 Theoretical Background 3
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Machine Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.1 Machine Learning definition . . . . . . . . . . . . . . . . . . . . 4
1.2.2 Supervised learning . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.3 Unsupervised learning . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.4 Reinforcement learning . . . . . . . . . . . . . . . . . . . . . . 7
1.3 Deep learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3.2 Deep learning architectures . . . . . . . . . . . . . . . . . . . . 9
1.3.3 U-Net: Convolutional Networks for Biomedical Image Segmentation
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.4 SegFormer: Transformer-based Segmentation Model . . . . . . . 13
1.3.5 SAM (Self-Attention Mechanism) in Image Analysis . . . . . . 14
1.4 Algorithm and Model Evaluation Strategies . . . . . . . . . . . . . . . 16
1.4.1 Introduction to Evaluation Strategies . . . . . . . . . . . . . . . 16
1.4.2 Train-Test Split . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.3 Cross-validation . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.4 Holdout Validation . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.4.5 Evaluation Metrics . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5 Evaluating Deep Learning VS Traditional Machine Learning Approaches
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5.1 Data Complexity and Representation . . . . . . . . . . . . . . . 17
1.5.2 Model Complexity and Structure . . . . . . . . . . . . . . . . . 18
1.5.3 Evaluation Metrics . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.5.4 Interpretability . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.5.5 Training time and computing capabilities . . . . . . . . . . . . 19
1.6 Preprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.6.1 Data cleaning . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.6.2 Data integration . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.6.3 Data transformation . . . . . . . . . . . . . . . . . . . . . . . . 20
1.6.4 Data reduction . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.6.5 Data Discretization . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2 Artificial Intelligence in Colorectal Cancer 22
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2 Colorectal Cancer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.1 Anatomy and Physiology of the Colon and Rectum . . . . . . . 22
2.2.2 Epidemiology of Colorectal Cancer . . . . . . . . . . . . . . . . 24
2.2.3 Current Diagnostic Challenges . . . . . . . . . . . . . . . . . . 25
2.3 AI in Colorectal Cancer . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3.1 Machine learning in Colorectal Cancer . . . . . . . . . . . . . . 26
2.3.2 Deep learning in Colorectal Cancer . . . . . . . . . . . . . . . . 26
2.3.3 Challenges and limitations . . . . . . . . . . . . . . . . . . . . . 27
2.4 Histopathology Image Generation . . . . . . . . . . . . . . . . . . . . . 28
2.4.1 Histopathological Semantic Segmentation . . . . . . . . . . . . 29
2.5 Related works . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3 Experiments and Results 34
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.2 Methodology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.2.1 Dataset and Preprocessing Contributions . . . . . . . . . . . . . 34
3.2.2 Tools and Frameworks . . . . . . . . . . . . . . . . . . . . . . . 36
3.3 Experimental Results and Model Evaluation . . . . . . . . . . . . . . . 40
3.3.1 The proposed Approach and Model Architecture . . . . . . . . 40
3.3.2 Training Dynamics . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.3.3 Results and Anaylsis . . . . . . . . . . . . . . . . . . . . . . . 42
3.4 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.5 Challenges . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.5.1 Dataset Complexity . . . . . . . . . . . . . . . . . . . . . . . . 45
3.5.2 Computational Constraints . . . . . . . . . . . . . . . . . . . . 46
3.5.3 Model Integration . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.6 Future Works and prespectives . . . . . . . . . . . . . . . . . . . . . . 46
3.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Côte titre : MAI/0953

Advancing Medical Image Analysis: Integrating U-Net, SegFormer, and SAM Models for Enhanced Semantic Segmentation [document électronique] / Taranim Attallah, Auteur ; Mohamed Fadhel Mansouri, Auteur ; Abdelouahab Moussaoui, Directeur de thèse . - [S.l.] : Sétif:UFA1, 2024 . - 1 vol (60 f .) ; 29 cm.
Langues : Anglais (eng)
Catégories : Thèses & Mémoires:Informatique

Mots-clés : Colorectal Cancer
Artificial Intelligence in Healthcare
Deep Learning
Medical Image Segmentation
Index. décimale : 004 Informatique
Résumé :
This study presents an innovative approach for colorectal cancer detection based on
the CoNIC Challenge dataset. We have developed an ensemble model that uses the
architectures U-Net, Segformer, and SAM for segmentation and classification. Data
preprocessing and augmentation techniques are employed to enhance the model’s generalization
and robustness. Comparative analysis with traditional deep learning models
demonstrates the performance of the proposed model in terms of precision, recall, and
F1-score, achieving a precision of 98.15% and an accuracy of 96.69%. Furthermore, the
model exhibits efficient execution performance, making it suitable for real-world clinical
applications. This research contributes to the advancement of medical diagnostics
by providing a promising solution for colorectal cancer detection.
Note de contenu : Sommaire
Abstract i
Resumé ii
Table of contents ix
List of figures x
List of tables xi
Abbreviations xii
Introduction 1
1 Theoretical Background 3
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Machine Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.1 Machine Learning definition . . . . . . . . . . . . . . . . . . . . 4
1.2.2 Supervised learning . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.3 Unsupervised learning . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.4 Reinforcement learning . . . . . . . . . . . . . . . . . . . . . . 7
1.3 Deep learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3.2 Deep learning architectures . . . . . . . . . . . . . . . . . . . . 9
1.3.3 U-Net: Convolutional Networks for Biomedical Image Segmentation
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.4 SegFormer: Transformer-based Segmentation Model . . . . . . . 13
1.3.5 SAM (Self-Attention Mechanism) in Image Analysis . . . . . . 14
1.4 Algorithm and Model Evaluation Strategies . . . . . . . . . . . . . . . 16
1.4.1 Introduction to Evaluation Strategies . . . . . . . . . . . . . . . 16
1.4.2 Train-Test Split . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.3 Cross-validation . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.4 Holdout Validation . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.4.5 Evaluation Metrics . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5 Evaluating Deep Learning VS Traditional Machine Learning Approaches
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5.1 Data Complexity and Representation . . . . . . . . . . . . . . . 17
1.5.2 Model Complexity and Structure . . . . . . . . . . . . . . . . . 18
1.5.3 Evaluation Metrics . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.5.4 Interpretability . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.5.5 Training time and computing capabilities . . . . . . . . . . . . 19
1.6 Preprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.6.1 Data cleaning . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.6.2 Data integration . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.6.3 Data transformation . . . . . . . . . . . . . . . . . . . . . . . . 20
1.6.4 Data reduction . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.6.5 Data Discretization . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2 Artificial Intelligence in Colorectal Cancer 22
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2 Colorectal Cancer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.1 Anatomy and Physiology of the Colon and Rectum . . . . . . . 22
2.2.2 Epidemiology of Colorectal Cancer . . . . . . . . . . . . . . . . 24
2.2.3 Current Diagnostic Challenges . . . . . . . . . . . . . . . . . . 25
2.3 AI in Colorectal Cancer . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3.1 Machine learning in Colorectal Cancer . . . . . . . . . . . . . . 26
2.3.2 Deep learning in Colorectal Cancer . . . . . . . . . . . . . . . . 26
2.3.3 Challenges and limitations . . . . . . . . . . . . . . . . . . . . . 27
2.4 Histopathology Image Generation . . . . . . . . . . . . . . . . . . . . . 28
2.4.1 Histopathological Semantic Segmentation . . . . . . . . . . . . 29
2.5 Related works . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3 Experiments and Results 34
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.2 Methodology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.2.1 Dataset and Preprocessing Contributions . . . . . . . . . . . . . 34
3.2.2 Tools and Frameworks . . . . . . . . . . . . . . . . . . . . . . . 36
3.3 Experimental Results and Model Evaluation . . . . . . . . . . . . . . . 40
3.3.1 The proposed Approach and Model Architecture . . . . . . . . 40
3.3.2 Training Dynamics . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.3.3 Results and Anaylsis . . . . . . . . . . . . . . . . . . . . . . . 42
3.4 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.5 Challenges . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.5.1 Dataset Complexity . . . . . . . . . . . . . . . . . . . . . . . . 45
3.5.2 Computational Constraints . . . . . . . . . . . . . . . . . . . . 46
3.5.3 Model Integration . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.6 Future Works and prespectives . . . . . . . . . . . . . . . . . . . . . . 46
3.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Côte titre : MAI/0953

Exemplaires (1)

Code-barres Cote Support Localisation Section Disponibilité
MAI/0953 MAI/0953 Mémoire Bibliothèque des sciences Anglais Disponible
Disponible

Analyse de sentiment dans les réseaux sociaux, nouvelle stratégie a base d'ensemble de classifieurs / Keddad, walid

Public

ISBD

Titre : Analyse de sentiment dans les réseaux sociaux, nouvelle stratégie a base d'ensemble de classifieurs
Type de document : texte imprimé
Auteurs : Keddad, walid ; Abdelouahab Moussaoui, Directeur de thèse
Editeur : Setif:UFA
Année de publication : 2017
Importance : 1 vol (64f.)
Format : 29 cm
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique

Mots-clés : Ingénierie de Données
Technologies Web
réseaux sociaux
Analyse de sentiment
Index. décimale : 004 Informatique
Résumé : Abstract
Twitter sentiment analysis, the process of automatically extracting sentiment conveyed
by Twitter data, is a field that has seen a dramatic increase in research in recent years. The
goal of this master thesis is to develop a new machine learning model based on ensemble
learning to classify Twitter messages with respect to their sentiment. Sentiment can be
divided into three classes: positive, negative and neutral.
To compare our new model, several machine learning methods were used during experimentation sessions: Artificial Neural Network, Multinomial Naive Bayes, Support Vector
Machines, Random Forest, Logistic Regression and others. Besides, we tried to compare
different techniques for preprocessing natural language in order to find those that have an
impact on building accurate classifiers. To this purpose we applied Bag-of-Words model
(vector of unigrams), Bag-of-N-grams model (vector of bigrams and vector of trigrams) to
represent text data in suitable numeric format. Bag-of-unigrams and Bag-of-bigrams models
showed the best results for all methods and influenced in a positive way the overall accuracy.
The best performance was achieved by our new model, for both two class (positive and
negative) and three class (positive, negative and neutral) classification. Our new model
achieved an accuracy of 90.06% on two class classification and 78.21% on three class classification.
Note de contenu :
Contents
1 Introduction 1
1.1 Research Objectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Thesis Organization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2 Background 3
2.1 Social Media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.1.1 Twitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2 Machine Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.3 Machine Learning process . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.4 Machine Learning types . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.5 Learning Algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.5.1 Artificial Neural Networks . . . . . . . . . . . . . . . . . . . . . . . . 7
2.5.2 Naive Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.5.3 Decision Trees . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.5.4 Support Vector Machines . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.5.5 Ensemble methods . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3 Literature Review 21
3.1 Sentiment Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.2 Sentiment Components . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.3 Levels of Study . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.4 Sentiment Analysis Difficulties . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.5 Different Methods . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.5.1 Lexicon based method . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.5.2 Machine learning method . . . . . . . . . . . . . . . . . . . . . . . . 25
3.6 Related Work . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4 Datasets and implementation frameworks 29
4.1 Data Collection and Preprocessing . . . . . . . . . . . . . . . . . . . . . . . 29
4.1.1 Description of Datasets . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.1.2 Preprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.1.3 Features Extraction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.1.4 Final Data representation . . . . . . . . . . . . . . . . . . . . . . . . 41
4.2 Development environment . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.2.1 Python . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.2.2 Jupyter Notebook . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.2.3 Scikit-learn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.2.4 Pandas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
5 Experiments and results 46
5.1 Implementation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
5.2 Proposed ensemble classifier . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5.3 Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5.3.1 Two Classes: Positive and Negative . . . . . . . . . . . . . . . . . . . 47
5.3.2 Three Classes: Positive, Negative and Neutral . . . . . . . . . . . . . 51
6 Discussion 55
6.1 Two Classes: Positive and Negative . . . . . . . . . . . . . . . . . . . . . . . 55
6.2 Three Classes: Positive, Negative and Neutral . . . . . . . . . . . . . . . . . 56
7 Conclusion 58
Côte titre : MAI/0205
En ligne : https://drive.google.com/file/d/1xz1H6CxpjAAAQRHw1Bdejyxbgg4aoJVH/view?usp=shari [...]
Format de la ressource électronique : pdf

Analyse de sentiment dans les réseaux sociaux, nouvelle stratégie a base d'ensemble de classifieurs [texte imprimé] / Keddad, walid ; Abdelouahab Moussaoui, Directeur de thèse . - [S.l.] : Setif:UFA, 2017 . - 1 vol (64f.) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique

Mots-clés : Ingénierie de Données
Technologies Web
réseaux sociaux
Analyse de sentiment
Index. décimale : 004 Informatique
Résumé : Abstract
Twitter sentiment analysis, the process of automatically extracting sentiment conveyed
by Twitter data, is a field that has seen a dramatic increase in research in recent years. The
goal of this master thesis is to develop a new machine learning model based on ensemble
learning to classify Twitter messages with respect to their sentiment. Sentiment can be
divided into three classes: positive, negative and neutral.
To compare our new model, several machine learning methods were used during experimentation sessions: Artificial Neural Network, Multinomial Naive Bayes, Support Vector
Machines, Random Forest, Logistic Regression and others. Besides, we tried to compare
different techniques for preprocessing natural language in order to find those that have an
impact on building accurate classifiers. To this purpose we applied Bag-of-Words model
(vector of unigrams), Bag-of-N-grams model (vector of bigrams and vector of trigrams) to
represent text data in suitable numeric format. Bag-of-unigrams and Bag-of-bigrams models
showed the best results for all methods and influenced in a positive way the overall accuracy.
The best performance was achieved by our new model, for both two class (positive and
negative) and three class (positive, negative and neutral) classification. Our new model
achieved an accuracy of 90.06% on two class classification and 78.21% on three class classification.
Note de contenu :
Contents
1 Introduction 1
1.1 Research Objectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Thesis Organization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2 Background 3
2.1 Social Media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.1.1 Twitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2 Machine Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.3 Machine Learning process . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.4 Machine Learning types . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.5 Learning Algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.5.1 Artificial Neural Networks . . . . . . . . . . . . . . . . . . . . . . . . 7
2.5.2 Naive Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.5.3 Decision Trees . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.5.4 Support Vector Machines . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.5.5 Ensemble methods . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3 Literature Review 21
3.1 Sentiment Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.2 Sentiment Components . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.3 Levels of Study . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.4 Sentiment Analysis Difficulties . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.5 Different Methods . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.5.1 Lexicon based method . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.5.2 Machine learning method . . . . . . . . . . . . . . . . . . . . . . . . 25
3.6 Related Work . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4 Datasets and implementation frameworks 29
4.1 Data Collection and Preprocessing . . . . . . . . . . . . . . . . . . . . . . . 29
4.1.1 Description of Datasets . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.1.2 Preprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.1.3 Features Extraction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.1.4 Final Data representation . . . . . . . . . . . . . . . . . . . . . . . . 41
4.2 Development environment . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.2.1 Python . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.2.2 Jupyter Notebook . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.2.3 Scikit-learn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.2.4 Pandas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
5 Experiments and results 46
5.1 Implementation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
5.2 Proposed ensemble classifier . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5.3 Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5.3.1 Two Classes: Positive and Negative . . . . . . . . . . . . . . . . . . . 47
5.3.2 Three Classes: Positive, Negative and Neutral . . . . . . . . . . . . . 51
6 Discussion 55
6.1 Two Classes: Positive and Negative . . . . . . . . . . . . . . . . . . . . . . . 55
6.2 Three Classes: Positive, Negative and Neutral . . . . . . . . . . . . . . . . . 56
7 Conclusion 58
Côte titre : MAI/0205
En ligne : https://drive.google.com/file/d/1xz1H6CxpjAAAQRHw1Bdejyxbgg4aoJVH/view?usp=shari [...]
Format de la ressource électronique : pdf

Exemplaires (1)

Code-barres Cote Support Localisation Section Disponibilité
MAI/0205 MAI/0205 Mémoire Bibliothèque des sciences Français Disponible
Disponible

Apprentissage et extraction des connaissances dans les bases de données spatiotemporelles / Mekroud,Noureddine

Public

ISBD

Titre : Apprentissage et extraction des connaissances dans les bases de données spatiotemporelles
Type de document : document électronique
Auteurs : Mekroud,Noureddine, Auteur ; Abdelouahab Moussaoui, Directeur de thèse
Editeur : Sétif:UFA1
Année de publication : 2026
Importance : 1 vol (108 f.)
Format : 29 cm
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique

Mots-clés : Règles d’association
Données spatiotemporelles
Images ISH
Expression génétique
Logique floue et possibiliste
Index. décimale : 004 - Informatique
Résumé : L’imperfection est une caractéristique commune dans presque toutes les données du monde réel, même si elles cachent généralement des connaissances cruciales et d’un intérêt majeur. L’utilisation de théories de l’incertitude pour modéliser les zones d’expression génique (Exp_Gen) dans les embryons permettra d’extraire les relations cachées entre les gènes, tout en tenant compte de l’imprécision possible des limites de ces zones et de la force nuancée de ces expressions. Dans cette thèse, nous proposons une modélisation floue et possibiliste des données spatio-temporelles issues de séquences d’images ISH (In Situ Hybridization) représentant les zones d’Exp_Gen à différentes phases de développement embryonnaire de l’espèce modèle souris d’Edinburgh. Après une série d’étapes de prétraitement sur ces images pour améliorer l’extraction des caractéristiques, nous proposons une adaptation de l’algorithme Apriori à la logique floue et possibiliste pour l’extraction de deux types de règles d’association (RA), qui représenteront en Primal les relations spatiales entre les zones d’Exp_Gen dans l’embryon, et en Dual les relations temporelles ainsi que les relations entre les gènes qui co-expriment dans ces séquences d’images ISH. Enfin, une analyse des AR spatiotemporelles floues et possibilistes extraites sera fournie afin de déterminer la modélisation la plus adéquate. De plus, l’interprétation biologique des résultats obtenus confirme leur adéquation aux principes de la biologie génétique. Les connaissances extraites aideront les biologistes à mieux comprendre les interactions entre gènes, à identifier les ensembles de gènes qui co-expriment et ayant le même rôle fonctionnel, et enfin à modéliser l’expression génétique normale pour détecter les expressions génétiques anormales susceptibles de provoquer des maladies génétiques.
Note de contenu :
Sommaire
Introduction générale ..................................................... 12
Chapitre I : La Bio-informatique ET Les images d’expression genetique ............... 15
Ⅰ.1 Introduction .............................................. 15
Partie 1 : La Bio-Informatique ........................................................ 16
Ⅰ.2 Notions biologiques de base ............................................................ 16
Ⅰ.2.1 Les diverses définitions de la Bio-informatique ................................................. 16
Ⅰ.2.2 Historique de la Bio-informatique ...................................................................... 18
Ⅰ.2.3 Théories fondamentales de la biologie moléculaire ............................................ 20
Ⅰ.2.4 Les objectifs et domaines d’application de la bio-informatique ......................... 22
Ⅰ.3 Les banques de données biologiques ................................................................................. 23
Ⅰ.3.1 Les banques de données généralistes .................................................................. 24
Ⅰ.3.2 Banques de données spécialistes ......................................................................... 24
Ⅰ.3.3 Les séquences d’images d’expression génétique ................................................ 24
Partie 2 : Les images d’expression génétique ....................................................................... 25
Ⅰ.4 L’imagerie in vivo d’expression génétique ........................................................................ 25
Ⅰ.4.1 La banque Drosofila FlyBase .............................................................................. 25
Ⅰ.4.2 La banque Zebra Fish ......................................................................................... 26
Ⅰ.4.3 La banque Edinburgh Mouse .............................................................................. 26
Ⅰ.5 Pourquoi choisir l’Atlas EMAGE ....................................................................................... 27
Ⅰ.6 Etat de l’art : travaux de recherche sur les données d’Exp_Gen ....................................... 28
Ⅰ.6.1 Micro Array data .................................................................................................. 28
Ⅰ.6.1.1 Features selection ................................................................................ 28
Ⅰ.6.1.2 Clustering & mesures de similarité-distance ..................................... 29
Ⅰ.6.2 mRNAseq ............................................................................................................ 29
Ⅰ.6.3 Les images ISH ................................................................................................... 30
Ⅰ.7 Conclusion ......................................................................................................................... 31
Chapitre II : Extraction des Connaissances à partir des Données & Règles d’Association 32
Ⅱ.1 Introduction ....................................................................................................................... 32
Partie 1 : Principes de base de l’ECD ................................................................................... 33
Ⅱ.2 Notions de base de l’ECD ................................................................................................. 33
Ⅱ.2.1 Définition de l’ECD ........................................................................................... 33
Ⅱ.2.2 Des données aux connaissance .......................................................................... 34
Ⅱ.2.3 Le processus d’ECD .......................................................................................... 35
Ⅱ.3 Le Machine Learning ........................................................................................................ 36
Ⅱ.3.1 Qu’est-ce que le Machine Learning .................................................................. 36
Ⅱ.3.2 Principales tâches du Machine Learning ............................................................ 36
Ⅱ.3.3 Le Machine Learning comme levier de l’IA ...................................................... 38
Ⅱ.3.4 Algorithmes de Machine Learning .................................................................... 39
Partie 2 : Autour et alentour des Règles d’Association ........................................................ 40
Ⅱ.4 Les méthodes de recherche d’associations ........................................................................ 40
Ⅱ.4.1 Présentation générale ......................................................................................... 40
Ⅱ.4.2 Développement historique de la recherche d’associations ................................. 40
II.5 Concepts fondamentaux des règles d’association.............................................................. 41
II.5.1 Notions de base ................................................................................................... 41
II.5.1.1 Item .................................................................................................... 41
II.5.1.2 Itemset ............................................................................................... 41
II.5.1.3 K-Itemset ........................................................................................... 41
II.5.1.4 Support d’un itemset .......................................................................... 41
II.5.1.5 Règle d’association ............................................................................ 41
II.5.1.6 Confiance d’une règle d’association .................................................. 41
II.5.1.7 Itemset fréquent ................................................................................. 41
II.5.2 Les étapes de l’extraction de règles d’association .............................................. 42
II.5.3 Espace de recherche ou le treillis des itemsets ................................................... 43
II.5.4 Mesures d’évaluation et de validation ................................................................ 44
II.6 Divers algorithmes d’induction des règles d’association .................................................. 46
II.6.1 Algorithme C5.0 ................................................................................................. 46
II.6.2 Le GRI (Generalised Rule Induction) ................................................................. 46
II.6.3 Algorithmes fondés sur le support et la confiance .............................................. 46
II.7 Algorithme Apriori pour l’extraction des règles d’association ......................................... 48
II.7.1 Recherche des itemsets fréquents ....................................................................... 48
II.7.2 Génération des règles d’association .................................................................... 50
II.7.3 Exemple illustratif sur le fonctionnement de l’algorithme Apriori .................... 51
II.8 Les avantages et inconvénients de l’algorithme Apriori ................................................... 53
II.9 Domaines d’Applications des règles d’association ........................................................... 54
II.10 Les axes d’extension des algorithmes d’extraction des règles d’associations ................. 55
II.10.1 Extensions basées sur la nature des règles extraites ......................................... 55
II.10.1.1 Les règles d’associations quantitatives ............................................ 55
II.10.1.2 Les règles d’association généralisées .............................................. 56
II.10.1.3 Les motifs sequentiels ..................................................................... 56
II.10.2 Extensions basées sur la logique de modelisation ............................................ 56
II.10.2.1 Les règles d’association floues ........................................................ 57
II.10.2.2 Les règles d’association possibilistes .............................................. 57
II.10.2.3 Les règles d’association évidentielles .............................................. 57
II.11 Conclusion ....................................................................................................................... 58
Chapitre III : Adaptation des règles d’association aux théories de l’incertain .................... 59
III.1 Introduction ...................................................................................................................... 59
Partie 1 : Théories de l’incertain ............................................................................................ 60
III.2 De la logique binaire aux logiques de l’incertain ............................................................. 60
III.2.1 Le développement de la logique humaine ......................................................... 60
III.2.2 La logique binaire .............................................................................................. 60
IⅡ.2.2.1 Algèbre de Boole .............................................................................. 60
ⅡI.2.2.2 Pourquoi le monde réel n’est pas en logique binaire ....................... 61
ⅡI.2.3 Les types d’imperfection dans les données réelles ........................................... 61
ⅡI.2.3.1 Les données incertaines ................................................................... 62
ⅡI.2.3.2 Les données imprécises ................................................................... 62
ⅡI.2.3.3 Les données incomplètes ................................................................. 62
ⅡI.2.3.4 Les données inconsistantes .............................................................. 62
ⅡI.3 Les logiques de modélisation dans l’incertain ................................................................ 63
IⅡ.3.1 La logique probabiliste et le théorème de Bayes .............................................. 63
ⅡI.3.2 La logique floue ................................................................................................ 64
ⅡI.3.2.1 Généralités ....................................................................................... 64
ⅡI.3.2.2 Caractérisation des Sous-Ensembles Flous ..................................... 65
ⅡI.3.2.3 Fonctions d’appartenance ................................................................ 65
ⅡI.3.3 La logique possibiliste ...................................................................................... 66
IⅡ.3.3.1 Les distributions de possibilité ........................................................ 66
IⅡ.3.3.2 Les mesures de possibilité et de nécessité ....................................... 66
ⅡI.3.4 La logique évidentielle (théorie de croyance) .................................................. 68
ⅡI.3.4.1 Notions de base ............................................................................... 68
ⅡI.3.4.2 Mesures de croyance et de plausibilité ............................................ 69
ⅡI.4 Comparatif entre les déférentes logiques de modélisation .............................................. 70
Partie 2 : Adaptation de l’algorithme Apriori aux logiques de l’incertain ........................... 71
III.5 Les règles d’association floues ......................................................................................... 71
III.5.1 Présentation générale ......................................................................................... 71
III.5.2 Concepts et définitions de base ......................................................................... 71
III.5.2.1 Item flou ........................................................................................... 71
III.5.2.2 Itemset flou ....................................................................................... 71
III.5.2.3 Redéfinition de l’union et de la cardinalité des ensembles ............. 72
III.5.2.4 Le degré d’appartenance d’un itemset flou ...................................... 72
III.5.2.5 Le support d’un itemset flou ............................................................ 73
III.5.2.6 Les règle d’association floues .......................................................... 74
III.5.2.7 La confiance d’une règle d’association floue ................................... 74
III.5.3 Extraction de règles d’association floues .......................................................... 74
III.5.4 Exemple d’extraction de règles d’association floues ........................................ 75
ⅡI.6 Etat de l’art : travaux sur les Exp_Gen basés sur les RA ................................................. 77
IⅡ.6.1 Sélection des RA pertinentes basée sur des mesures d’intérêt subjectifs ......... 77
IⅡ.6.2 Sélection des RA pertinentes basée sur des mesures d’intérêt objectifs .......... 77
ⅡI.7 Conclusion ....................................................................................................................... 78
Chapitre IV : Approche proposée & interprétation biologique des résultats ...................... 79
IV.1 Introduction ..................................................................................................................... 79
Partie 1 : Approche proposée ................................................................................................. 80
IV.2 Justification de l’approche proposée ............................................................................... 80
IV.2.1 Présentation générale ........................................................................................ 80
IV.2.2 Critique des travaux antecedants ...................................................................... 80
IV.2.3 Proposition ....................................................................................................... 81
IV.3 Adaptation proposée de l’Apriori aux théories de l’incertain ......................................... 82
IV.3.1 Concepts de la théorie des SEF adaptés à notre approche ............................... 82
IV.3.2 Concepts de la logique possibiliste adaptés à notre approche ........................... 83
IV.3.3 Concepts de l’algorithme Apriori à adapter ..................................................... 83
IV.4. Modélisation de l’approche proposée ............................................................................ 84
IV.4.1 Le modèle en SEF proposé ............................................................................... 84
IV.4.2 Le modèle possibiliste proposé ........................................................................ 85
IV.4.3 Pseudo-algorithme de l’approche proposée ..................................................... 85
IV.4.4 Contribution ..................................................................................................... 87
Partie 2 : Implémentation de l’approche & interprétation biologique des résultats ........... 89
IV.5 Spécificités des données d’application ............................................................................ 89
IV.5.1 Pourquoi limiter l’étude à une sous-partie du DataSet Emage ......................... 89
IV.5.2 Eliminer le biais (les gènes dominants) dans le dataset étudié ........................ 89
IV.5.3 Outil de validation biologique des résultats : la plateforme String-DB ........... 90
IV.6 Vectorisation des images ISH via les deux modélisations .............................................. 91
IV.6.1 Etapes du processus de vectorisation ............................................................... 91
IV.6.2 Exemples de tables résultantes de la vectorisation des images ISH ................. 93
IV.6.3 Réglage des paramètres et Génération des tables de transaction ..................... 94
IV.7 Analyse et interprétation biologique des résultats .......................................................... 94
IV.7.1 Analyse et discussion sur les RA spatiales extraites en Primal ....................... 94
IV.7.2 Intérêt de la dualité dans l’approche proposée ................................................. 96
IV.7.3 Interprétation biologique des résultats obtenus en Dual ................................... 97
IV.7.3.1 Vision globale des résultats de la modélisation floue proposée ...... 97
IV.7.3.2 Vision globale des résultats de modélisation possibiliste proposée 98
IV.8 Conclusion .................................................................................................................... 100
Conclusion générale ............................................................................................................. 101
Annexe : Contributions scientifiques .................................................................................. 102
Bibliographie ........................................................................................................................ 103
Côte titre : DI/0103

Apprentissage et extraction des connaissances dans les bases de données spatiotemporelles [document électronique] / Mekroud,Noureddine, Auteur ; Abdelouahab Moussaoui, Directeur de thèse . - [S.l.] : Sétif:UFA1, 2026 . - 1 vol (108 f.) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique

Mots-clés : Règles d’association
Données spatiotemporelles
Images ISH
Expression génétique
Logique floue et possibiliste
Index. décimale : 004 - Informatique
Résumé : L’imperfection est une caractéristique commune dans presque toutes les données du monde réel, même si elles cachent généralement des connaissances cruciales et d’un intérêt majeur. L’utilisation de théories de l’incertitude pour modéliser les zones d’expression génique (Exp_Gen) dans les embryons permettra d’extraire les relations cachées entre les gènes, tout en tenant compte de l’imprécision possible des limites de ces zones et de la force nuancée de ces expressions. Dans cette thèse, nous proposons une modélisation floue et possibiliste des données spatio-temporelles issues de séquences d’images ISH (In Situ Hybridization) représentant les zones d’Exp_Gen à différentes phases de développement embryonnaire de l’espèce modèle souris d’Edinburgh. Après une série d’étapes de prétraitement sur ces images pour améliorer l’extraction des caractéristiques, nous proposons une adaptation de l’algorithme Apriori à la logique floue et possibiliste pour l’extraction de deux types de règles d’association (RA), qui représenteront en Primal les relations spatiales entre les zones d’Exp_Gen dans l’embryon, et en Dual les relations temporelles ainsi que les relations entre les gènes qui co-expriment dans ces séquences d’images ISH. Enfin, une analyse des AR spatiotemporelles floues et possibilistes extraites sera fournie afin de déterminer la modélisation la plus adéquate. De plus, l’interprétation biologique des résultats obtenus confirme leur adéquation aux principes de la biologie génétique. Les connaissances extraites aideront les biologistes à mieux comprendre les interactions entre gènes, à identifier les ensembles de gènes qui co-expriment et ayant le même rôle fonctionnel, et enfin à modéliser l’expression génétique normale pour détecter les expressions génétiques anormales susceptibles de provoquer des maladies génétiques.
Note de contenu :
Sommaire
Introduction générale ..................................................... 12
Chapitre I : La Bio-informatique ET Les images d’expression genetique ............... 15
Ⅰ.1 Introduction .............................................. 15
Partie 1 : La Bio-Informatique ........................................................ 16
Ⅰ.2 Notions biologiques de base ............................................................ 16
Ⅰ.2.1 Les diverses définitions de la Bio-informatique ................................................. 16
Ⅰ.2.2 Historique de la Bio-informatique ...................................................................... 18
Ⅰ.2.3 Théories fondamentales de la biologie moléculaire ............................................ 20
Ⅰ.2.4 Les objectifs et domaines d’application de la bio-informatique ......................... 22
Ⅰ.3 Les banques de données biologiques ................................................................................. 23
Ⅰ.3.1 Les banques de données généralistes .................................................................. 24
Ⅰ.3.2 Banques de données spécialistes ......................................................................... 24
Ⅰ.3.3 Les séquences d’images d’expression génétique ................................................ 24
Partie 2 : Les images d’expression génétique ....................................................................... 25
Ⅰ.4 L’imagerie in vivo d’expression génétique ........................................................................ 25
Ⅰ.4.1 La banque Drosofila FlyBase .............................................................................. 25
Ⅰ.4.2 La banque Zebra Fish ......................................................................................... 26
Ⅰ.4.3 La banque Edinburgh Mouse .............................................................................. 26
Ⅰ.5 Pourquoi choisir l’Atlas EMAGE ....................................................................................... 27
Ⅰ.6 Etat de l’art : travaux de recherche sur les données d’Exp_Gen ....................................... 28
Ⅰ.6.1 Micro Array data .................................................................................................. 28
Ⅰ.6.1.1 Features selection ................................................................................ 28
Ⅰ.6.1.2 Clustering & mesures de similarité-distance ..................................... 29
Ⅰ.6.2 mRNAseq ............................................................................................................ 29
Ⅰ.6.3 Les images ISH ................................................................................................... 30
Ⅰ.7 Conclusion ......................................................................................................................... 31
Chapitre II : Extraction des Connaissances à partir des Données & Règles d’Association 32
Ⅱ.1 Introduction ....................................................................................................................... 32
Partie 1 : Principes de base de l’ECD ................................................................................... 33
Ⅱ.2 Notions de base de l’ECD ................................................................................................. 33
Ⅱ.2.1 Définition de l’ECD ........................................................................................... 33
Ⅱ.2.2 Des données aux connaissance .......................................................................... 34
Ⅱ.2.3 Le processus d’ECD .......................................................................................... 35
Ⅱ.3 Le Machine Learning ........................................................................................................ 36
Ⅱ.3.1 Qu’est-ce que le Machine Learning .................................................................. 36
Ⅱ.3.2 Principales tâches du Machine Learning ............................................................ 36
Ⅱ.3.3 Le Machine Learning comme levier de l’IA ...................................................... 38
Ⅱ.3.4 Algorithmes de Machine Learning .................................................................... 39
Partie 2 : Autour et alentour des Règles d’Association ........................................................ 40
Ⅱ.4 Les méthodes de recherche d’associations ........................................................................ 40
Ⅱ.4.1 Présentation générale ......................................................................................... 40
Ⅱ.4.2 Développement historique de la recherche d’associations ................................. 40
II.5 Concepts fondamentaux des règles d’association.............................................................. 41
II.5.1 Notions de base ................................................................................................... 41
II.5.1.1 Item .................................................................................................... 41
II.5.1.2 Itemset ............................................................................................... 41
II.5.1.3 K-Itemset ........................................................................................... 41
II.5.1.4 Support d’un itemset .......................................................................... 41
II.5.1.5 Règle d’association ............................................................................ 41
II.5.1.6 Confiance d’une règle d’association .................................................. 41
II.5.1.7 Itemset fréquent ................................................................................. 41
II.5.2 Les étapes de l’extraction de règles d’association .............................................. 42
II.5.3 Espace de recherche ou le treillis des itemsets ................................................... 43
II.5.4 Mesures d’évaluation et de validation ................................................................ 44
II.6 Divers algorithmes d’induction des règles d’association .................................................. 46
II.6.1 Algorithme C5.0 ................................................................................................. 46
II.6.2 Le GRI (Generalised Rule Induction) ................................................................. 46
II.6.3 Algorithmes fondés sur le support et la confiance .............................................. 46
II.7 Algorithme Apriori pour l’extraction des règles d’association ......................................... 48
II.7.1 Recherche des itemsets fréquents ....................................................................... 48
II.7.2 Génération des règles d’association .................................................................... 50
II.7.3 Exemple illustratif sur le fonctionnement de l’algorithme Apriori .................... 51
II.8 Les avantages et inconvénients de l’algorithme Apriori ................................................... 53
II.9 Domaines d’Applications des règles d’association ........................................................... 54
II.10 Les axes d’extension des algorithmes d’extraction des règles d’associations ................. 55
II.10.1 Extensions basées sur la nature des règles extraites ......................................... 55
II.10.1.1 Les règles d’associations quantitatives ............................................ 55
II.10.1.2 Les règles d’association généralisées .............................................. 56
II.10.1.3 Les motifs sequentiels ..................................................................... 56
II.10.2 Extensions basées sur la logique de modelisation ............................................ 56
II.10.2.1 Les règles d’association floues ........................................................ 57
II.10.2.2 Les règles d’association possibilistes .............................................. 57
II.10.2.3 Les règles d’association évidentielles .............................................. 57
II.11 Conclusion ....................................................................................................................... 58
Chapitre III : Adaptation des règles d’association aux théories de l’incertain .................... 59
III.1 Introduction ...................................................................................................................... 59
Partie 1 : Théories de l’incertain ............................................................................................ 60
III.2 De la logique binaire aux logiques de l’incertain ............................................................. 60
III.2.1 Le développement de la logique humaine ......................................................... 60
III.2.2 La logique binaire .............................................................................................. 60
IⅡ.2.2.1 Algèbre de Boole .............................................................................. 60
ⅡI.2.2.2 Pourquoi le monde réel n’est pas en logique binaire ....................... 61
ⅡI.2.3 Les types d’imperfection dans les données réelles ........................................... 61
ⅡI.2.3.1 Les données incertaines ................................................................... 62
ⅡI.2.3.2 Les données imprécises ................................................................... 62
ⅡI.2.3.3 Les données incomplètes ................................................................. 62
ⅡI.2.3.4 Les données inconsistantes .............................................................. 62
ⅡI.3 Les logiques de modélisation dans l’incertain ................................................................ 63
IⅡ.3.1 La logique probabiliste et le théorème de Bayes .............................................. 63
ⅡI.3.2 La logique floue ................................................................................................ 64
ⅡI.3.2.1 Généralités ....................................................................................... 64
ⅡI.3.2.2 Caractérisation des Sous-Ensembles Flous ..................................... 65
ⅡI.3.2.3 Fonctions d’appartenance ................................................................ 65
ⅡI.3.3 La logique possibiliste ...................................................................................... 66
IⅡ.3.3.1 Les distributions de possibilité ........................................................ 66
IⅡ.3.3.2 Les mesures de possibilité et de nécessité ....................................... 66
ⅡI.3.4 La logique évidentielle (théorie de croyance) .................................................. 68
ⅡI.3.4.1 Notions de base ............................................................................... 68
ⅡI.3.4.2 Mesures de croyance et de plausibilité ............................................ 69
ⅡI.4 Comparatif entre les déférentes logiques de modélisation .............................................. 70
Partie 2 : Adaptation de l’algorithme Apriori aux logiques de l’incertain ........................... 71
III.5 Les règles d’association floues ......................................................................................... 71
III.5.1 Présentation générale ......................................................................................... 71
III.5.2 Concepts et définitions de base ......................................................................... 71
III.5.2.1 Item flou ........................................................................................... 71
III.5.2.2 Itemset flou ....................................................................................... 71
III.5.2.3 Redéfinition de l’union et de la cardinalité des ensembles ............. 72
III.5.2.4 Le degré d’appartenance d’un itemset flou ...................................... 72
III.5.2.5 Le support d’un itemset flou ............................................................ 73
III.5.2.6 Les règle d’association floues .......................................................... 74
III.5.2.7 La confiance d’une règle d’association floue ................................... 74
III.5.3 Extraction de règles d’association floues .......................................................... 74
III.5.4 Exemple d’extraction de règles d’association floues ........................................ 75
ⅡI.6 Etat de l’art : travaux sur les Exp_Gen basés sur les RA ................................................. 77
IⅡ.6.1 Sélection des RA pertinentes basée sur des mesures d’intérêt subjectifs ......... 77
IⅡ.6.2 Sélection des RA pertinentes basée sur des mesures d’intérêt objectifs .......... 77
ⅡI.7 Conclusion ....................................................................................................................... 78
Chapitre IV : Approche proposée & interprétation biologique des résultats ...................... 79
IV.1 Introduction ..................................................................................................................... 79
Partie 1 : Approche proposée ................................................................................................. 80
IV.2 Justification de l’approche proposée ............................................................................... 80
IV.2.1 Présentation générale ........................................................................................ 80
IV.2.2 Critique des travaux antecedants ...................................................................... 80
IV.2.3 Proposition ....................................................................................................... 81
IV.3 Adaptation proposée de l’Apriori aux théories de l’incertain ......................................... 82
IV.3.1 Concepts de la théorie des SEF adaptés à notre approche ............................... 82
IV.3.2 Concepts de la logique possibiliste adaptés à notre approche ........................... 83
IV.3.3 Concepts de l’algorithme Apriori à adapter ..................................................... 83
IV.4. Modélisation de l’approche proposée ............................................................................ 84
IV.4.1 Le modèle en SEF proposé ............................................................................... 84
IV.4.2 Le modèle possibiliste proposé ........................................................................ 85
IV.4.3 Pseudo-algorithme de l’approche proposée ..................................................... 85
IV.4.4 Contribution ..................................................................................................... 87
Partie 2 : Implémentation de l’approche & interprétation biologique des résultats ........... 89
IV.5 Spécificités des données d’application ............................................................................ 89
IV.5.1 Pourquoi limiter l’étude à une sous-partie du DataSet Emage ......................... 89
IV.5.2 Eliminer le biais (les gènes dominants) dans le dataset étudié ........................ 89
IV.5.3 Outil de validation biologique des résultats : la plateforme String-DB ........... 90
IV.6 Vectorisation des images ISH via les deux modélisations .............................................. 91
IV.6.1 Etapes du processus de vectorisation ............................................................... 91
IV.6.2 Exemples de tables résultantes de la vectorisation des images ISH ................. 93
IV.6.3 Réglage des paramètres et Génération des tables de transaction ..................... 94
IV.7 Analyse et interprétation biologique des résultats .......................................................... 94
IV.7.1 Analyse et discussion sur les RA spatiales extraites en Primal ....................... 94
IV.7.2 Intérêt de la dualité dans l’approche proposée ................................................. 96
IV.7.3 Interprétation biologique des résultats obtenus en Dual ................................... 97
IV.7.3.1 Vision globale des résultats de la modélisation floue proposée ...... 97
IV.7.3.2 Vision globale des résultats de modélisation possibiliste proposée 98
IV.8 Conclusion .................................................................................................................... 100
Conclusion générale ............................................................................................................. 101
Annexe : Contributions scientifiques .................................................................................. 102
Bibliographie ........................................................................................................................ 103
Côte titre : DI/0103

Exemplaires (1)

Code-barres Cote Support Localisation Section Disponibilité
DI/0103 DI/0103 Thèse Bibliothèque des sciences Français Disponible
Disponible

Attention-Based Deep Convolutional Neural Network Versus Transfer Learning for Medical Image Classification and Disease Diagnosis / Maroua Azouz

Public

ISBD

Titre : Attention-Based Deep Convolutional Neural Network Versus Transfer Learning for Medical Image Classification and Disease Diagnosis
Type de document : texte imprimé
Auteurs : Maroua Azouz, Auteur ; Nour Deghoul, Auteur ; Abdelouahab Moussaoui, Directeur de thèse
Année de publication : 2022
Importance : 1 vol (94 f .)
Format : 29cm
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique

Mots-clés : Transfer Learning
Image Classification
ViT
Index. décimale : 004 Informatique
Résumé :
Cancer is a disease in which some of the body’s cells grow uncontrollably and spread
to other parts of the body. recently the most two common type of diseases in our city
Setif are Skin cancer and nodules in thyroid gland cancer. Skin Cancer Is the Cancer
You Can See, this sentence is the the motto of Skin Cancer Foundation .When strange
grains appear in the patient’s skin, he cannot differentiate whether it is cancer or just
simple skin ulcers, so in most cases it is not detected except in advanced stages of the
disease . Most patients with nodules in the thyroid gland are afraid to turning these
nodes into cancerous masses, and with the spread of this disease in recent years, this
question has become a concern for all patients.
Recently, the world has become highly focused on deep learning and classification
of medical images by building stable models in computer aided diagnosis [8], most often
the model is using Convolutional neural networks. Now we propose a model based
on the attention mechanism that based on the most important features in the image.
The attention mechanism contributes to increasing the effectiveness of the model and
achieving a better classification. The aim of this study is to improve the accuracy of a
computer-aided diagnosis approach that medical professionals can easily use as an aid.
In this thesis, we proposed the use of the transformer and transfer-learning mechanism
to detect and classify skin cancer diseases and the type of thyroid nodules(benign or malignant).
We collected features from three types of pre-trained models, EfficientNetB7,
VGGNet16, Xception as feature extraction roles. Then as using the features as input to
Vision Transformer (ViT) and then using neural networks for classification.As a result,
the proposed approach achieved accuracy of 83.74% for skin dataset and 76.18% for
thyroid dataset, and an other similar model using CNN model proposed by us is achieve
92.95% of accuracy for skin dataset and 88.18% of accuracy for thyroid dataset . We
proposed, also the of use transfer learning for develop the pre trained model and applied
the same datasets on ResNet50 and our new ResNet50,these models achieve 67.66%,
98.89% respectively for skin cancer data set and they achieve 67.03%, 90.97% respectively
by the use of thyroid dataset.
Côte titre : MAI/0587
En ligne : https://drive.google.com/file/d/1x9lI7fG4IlSYzf0xGs-E7AL9ynLyGu1h/view?usp=share [...]
Format de la ressource électronique : pdf

Attention-Based Deep Convolutional Neural Network Versus Transfer Learning for Medical Image Classification and Disease Diagnosis [texte imprimé] / Maroua Azouz, Auteur ; Nour Deghoul, Auteur ; Abdelouahab Moussaoui, Directeur de thèse . - 2022 . - 1 vol (94 f .) ; 29cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique

Mots-clés : Transfer Learning
Image Classification
ViT
Index. décimale : 004 Informatique
Résumé :
Cancer is a disease in which some of the body’s cells grow uncontrollably and spread
to other parts of the body. recently the most two common type of diseases in our city
Setif are Skin cancer and nodules in thyroid gland cancer. Skin Cancer Is the Cancer
You Can See, this sentence is the the motto of Skin Cancer Foundation .When strange
grains appear in the patient’s skin, he cannot differentiate whether it is cancer or just
simple skin ulcers, so in most cases it is not detected except in advanced stages of the
disease . Most patients with nodules in the thyroid gland are afraid to turning these
nodes into cancerous masses, and with the spread of this disease in recent years, this
question has become a concern for all patients.
Recently, the world has become highly focused on deep learning and classification
of medical images by building stable models in computer aided diagnosis [8], most often
the model is using Convolutional neural networks. Now we propose a model based
on the attention mechanism that based on the most important features in the image.
The attention mechanism contributes to increasing the effectiveness of the model and
achieving a better classification. The aim of this study is to improve the accuracy of a
computer-aided diagnosis approach that medical professionals can easily use as an aid.
In this thesis, we proposed the use of the transformer and transfer-learning mechanism
to detect and classify skin cancer diseases and the type of thyroid nodules(benign or malignant).
We collected features from three types of pre-trained models, EfficientNetB7,
VGGNet16, Xception as feature extraction roles. Then as using the features as input to
Vision Transformer (ViT) and then using neural networks for classification.As a result,
the proposed approach achieved accuracy of 83.74% for skin dataset and 76.18% for
thyroid dataset, and an other similar model using CNN model proposed by us is achieve
92.95% of accuracy for skin dataset and 88.18% of accuracy for thyroid dataset . We
proposed, also the of use transfer learning for develop the pre trained model and applied
the same datasets on ResNet50 and our new ResNet50,these models achieve 67.66%,
98.89% respectively for skin cancer data set and they achieve 67.03%, 90.97% respectively
by the use of thyroid dataset.
Côte titre : MAI/0587
En ligne : https://drive.google.com/file/d/1x9lI7fG4IlSYzf0xGs-E7AL9ynLyGu1h/view?usp=share [...]
Format de la ressource électronique : pdf

Exemplaires (1)

Code-barres Cote Support Localisation Section Disponibilité
MAI/0587 MAI/0587 Mémoire Bibliothèque des sciences Anglais Disponible
Disponible

Biomedical Data Analysis by Deep Architectures / Tcheir ,Abir

Public

ISBD

Titre : Biomedical Data Analysis by Deep Architectures
Type de document : texte imprimé
Auteurs : Tcheir ,Abir, Auteur ; Abdelouahab Moussaoui, Directeur de thèse
Editeur : Setif:UFA
Année de publication : 2021
Importance : 1 vol (59 f .)
Format : 29 cm
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique

Mots-clés : OVID-19
chestX-ray
DeepLearning
Attentionmaps
Index. décimale : 004 - Informatique
Résumé :
OVID-19causeslunginflammationandlesions,andchestX-rayimagesareremarkably
suitable fordifferentiatingthenewdiseasefrompatientswithotherlungdiseases.
In thispaper,weproposeacomputermodeltoclassifyX-rayimagesofpatientsdiagnosed
with COVID-19.Thedatasetsutilizedinthisexperimentaretwo.Firstly,adatasetof9545X-ray
images including4045imageswithconfirmedCovid-19disease,and5500imagesofNonCovid-19.
Secondly,adatasetof13677X-rayimagesincluding3424imageswithconfirmedCovid-19disease,
1345 imageswithconfirmedviralpneumonia,and8908imagesofnormalconditions.Theresults
suggest thatDeepLearningwithX-rayimagingmayextractsignificantbiomarkersrelated
to theCovid-19disease,Thisworkhasconsideredthewellknownpre-trainedarchitectures,
suchasEfficientNetB0,DenseNet121,Vgg16,ResNet50,InceptionV3andMobileNetV2forthe
experimental evaluation.
The performanceoftheconsideredarchitecturesisevaluatedbycomputingthecommonper-
formance measures.TheresultoftheexperimentalevaluationconfirmsthattheEfficientNetB0
pre-trained transferlearning-basedmodelofferedbetterclassificationaccuracy(98.40%)onthe
considered imagedataset1classificationand(97.20%)ontheconsideredimagedataset2,were
also generatedAttentionmapsforprediction,whichrepresentsakeyexplanatorystepaimedat
increasing confidenceinthefinaldecision.
Côte titre : MAI/0528
En ligne : https://drive.google.com/file/d/1pF3-IE1TmVOr85fp2nF7Z0Wrn9T3QRSk/view?usp=shari [...]
Format de la ressource électronique : pdf

Biomedical Data Analysis by Deep Architectures [texte imprimé] / Tcheir ,Abir, Auteur ; Abdelouahab Moussaoui, Directeur de thèse . - [S.l.] : Setif:UFA, 2021 . - 1 vol (59 f .) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique

Mots-clés : OVID-19
chestX-ray
DeepLearning
Attentionmaps
Index. décimale : 004 - Informatique
Résumé :
OVID-19causeslunginflammationandlesions,andchestX-rayimagesareremarkably
suitable fordifferentiatingthenewdiseasefrompatientswithotherlungdiseases.
In thispaper,weproposeacomputermodeltoclassifyX-rayimagesofpatientsdiagnosed
with COVID-19.Thedatasetsutilizedinthisexperimentaretwo.Firstly,adatasetof9545X-ray
images including4045imageswithconfirmedCovid-19disease,and5500imagesofNonCovid-19.
Secondly,adatasetof13677X-rayimagesincluding3424imageswithconfirmedCovid-19disease,
1345 imageswithconfirmedviralpneumonia,and8908imagesofnormalconditions.Theresults
suggest thatDeepLearningwithX-rayimagingmayextractsignificantbiomarkersrelated
to theCovid-19disease,Thisworkhasconsideredthewellknownpre-trainedarchitectures,
suchasEfficientNetB0,DenseNet121,Vgg16,ResNet50,InceptionV3andMobileNetV2forthe
experimental evaluation.
The performanceoftheconsideredarchitecturesisevaluatedbycomputingthecommonper-
formance measures.TheresultoftheexperimentalevaluationconfirmsthattheEfficientNetB0
pre-trained transferlearning-basedmodelofferedbetterclassificationaccuracy(98.40%)onthe
considered imagedataset1classificationand(97.20%)ontheconsideredimagedataset2,were
also generatedAttentionmapsforprediction,whichrepresentsakeyexplanatorystepaimedat
increasing confidenceinthefinaldecision.
Côte titre : MAI/0528
En ligne : https://drive.google.com/file/d/1pF3-IE1TmVOr85fp2nF7Z0Wrn9T3QRSk/view?usp=shari [...]
Format de la ressource électronique : pdf

Exemplaires (1)

Code-barres Cote Support Localisation Section Disponibilité
MAI/0528 MAI/0528 Mémoire Bibliothèque des sciences Français Disponible
Disponible

Catégorisation Automatique Contextuelle de Documents Semi-structurés Multilingues / Gadri, said

Permalink
Community Detection with Deep Graph Neural Networks / Imad Eddine Kettaf

Permalink
Deep Belief Networks Applied to Alzheimer’s Disease Detection and Classification using Neuroimaging Data / Yacine Deradra

Permalink
Deep Feature Learning (Extraction and Generation) Using a Bidirectional LSTM-CNN and Deep Generative Models Applied to Physiological Signals (EEG/ECG) Classification / Hichem Betiche

Permalink
Deep Learning for Medical Object Detection and Segmentation / Ouassim boukhennoufa

Permalink
Deep learning models for arrhythmia classification and coronary artery diseases detection / Khaoula Tobbal

Permalink
Deep Learning Models for Colorectal Cancer Detection and Classification / Mohamed Islem Belhaddad

Permalink
Deep Vision Transformer for Heart Disease Classification and Prediction / Oualid Akkouche

Permalink
Enhancing Deep Learning with Quantum Computing: Exploring Hybrid Algorithms for Image Classification / Sabrina Lazeli

Permalink
Enhancing Medical Image Segmentation with FastAI and Vision Transformers: A Hybrid Approach / Rahma Hebbir

Permalink