University Sétif 1 FERHAT ABBAS Faculty of Sciences
Détail de l'auteur
Auteur Nasri,Khaled |
Documents disponibles écrits par cet auteur



Titre : Brain Tumor Segmentation Using U-Net Type de document : texte imprimé Auteurs : Seyf Eddine Louassa, Auteur ; Akram Houcine Zeghouani ; Nasri,Khaled, Directeur de thèse Editeur : Setif:UFA Année de publication : 2023 Importance : 1 vol (72 f .) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Medical imaging deep learning machine learning U-Net Brain tumor segmentation Index. décimale : 004 Informatique Résumé : In the last few years, machine learning has covered a lot of domains. One of
which is the medical field, precisly brain tumor segmentation. Not only the process
of identifying the tumor is time consuming, it is very difficult to perform it in some
cases, even for professional radiologist. Thus, we created U-Net models to properly
segment MRI images and treat the problem of tumor detection. Our proposed
model reached a high score of 85.76 percent.
Côte titre : MAI/0769 En ligne : https://drive.google.com/file/d/1vFPhRe0J-h8HkuofxjH5tXc3s8oCwOWm/view?usp=drive [...] Format de la ressource électronique : Brain Tumor Segmentation Using U-Net [texte imprimé] / Seyf Eddine Louassa, Auteur ; Akram Houcine Zeghouani ; Nasri,Khaled, Directeur de thèse . - [S.l.] : Setif:UFA, 2023 . - 1 vol (72 f .) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Medical imaging deep learning machine learning U-Net Brain tumor segmentation Index. décimale : 004 Informatique Résumé : In the last few years, machine learning has covered a lot of domains. One of
which is the medical field, precisly brain tumor segmentation. Not only the process
of identifying the tumor is time consuming, it is very difficult to perform it in some
cases, even for professional radiologist. Thus, we created U-Net models to properly
segment MRI images and treat the problem of tumor detection. Our proposed
model reached a high score of 85.76 percent.
Côte titre : MAI/0769 En ligne : https://drive.google.com/file/d/1vFPhRe0J-h8HkuofxjH5tXc3s8oCwOWm/view?usp=drive [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0769 MAI/0769 Mémoire Bibliothéque des sciences Anglais Disponible
DisponibleClassification and Forecasting using Deep Learning Approach for Time Series Gene Expression Data / Abderraouf Aymen Bensemra
![]()
Titre : Classification and Forecasting using Deep Learning Approach for Time Series Gene Expression Data Type de document : texte imprimé Auteurs : Abderraouf Aymen Bensemra, Auteur ; Assil Guenfoud, Auteur ; Nasri,Khaled, Directeur de thèse Année de publication : 2023 Importance : 1 vol (40 f .) Format : 29cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Informatique Index. décimale : 004 Informatique Résumé : Time series gene expression analysis reveals dynamic shifts in gene expression patterns
over time, aiding the study of regulatory genes, signaling pathways, and biological processes.
It provides insights into development, environmental responses, and disease progression,
deepening our understanding and enabling specialized interventions.
Deep learning algorithms for gene expression time series forecasting offer significant benefits,
accurately predicting future expression levels by capturing temporal dependencies
and non-linear correlations. They enhance precision medicine and our understanding of
biological processes. In our study, in the data GSE6168 we evaluated the effectiveness of
Long Short-Term Memory where the best RMSE we got is:0.278 and Temporal Convolutional
Networks where we got a total RMSE of:0.268Côte titre : MAI/0704 En ligne : https://drive.google.com/file/d/15WXNGAo0lEgxoqlRMtyRXTe49Nu7xX_u/view?usp=drive [...] Format de la ressource électronique : Classification and Forecasting using Deep Learning Approach for Time Series Gene Expression Data [texte imprimé] / Abderraouf Aymen Bensemra, Auteur ; Assil Guenfoud, Auteur ; Nasri,Khaled, Directeur de thèse . - 2023 . - 1 vol (40 f .) ; 29cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Informatique Index. décimale : 004 Informatique Résumé : Time series gene expression analysis reveals dynamic shifts in gene expression patterns
over time, aiding the study of regulatory genes, signaling pathways, and biological processes.
It provides insights into development, environmental responses, and disease progression,
deepening our understanding and enabling specialized interventions.
Deep learning algorithms for gene expression time series forecasting offer significant benefits,
accurately predicting future expression levels by capturing temporal dependencies
and non-linear correlations. They enhance precision medicine and our understanding of
biological processes. In our study, in the data GSE6168 we evaluated the effectiveness of
Long Short-Term Memory where the best RMSE we got is:0.278 and Temporal Convolutional
Networks where we got a total RMSE of:0.268Côte titre : MAI/0704 En ligne : https://drive.google.com/file/d/15WXNGAo0lEgxoqlRMtyRXTe49Nu7xX_u/view?usp=drive [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0704 MAI/0704 Mémoire Bibliothéque des sciences Anglais Disponible
Disponible
Titre : Deep Convolutional Network Model for Chest X-ray Abnormalities Detection Type de document : texte imprimé Auteurs : Zemmit, Maroua, Auteur ; Nasri,Khaled, Directeur de thèse Editeur : Setif:UFA Année de publication : 2021 Importance : 1 vol (47 f .) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : CNN
VGG19
VGG16
Resnet50v2Index. décimale : 004 - Informatique Résumé :
Les radiographies thoraciques (CXR) sont largement utilisées pour le diagnostic
d’anomalies dans la région du coeur et des poumons. Automatiquement
détecter ces anomalies avec une grande précision pourrait améliorer considérablement
les processus de diagnostic et puis de bien prendre en charge ces cas.
Avec les progrès des algorithmes informatiques, la détection de ce type des anomalies
à un stade précoce est nécessaire de toute urgence pour le rétablissement
rapide des patients. L’ensemble de données utilisé dans cette étude COVID19
radiographys dataset a été collecté auprès de différentes sources et il est disponible
pour les chercheurs. Le nombre d’images dans l’ensemble de données collectées
est de 3616 cas positifs au COVID-19, 10 192 images normales ainsi que
6012 images d’opacité pulmonaire (infection pulmonaire non COVID) et 1345
images de pneumonie virale. Pour éprouver notre architecture very deep learning,
fondée sur 5 blocs, nous avons choisis trois architectures very deep qui
sont : vgg16,vgg19, resnet50v2. Ces modèles ont été sélectionnés parce qu’ils obtiennent
des résultats élevés dans la base de données imagenet.
Résultats : Dans l’ensemble de données COVID19 radiographys, notre modèle atteint
une réussite(accuracy) de 92,9% et une perte de 20%.
Conclusions : Notre CNN proposé obtient des résultats améliorés par rapport aux
architectures utilisées sur notre base de données ce qui prouve la qualité de notre
modèle.Côte titre : MAI/0550 En ligne : https://drive.google.com/file/d/1ZT9kGy9j0-NhQTQmV0jwrNCrdFK5DG5T/view?usp=shari [...] Format de la ressource électronique : Deep Convolutional Network Model for Chest X-ray Abnormalities Detection [texte imprimé] / Zemmit, Maroua, Auteur ; Nasri,Khaled, Directeur de thèse . - [S.l.] : Setif:UFA, 2021 . - 1 vol (47 f .) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : CNN
VGG19
VGG16
Resnet50v2Index. décimale : 004 - Informatique Résumé :
Les radiographies thoraciques (CXR) sont largement utilisées pour le diagnostic
d’anomalies dans la région du coeur et des poumons. Automatiquement
détecter ces anomalies avec une grande précision pourrait améliorer considérablement
les processus de diagnostic et puis de bien prendre en charge ces cas.
Avec les progrès des algorithmes informatiques, la détection de ce type des anomalies
à un stade précoce est nécessaire de toute urgence pour le rétablissement
rapide des patients. L’ensemble de données utilisé dans cette étude COVID19
radiographys dataset a été collecté auprès de différentes sources et il est disponible
pour les chercheurs. Le nombre d’images dans l’ensemble de données collectées
est de 3616 cas positifs au COVID-19, 10 192 images normales ainsi que
6012 images d’opacité pulmonaire (infection pulmonaire non COVID) et 1345
images de pneumonie virale. Pour éprouver notre architecture very deep learning,
fondée sur 5 blocs, nous avons choisis trois architectures very deep qui
sont : vgg16,vgg19, resnet50v2. Ces modèles ont été sélectionnés parce qu’ils obtiennent
des résultats élevés dans la base de données imagenet.
Résultats : Dans l’ensemble de données COVID19 radiographys, notre modèle atteint
une réussite(accuracy) de 92,9% et une perte de 20%.
Conclusions : Notre CNN proposé obtient des résultats améliorés par rapport aux
architectures utilisées sur notre base de données ce qui prouve la qualité de notre
modèle.Côte titre : MAI/0550 En ligne : https://drive.google.com/file/d/1ZT9kGy9j0-NhQTQmV0jwrNCrdFK5DG5T/view?usp=shari [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0550 MAI/0550 Mémoire Bibliothéque des sciences Anglais Disponible
Disponible
Titre : Deep Learning Approach for Handwritten Arabic Recognition Characters Type de document : texte imprimé Auteurs : Nasri,Khaled, Directeur de thèse ; Marouani, Maroua, Auteur Editeur : Setif:UFA Année de publication : 2021 Importance : 1 vol (94 f .) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Reconnaissance de mots arabes manuscrits
Réseau de
neuronnes
Classification Multiple.Index. décimale : 004 - Informatique Résumé : L’objectif de notre travail de recherche est d’adresser la problématique
de la reconnaissance automatique de l’écriture arabe manuscrite
par les méthodes avancées du deep learning.
Nous avons trouvé que le problème majeur de la lecture automatique
de caractères manuscrits cursifs étant la variations infinies des
caractéres arabes.
Les méthodes choisies sont efficaces .Nous constatons que la performance
d’un système de reconnaissance optique de l’écriture arabe
manuscrite dépend de toutes les phases du processus de reconnaissance
depuis l’acquisition jusqu’à la classification.
Nous avons mis l’accent sur deux phases les plus étudiées dans les
travaux existants :
l’extraction des primitives et la classification.
Nous avons orienté notre recherche vers les approches basées sur
les concepts de l’intelligence Artificielle plus précisément le Deep Learning
il s’agit de l’ application du CNN et du VDCNN pour la classification
automatique des caractères arabe manuscrit, en essayant ainsi
de l’appliquer sur une nouvelle base de donné suggérer(MDAHC), et
d’obtenir des résultats plus performantsCôte titre : MAI/0523 En ligne : https://drive.google.com/file/d/1_51SoKVLsl69tBofNQqvDfHC_uu8SaLM/view?usp=shari [...] Format de la ressource électronique : Deep Learning Approach for Handwritten Arabic Recognition Characters [texte imprimé] / Nasri,Khaled, Directeur de thèse ; Marouani, Maroua, Auteur . - [S.l.] : Setif:UFA, 2021 . - 1 vol (94 f .) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Reconnaissance de mots arabes manuscrits
Réseau de
neuronnes
Classification Multiple.Index. décimale : 004 - Informatique Résumé : L’objectif de notre travail de recherche est d’adresser la problématique
de la reconnaissance automatique de l’écriture arabe manuscrite
par les méthodes avancées du deep learning.
Nous avons trouvé que le problème majeur de la lecture automatique
de caractères manuscrits cursifs étant la variations infinies des
caractéres arabes.
Les méthodes choisies sont efficaces .Nous constatons que la performance
d’un système de reconnaissance optique de l’écriture arabe
manuscrite dépend de toutes les phases du processus de reconnaissance
depuis l’acquisition jusqu’à la classification.
Nous avons mis l’accent sur deux phases les plus étudiées dans les
travaux existants :
l’extraction des primitives et la classification.
Nous avons orienté notre recherche vers les approches basées sur
les concepts de l’intelligence Artificielle plus précisément le Deep Learning
il s’agit de l’ application du CNN et du VDCNN pour la classification
automatique des caractères arabe manuscrit, en essayant ainsi
de l’appliquer sur une nouvelle base de donné suggérer(MDAHC), et
d’obtenir des résultats plus performantsCôte titre : MAI/0523 En ligne : https://drive.google.com/file/d/1_51SoKVLsl69tBofNQqvDfHC_uu8SaLM/view?usp=shari [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0523 MAI/0523 Mémoire Bibliothéque des sciences Anglais Disponible
Disponible
Titre : Deep Learning Based Protein Function Prediction Type de document : texte imprimé Auteurs : Almas Djabar, Auteur ; Ranim Mehatla ; Nasri,Khaled, Directeur de thèse Editeur : Setif:UFA Année de publication : 2024 Importance : 1 vol (66 f .) Format : 29 cm Langues : Anglais (eng) Catégories : Thèses & Mémoires:Informatique Mots-clés : Protein function prediction
Bioinformatics
Deep learning techniques
Imbalanced datasets
Multilabel classification
Data preprocessingIndex. décimale : 004 - Informatique Résumé :
Protein function prediction is a crucial task in bioinformatics, offering insights into biological processes and potential
drug targets.
This study employs advanced deep learning techniques on the CAFA5 dataset to predict protein functions solely
from sequence information, it focuses on data preprocessing, deep learning architectures, training, and evaluation.
We have employed comprehensive data preprocessing steps, including sequence embedding and various methods
to address the challenges posed by imbalanced datasets. We also developed several deep learning architectures
tailored for this task.
Results demonstrate that the deep neural network (DNN) outperformed other models on the imbalanced dataset
with an average Fmax of 0.4577, while the recurrent neural network (RNN) excels on the balanced dataset with an
average Fmax of 0.6970.
In conclusion, these findings underscores the importance of addressing data imbalance in multi-label classification
tasks for protein function prediction. It also highlights varying performance levels among architectures, with
specific methods excelling on different dataset natures.Note de contenu :
Sommaire
introduction 6
1 Biological Background 8
1.1 Biology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2 Biochemistry . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3 Protein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1 Amino acids . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3.2 Protein Synthesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3.3 Protein structure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.4 Protein function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3.5 Gene Ontology: Standardizing Protein Functions . . . . . . . . . . . . . . . . . . . . . . 15
1.3.6 Protein Function Determination . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4 Bioinformatics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.4.1 Main bioinformatics tools and benchmarks: . . . . . . . . . . . . . . . . . . . . . . . . . 19
2 Deep Learning for Bioinformatics 22
2.1 Deep Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.1.1 Neural Network . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2 Exploring Advanced Architectures in Deep Learning . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2.1 Deep Neural Network . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.2 Convolutional Neural Network ‘’CNN’’ . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2.3 Recurrent Neural Network ‘’RNN’’ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2.4 Graph Neural Networks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2.5 Transformers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2.6 Multi-modal learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3 Previous Research in the field . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.4 Article Comparison Table . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3 Deep Learning Models for Multi-Label Classification of Protein Functions 35
3.1 Domain Understanding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.1.1 Domain Objectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.1.2 Project Pipeline . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.2 Dataset Understanding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.2.1 Dataset Files Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3 Dataset Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3.1 Descriptive Statistics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3.2 Data Types . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.3.3 Taxonomic Diversity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.3.4 Correlation Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.4 Data preprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.4.1 Protein Embedding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.4.2 Extracting GO terms for labelling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.4.3 Data Balancing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.5 Experimental Protocol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.5.1 Fundamentals of Model Configuration and Optimization . . . . . . . . . . . . . . . . . . 48
3.5.2 Recurrent Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.5.3 Deep Neural Networks (DNNs) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.5.4 Convolutional Neural Networks (CNNs) . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.5.5 Transformer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.5.6 Evaluation Metrics Used . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.6 Results and Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.6.1 Experiments Done with Different Labels Dataframes . . . . . . . . . . . . . . . . . . . . 56
3.6.2 Model Performance Comparison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.6.3 Result Interpretation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
Conclusion and Perspectives 62Côte titre : MAI/0906
Deep Learning Based Protein Function Prediction [texte imprimé] / Almas Djabar, Auteur ; Ranim Mehatla ; Nasri,Khaled, Directeur de thèse . - [S.l.] : Setif:UFA, 2024 . - 1 vol (66 f .) ; 29 cm.
Langues : Anglais (eng)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Protein function prediction
Bioinformatics
Deep learning techniques
Imbalanced datasets
Multilabel classification
Data preprocessingIndex. décimale : 004 - Informatique Résumé :
Protein function prediction is a crucial task in bioinformatics, offering insights into biological processes and potential
drug targets.
This study employs advanced deep learning techniques on the CAFA5 dataset to predict protein functions solely
from sequence information, it focuses on data preprocessing, deep learning architectures, training, and evaluation.
We have employed comprehensive data preprocessing steps, including sequence embedding and various methods
to address the challenges posed by imbalanced datasets. We also developed several deep learning architectures
tailored for this task.
Results demonstrate that the deep neural network (DNN) outperformed other models on the imbalanced dataset
with an average Fmax of 0.4577, while the recurrent neural network (RNN) excels on the balanced dataset with an
average Fmax of 0.6970.
In conclusion, these findings underscores the importance of addressing data imbalance in multi-label classification
tasks for protein function prediction. It also highlights varying performance levels among architectures, with
specific methods excelling on different dataset natures.Note de contenu :
Sommaire
introduction 6
1 Biological Background 8
1.1 Biology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2 Biochemistry . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3 Protein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1 Amino acids . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3.2 Protein Synthesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3.3 Protein structure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.4 Protein function . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3.5 Gene Ontology: Standardizing Protein Functions . . . . . . . . . . . . . . . . . . . . . . 15
1.3.6 Protein Function Determination . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4 Bioinformatics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.4.1 Main bioinformatics tools and benchmarks: . . . . . . . . . . . . . . . . . . . . . . . . . 19
2 Deep Learning for Bioinformatics 22
2.1 Deep Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.1.1 Neural Network . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2 Exploring Advanced Architectures in Deep Learning . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2.1 Deep Neural Network . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.2 Convolutional Neural Network ‘’CNN’’ . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2.3 Recurrent Neural Network ‘’RNN’’ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2.4 Graph Neural Networks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2.5 Transformers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2.6 Multi-modal learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3 Previous Research in the field . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.4 Article Comparison Table . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3 Deep Learning Models for Multi-Label Classification of Protein Functions 35
3.1 Domain Understanding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.1.1 Domain Objectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.1.2 Project Pipeline . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.2 Dataset Understanding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.2.1 Dataset Files Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3 Dataset Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3.1 Descriptive Statistics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3.2 Data Types . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.3.3 Taxonomic Diversity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.3.4 Correlation Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.4 Data preprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.4.1 Protein Embedding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.4.2 Extracting GO terms for labelling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.4.3 Data Balancing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.5 Experimental Protocol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.5.1 Fundamentals of Model Configuration and Optimization . . . . . . . . . . . . . . . . . . 48
3.5.2 Recurrent Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.5.3 Deep Neural Networks (DNNs) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.5.4 Convolutional Neural Networks (CNNs) . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.5.5 Transformer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.5.6 Evaluation Metrics Used . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.6 Results and Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.6.1 Experiments Done with Different Labels Dataframes . . . . . . . . . . . . . . . . . . . . 56
3.6.2 Model Performance Comparison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.6.3 Result Interpretation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
Conclusion and Perspectives 62Côte titre : MAI/0906
Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0906 MAI/0906 Mémoire Bibliothéque des sciences Anglais Disponible
DisponiblePermalinkPermalinkPermalinkImplémentation d'un algorithme de Data Mining dans le modèle de programmation MapReduce / Bensedira, Ayoub
![]()
PermalinkPermalinkPermalink