Titre : |
Développement d’une approche pour la prédiction de l'activité biologique des composés chimiques et l'amélioration des performances du processus de recherche dans les bases de données chimiques, à la base de l’intelligence artificielle |
Type de document : |
texte imprimé |
Auteurs : |
Nada Safsaf, Auteur ; Ismahan Mellaz ; Fouaz Berrhail, Directeur de thèse |
Editeur : |
Sétif:UFS |
Année de publication : |
2023 |
Importance : |
1 vol (f.) |
Format : |
29 cm |
Langues : |
Français (fre) |
Catégories : |
Thèses & Mémoires:Informatique
|
Mots-clés : |
Prédiction de l’activité biologique
Recherche de bases de données chimiques
LBVS,
Intelligence artificielle
Apprentissage profond
Fingerprints 2D
Découverte de médicaments. |
Index. décimale : |
004 - Informatique |
Résumé : |
Prédire l'activité biologique des molécules et accélérer le processus de découverte de
médicaments sont des défis majeurs dans la recherche pharmaceutique, dans cette étude,
nous avons abordé ces enjeux en développant et en évaluant plusieurs modèles de
classification.
Notre contribution dans ce travail consiste à évaluer l’utilisation de modèles de machine
Learning tels que : SVM, NB, et des modèles Deep Learning tels que : CNN, RNN. Nous nous
concentrons sur les réseaux neuronaux convolutionnels (CNN) et de machines à vecteurs de
support (SVM) pour prédire l'activité biologiques des molécules étudiées, Les CNN, qui
exploitent l'apprentissage profond, se sont révélés efficaces pour analyser les données
structurées, telles que les représentations moléculaires, ils ont permis de détecter des motifs
complexes et d'apprendre les relations entre les caractéristiques des composés et leur activité
biologique. Parallèlement, les SVM, en tant qu'algorithmes d'apprentissage automatique
adaptés à la classification binaire, ont contribué à séparer les composés actifs des inactifs.
Dans le cadre de notre étude, nous avons également exploré les performances des
classificateurs naïfs bayésiens (NB) et réseau de neurones récurrents (RNN), afin d'évaluer leur
pertinence dans la prédiction de l'activité biologique des molécules. Afin de tester et évaluer
notre approche, nous avons effectué la partie expérimentation sur les ensembles de données
MDDR (MDL Drug Data Report), trois data sets sont utilisées exemples Alog_P, CDK, et
Graph_Only.
Les résultats obtenus ont été extrêmement prometteurs, démontrant l'efficacité
remarquable de nos modèles de CNN et de SVM dans la prédiction de l'activité biologique des
molécules, les performances en termes de précision, de rappel et d'exactitude ont été
remarquables, ouvrant ainsi de nouvelles perspectives pour améliorer la sélection des
candidats médicamenteux = Predicting the biological activity of molecules and accelerating the Drug Discovery process
are major challenges in pharmaceutical research; in this study, we addressed these issues by
developing and evaluating several classification models.
Our contribution in this work consists in evaluating the use of Machine Learning models such
as: SVM, NB, and Deep Learning models such as : CNN, RNN. Focusing on Convolutional Neural
Networks (CNN) and Support Vector Machines (SVM) to predict the activity of the molecules.
The CNNs, which exploit deep learning, proved effective in analyzing structured data, such as
molecular representations, detecting complex patterns and learning relationships between
compound features and their biological activity. At the same time, SVMs, as machine learning
algorithms adapted to binary classification, have helped separate active from inactive
compounds.
As part of our study, we also explored the performance of naive Bayesian (NB) and recurrent
neural network (RNN) classifiers, to assess their relevance in predicting the biological activity
of molecules. In order to test and evaluate our approach, we performed the experimentation
part on the MDDR datasets (MDL Drug Data Report), three datasets have used as examples
Alog_P, CDK, and Graph_Only
The obtained results were extremely promising, demonstrating the remarkable
effectiveness of our CNN and SVM models in predicting the biological activity of molecules.
Performance in terms of precision, recall and accuracy was remarkable, opening up new
prospects for improving the selection of drug candidates. |
Côte titre : |
MAI/0778 |
En ligne : |
https://drive.google.com/file/d/1Py4WchKQkliAokEHNMQFKiN_NfzaZtUl/view?usp=drive [...] |
Format de la ressource électronique : |
pdf |
Développement d’une approche pour la prédiction de l'activité biologique des composés chimiques et l'amélioration des performances du processus de recherche dans les bases de données chimiques, à la base de l’intelligence artificielle [texte imprimé] / Nada Safsaf, Auteur ; Ismahan Mellaz ; Fouaz Berrhail, Directeur de thèse . - [S.l.] : Sétif:UFS, 2023 . - 1 vol (f.) ; 29 cm. Langues : Français ( fre)
Catégories : |
Thèses & Mémoires:Informatique
|
Mots-clés : |
Prédiction de l’activité biologique
Recherche de bases de données chimiques
LBVS,
Intelligence artificielle
Apprentissage profond
Fingerprints 2D
Découverte de médicaments. |
Index. décimale : |
004 - Informatique |
Résumé : |
Prédire l'activité biologique des molécules et accélérer le processus de découverte de
médicaments sont des défis majeurs dans la recherche pharmaceutique, dans cette étude,
nous avons abordé ces enjeux en développant et en évaluant plusieurs modèles de
classification.
Notre contribution dans ce travail consiste à évaluer l’utilisation de modèles de machine
Learning tels que : SVM, NB, et des modèles Deep Learning tels que : CNN, RNN. Nous nous
concentrons sur les réseaux neuronaux convolutionnels (CNN) et de machines à vecteurs de
support (SVM) pour prédire l'activité biologiques des molécules étudiées, Les CNN, qui
exploitent l'apprentissage profond, se sont révélés efficaces pour analyser les données
structurées, telles que les représentations moléculaires, ils ont permis de détecter des motifs
complexes et d'apprendre les relations entre les caractéristiques des composés et leur activité
biologique. Parallèlement, les SVM, en tant qu'algorithmes d'apprentissage automatique
adaptés à la classification binaire, ont contribué à séparer les composés actifs des inactifs.
Dans le cadre de notre étude, nous avons également exploré les performances des
classificateurs naïfs bayésiens (NB) et réseau de neurones récurrents (RNN), afin d'évaluer leur
pertinence dans la prédiction de l'activité biologique des molécules. Afin de tester et évaluer
notre approche, nous avons effectué la partie expérimentation sur les ensembles de données
MDDR (MDL Drug Data Report), trois data sets sont utilisées exemples Alog_P, CDK, et
Graph_Only.
Les résultats obtenus ont été extrêmement prometteurs, démontrant l'efficacité
remarquable de nos modèles de CNN et de SVM dans la prédiction de l'activité biologique des
molécules, les performances en termes de précision, de rappel et d'exactitude ont été
remarquables, ouvrant ainsi de nouvelles perspectives pour améliorer la sélection des
candidats médicamenteux = Predicting the biological activity of molecules and accelerating the Drug Discovery process
are major challenges in pharmaceutical research; in this study, we addressed these issues by
developing and evaluating several classification models.
Our contribution in this work consists in evaluating the use of Machine Learning models such
as: SVM, NB, and Deep Learning models such as : CNN, RNN. Focusing on Convolutional Neural
Networks (CNN) and Support Vector Machines (SVM) to predict the activity of the molecules.
The CNNs, which exploit deep learning, proved effective in analyzing structured data, such as
molecular representations, detecting complex patterns and learning relationships between
compound features and their biological activity. At the same time, SVMs, as machine learning
algorithms adapted to binary classification, have helped separate active from inactive
compounds.
As part of our study, we also explored the performance of naive Bayesian (NB) and recurrent
neural network (RNN) classifiers, to assess their relevance in predicting the biological activity
of molecules. In order to test and evaluate our approach, we performed the experimentation
part on the MDDR datasets (MDL Drug Data Report), three datasets have used as examples
Alog_P, CDK, and Graph_Only
The obtained results were extremely promising, demonstrating the remarkable
effectiveness of our CNN and SVM models in predicting the biological activity of molecules.
Performance in terms of precision, recall and accuracy was remarkable, opening up new
prospects for improving the selection of drug candidates. |
Côte titre : |
MAI/0778 |
En ligne : |
https://drive.google.com/file/d/1Py4WchKQkliAokEHNMQFKiN_NfzaZtUl/view?usp=drive [...] |
Format de la ressource électronique : |
pdf |
|