Titre : |
Apprentissage automatique par construction d’ensemble de classifieurs |
Type de document : |
texte imprimé |
Auteurs : |
TALHI, Ouafa ; A Moussaoui, Directeur de thèse |
Editeur : |
Setif:UFA |
Année de publication : |
2015 |
Importance : |
1 vol (58f.) |
Format : |
29 cm |
Catégories : |
Informatique Thèses & Mémoires:Informatique
|
Mots-clés : |
Classification, Data Mining, Extraction de connaissance, Apprentissage
automatique, Ensemble de Classifieurs, Boosting, Bagging, forêts aléatoires. |
Index. décimale : |
004 Informatique |
Résumé : |
Résumé :
Dans de nombreux domaines (vision par ordinateur, reconnaissance des formes,
etc.), la résolution de la plupart des problèmes se base sur le traitement de données
extraites à partir des données acquises dans le monde réel, et structurées sous forme de
vecteurs. La qualité du système de traitement dépend directement du bon choix du contenu
de ces vecteurs. Mais dans de nombreux cas, la résolution du problème devient presque
impossible à cause de la dimension trop importante de ces vecteurs. Par conséquent, il est
souvent utile, et parfois nécessaire, de réduire celle-ci à une taille plus compatible avec les
méthodes de résolution, même si cette réduction peut conduire à une légère perte
d'informations.
Parmi ces méthodes : la construction d'ensembles de classifieurs.
Une manière particulière de construire un ensemble de classifieurs consiste Ã
sélectionner individuellement les membres en se basant sur des critères prédéfinis.
Dans ce cadre, nous avons présenté les méthodes les plus utilisé de cette méthode
(Bagging, Boosting, forêtes aléatoires) et utiliser ces méthodes pour la création d’un
nouvelle classifieur.
|
Note de contenu : |
TABLE DES MATIERES :
INTRODUCTION GENERALE
CHAPITRE1:EXTRACTION DES CONNAISSANCES ET FOUILLE DE DONNES
2. Extraction des connaissances à partir des données:................................................................3
2.1. Définitions de l’ECD : .....................................................................................................4
2.1.1. Définition 1: ..............................................................................................................4
2.1.2. Définition 2 : .............................................................................................................4
2.2. Le processus d’ECD : ......................................................................................................4
2.2.1. Nettoyage et intégration de données : .......................................................................5
2.2.2 Prétraitement de données ...........................................................................................5
2.2.3. Fouille de données(Datamining)...............................................................................6
2.2.4. Evaluation et présentation .........................................................................................6
2.3. Les limites de l'ECD ........................................................................................................7
3. La Fouille de données :...........................................................................................................7
3.1. Définitions: ......................................................................................................................7
3.1.1. Définition 1: ..............................................................................................................7
3.1.2. Définition 2: ..............................................................................................................7
3.2. Processus de fouille de données : ...................................................................................8
3.3. Les tâches du Data Mining : ............................................................................................9
3.4. Les méthodes de datamining..........................................................................................11
A. Les méthodes classiques..............................................................................................11
B. Les méthodes sophistiquées.........................................................................................11
3.5. Les domaines d’application de fouille de données.......................................................12
4. Conclusion :..........................................................................................................................13
CHAPITRE2 : APPRENTISSAGE AUTOMATIQUE ET CLASSIFICATION
1. Introduction : ........................................................................................................................14
2. Intelligence artificielle et apprentissage automatique ..........................................................14
3. Apprentissage automatique : ................................................................................................14
3.1. Objectif des algorithmes d’apprentissage :....................................................................15
3.2. Les modes d’apprentissage automatique : .....................................................................15
3.2.1. Apprentissage supervisé..........................................................................................15
3.2.2. Apprentissage non-supervisé : ................................................................................16
3.2.3. L’apprentissage semi-supervisé: .............................................................................16
3.3. Les problèmes d’apprentissage :....................................................................................16
4. La Classification :.................................................................................................................17
4.1. Définition:......................................................................................................................17
4.2. Méthodes de la classification.........................................................................................17
4.2.1. La classification supervisée :...................................................................................17
4.2.1.1. La méthode des k plus proches voisins (KPPV) : ............................................18
4.2.1.2. Les Réseaux de neurones : ...................................................................................19
4.2.1.3. Les arbres de décision : .......................................................................................20
4.2.1.4. Les machines à vecteurs de supports :.................................................................23
4.5.2. La classification non supervisée :............................................................................24
4.5.2. 1. Les méthodes par partitionnement : ....................................................................24
4.5.2. 1.1.La méthode de K-means :................................................................................24
4.5.2. 1.2. La méthode de k-medoids :...............................................................................25
4.5.2.1.3. Inconvénients des algorithmes de partitionnement:..........................................26
4.5.2. 2. Les méthodes hiérarchiques: ...............................................................................26
4.5.2. 2.1.classification ascendante hiérarchique (CAH) :...............................................26
4.5.2. 2.2. Les méthodes de classification descendante hiérarchique (CHD) ..................27
4.5.2. 2.2.Inconvénients des algorithmes hiérarchiques :..................................................27
Conclusion :..............................................................................................................................28
CHAPITRE3 : LES METHODES D'ENSEMBLES
1. Introduction : ........................................................................................................................29
2. Définition d’un classifieur :..................................................................................................29
3. Les méthodes d’ensembles de classifieurs: ..........................................................................29
3.1. Intérêt des méthodes ensemblistes :...............................................................................30
3.2. Les types des méthodes d’ensembles.............................................................................30
3.2.1. Les méthodes d’ensembles hétérogènes :...............................................................30
3.2.2. Les méthodes d’ensembles homogènes : ...............................................................30
4. Construction d’un ensemble de Classifieurs : ......................................................................31
4.1. Fusion de décisions :......................................................................................................31
4.1.1. Le mécanisme de vote ............................................................................................31
4.1.1.1. Le vote majoritaire : .........................................................................................31
4.1.1.2. Le vote majoritaire pondéré..............................................................................31
4.1.1.3. Le vote avec seuil .............................................................................................32
4.2. Techniques de construction d’un ensemble de classifieurs ...........................................32
4.2.1. Le Bagging :............................................................................................................32
4.2.1.1. Le principe de Bagging : ..................................................................................33
4.2.2. Le Boosting : ...........................................................................................................33
4.2.2.1.AdaBoost ...........................................................................................................33
4.2.2.2. Le principe du Boosting : .................................................................................34
4.2.3. Random Subspaces (RSM) : ...................................................................................34
4.2.3.1. Le principe de Random Subspaces :.................................................................35
4.2.4. Forêts aléatoires : ....................................................................................................35
4.2.4.1. Le principe des Forêts aléatoires : ....................................................................36
5. Travaux connexe : ................................................................................................................36
6. Contribution..........................................................................................................................39
7. Conclusion............................................................................................................................39
CHAPITRE4 : IMPLEMENTATION ET RESULTATS
1. Introduction ..........................................................................................................................40
2. Environnement et outils utilisés : .........................................................................................40
2.1.NetBeans IDE : ...............................................................................................................40
2.2. Weka (Waikato Environment for Knowledge Analysis):..............................................40
3. Description des bases de données utilisées .........................................................................41
3.1.1. Les descripteurs cliniques de la base.......................................................................41
3.2. La base de données Breast_Cancer :..............................................................................42
4. Le travaille effectué :............................................................................................................42
4.1. L’algorithme de vote majoritaire : .................................................................................42
4.1. L’algorithme de la méthode Fusion:..............................................................................43
Figure 4. 1:Structure de l’implémentation............................................................................43
5. Implémentation et résultats :.................................................................................................44
5.1. Etude comparative : .......................................................................................................50
5.1.1. J48 VS Bagging :.....................................................................................................50
5.1.2. J48 VS Boosting :....................................................................................................51
5.1.3. J48 VS Bagging VS Boosting :...............................................................................52
5.1.4. Bagging VS Boosting VS Forêts aléatoires: ...........................................................53
5.2. Fusion : ..........................................................................................................................55
6. Conclusion :..........................................................................................................................56
CONCLUSION GENERALE
BIBLIOGRAPHIE |
Côte titre : |
MAI/0062 |
En ligne : |
https://drive.google.com/file/d/1V_Cwf7ISZqbboh1tBtbdGOpuWUrlyEIN/view?usp=shari [...] |
Format de la ressource électronique : |
pdf |
Apprentissage automatique par construction d’ensemble de classifieurs [texte imprimé] / TALHI, Ouafa ; A Moussaoui, Directeur de thèse . - [S.l.] : Setif:UFA, 2015 . - 1 vol (58f.) ; 29 cm.
Catégories : |
Informatique Thèses & Mémoires:Informatique
|
Mots-clés : |
Classification, Data Mining, Extraction de connaissance, Apprentissage
automatique, Ensemble de Classifieurs, Boosting, Bagging, forêts aléatoires. |
Index. décimale : |
004 Informatique |
Résumé : |
Résumé :
Dans de nombreux domaines (vision par ordinateur, reconnaissance des formes,
etc.), la résolution de la plupart des problèmes se base sur le traitement de données
extraites à partir des données acquises dans le monde réel, et structurées sous forme de
vecteurs. La qualité du système de traitement dépend directement du bon choix du contenu
de ces vecteurs. Mais dans de nombreux cas, la résolution du problème devient presque
impossible à cause de la dimension trop importante de ces vecteurs. Par conséquent, il est
souvent utile, et parfois nécessaire, de réduire celle-ci à une taille plus compatible avec les
méthodes de résolution, même si cette réduction peut conduire à une légère perte
d'informations.
Parmi ces méthodes : la construction d'ensembles de classifieurs.
Une manière particulière de construire un ensemble de classifieurs consiste Ã
sélectionner individuellement les membres en se basant sur des critères prédéfinis.
Dans ce cadre, nous avons présenté les méthodes les plus utilisé de cette méthode
(Bagging, Boosting, forêtes aléatoires) et utiliser ces méthodes pour la création d’un
nouvelle classifieur.
|
Note de contenu : |
TABLE DES MATIERES :
INTRODUCTION GENERALE
CHAPITRE1:EXTRACTION DES CONNAISSANCES ET FOUILLE DE DONNES
2. Extraction des connaissances à partir des données:................................................................3
2.1. Définitions de l’ECD : .....................................................................................................4
2.1.1. Définition 1: ..............................................................................................................4
2.1.2. Définition 2 : .............................................................................................................4
2.2. Le processus d’ECD : ......................................................................................................4
2.2.1. Nettoyage et intégration de données : .......................................................................5
2.2.2 Prétraitement de données ...........................................................................................5
2.2.3. Fouille de données(Datamining)...............................................................................6
2.2.4. Evaluation et présentation .........................................................................................6
2.3. Les limites de l'ECD ........................................................................................................7
3. La Fouille de données :...........................................................................................................7
3.1. Définitions: ......................................................................................................................7
3.1.1. Définition 1: ..............................................................................................................7
3.1.2. Définition 2: ..............................................................................................................7
3.2. Processus de fouille de données : ...................................................................................8
3.3. Les tâches du Data Mining : ............................................................................................9
3.4. Les méthodes de datamining..........................................................................................11
A. Les méthodes classiques..............................................................................................11
B. Les méthodes sophistiquées.........................................................................................11
3.5. Les domaines d’application de fouille de données.......................................................12
4. Conclusion :..........................................................................................................................13
CHAPITRE2 : APPRENTISSAGE AUTOMATIQUE ET CLASSIFICATION
1. Introduction : ........................................................................................................................14
2. Intelligence artificielle et apprentissage automatique ..........................................................14
3. Apprentissage automatique : ................................................................................................14
3.1. Objectif des algorithmes d’apprentissage :....................................................................15
3.2. Les modes d’apprentissage automatique : .....................................................................15
3.2.1. Apprentissage supervisé..........................................................................................15
3.2.2. Apprentissage non-supervisé : ................................................................................16
3.2.3. L’apprentissage semi-supervisé: .............................................................................16
3.3. Les problèmes d’apprentissage :....................................................................................16
4. La Classification :.................................................................................................................17
4.1. Définition:......................................................................................................................17
4.2. Méthodes de la classification.........................................................................................17
4.2.1. La classification supervisée :...................................................................................17
4.2.1.1. La méthode des k plus proches voisins (KPPV) : ............................................18
4.2.1.2. Les Réseaux de neurones : ...................................................................................19
4.2.1.3. Les arbres de décision : .......................................................................................20
4.2.1.4. Les machines à vecteurs de supports :.................................................................23
4.5.2. La classification non supervisée :............................................................................24
4.5.2. 1. Les méthodes par partitionnement : ....................................................................24
4.5.2. 1.1.La méthode de K-means :................................................................................24
4.5.2. 1.2. La méthode de k-medoids :...............................................................................25
4.5.2.1.3. Inconvénients des algorithmes de partitionnement:..........................................26
4.5.2. 2. Les méthodes hiérarchiques: ...............................................................................26
4.5.2. 2.1.classification ascendante hiérarchique (CAH) :...............................................26
4.5.2. 2.2. Les méthodes de classification descendante hiérarchique (CHD) ..................27
4.5.2. 2.2.Inconvénients des algorithmes hiérarchiques :..................................................27
Conclusion :..............................................................................................................................28
CHAPITRE3 : LES METHODES D'ENSEMBLES
1. Introduction : ........................................................................................................................29
2. Définition d’un classifieur :..................................................................................................29
3. Les méthodes d’ensembles de classifieurs: ..........................................................................29
3.1. Intérêt des méthodes ensemblistes :...............................................................................30
3.2. Les types des méthodes d’ensembles.............................................................................30
3.2.1. Les méthodes d’ensembles hétérogènes :...............................................................30
3.2.2. Les méthodes d’ensembles homogènes : ...............................................................30
4. Construction d’un ensemble de Classifieurs : ......................................................................31
4.1. Fusion de décisions :......................................................................................................31
4.1.1. Le mécanisme de vote ............................................................................................31
4.1.1.1. Le vote majoritaire : .........................................................................................31
4.1.1.2. Le vote majoritaire pondéré..............................................................................31
4.1.1.3. Le vote avec seuil .............................................................................................32
4.2. Techniques de construction d’un ensemble de classifieurs ...........................................32
4.2.1. Le Bagging :............................................................................................................32
4.2.1.1. Le principe de Bagging : ..................................................................................33
4.2.2. Le Boosting : ...........................................................................................................33
4.2.2.1.AdaBoost ...........................................................................................................33
4.2.2.2. Le principe du Boosting : .................................................................................34
4.2.3. Random Subspaces (RSM) : ...................................................................................34
4.2.3.1. Le principe de Random Subspaces :.................................................................35
4.2.4. Forêts aléatoires : ....................................................................................................35
4.2.4.1. Le principe des Forêts aléatoires : ....................................................................36
5. Travaux connexe : ................................................................................................................36
6. Contribution..........................................................................................................................39
7. Conclusion............................................................................................................................39
CHAPITRE4 : IMPLEMENTATION ET RESULTATS
1. Introduction ..........................................................................................................................40
2. Environnement et outils utilisés : .........................................................................................40
2.1.NetBeans IDE : ...............................................................................................................40
2.2. Weka (Waikato Environment for Knowledge Analysis):..............................................40
3. Description des bases de données utilisées .........................................................................41
3.1.1. Les descripteurs cliniques de la base.......................................................................41
3.2. La base de données Breast_Cancer :..............................................................................42
4. Le travaille effectué :............................................................................................................42
4.1. L’algorithme de vote majoritaire : .................................................................................42
4.1. L’algorithme de la méthode Fusion:..............................................................................43
Figure 4. 1:Structure de l’implémentation............................................................................43
5. Implémentation et résultats :.................................................................................................44
5.1. Etude comparative : .......................................................................................................50
5.1.1. J48 VS Bagging :.....................................................................................................50
5.1.2. J48 VS Boosting :....................................................................................................51
5.1.3. J48 VS Bagging VS Boosting :...............................................................................52
5.1.4. Bagging VS Boosting VS Forêts aléatoires: ...........................................................53
5.2. Fusion : ..........................................................................................................................55
6. Conclusion :..........................................................................................................................56
CONCLUSION GENERALE
BIBLIOGRAPHIE |
Côte titre : |
MAI/0062 |
En ligne : |
https://drive.google.com/file/d/1V_Cwf7ISZqbboh1tBtbdGOpuWUrlyEIN/view?usp=shari [...] |
Format de la ressource électronique : |
pdf |
|