University Sétif 1 FERHAT ABBAS Faculty of Sciences
Détail de l'auteur
Auteur KAMEL, N |
Documents disponibles écrits par cet auteur
Ajouter le résultat dans votre panier Affiner la recherche
Titre : Clustering algorithm using K-means and Cuckoo Search Type de document : texte imprimé Auteurs : LEGRIB, Med El-Amine ; KAMEL, N, Directeur de thèse Editeur : Setif:UFA Année de publication : 2015 Importance : 1 vol (49f.) Format : 29 cm Langues : Anglais (eng) Catégories : Thèses & Mémoires:Informatique Mots-clés : Cluster,clustering data,k-means,cuckoo search,metaheuristics,datamining,
Knowledge Discovery.Index. décimale : 004 Informatique Résumé : Abstract
Cluster analysis comprises a range of methods for classifying multivariate data into
subgroups. By organizing multivariate data into such subgroups, clustering can help
reveal the characteristics of any structure or patterns present. These techniques have
proven useful in a wide range of areas such as medicine, psychology, market research
and bioinformatics. in this thesis we will take a look on many clustering algorithms
and implement our solution for clustering data using k-means and cuckoo search algorithms evaluate the result of our work using the benchmark of various dataset proposed
in UC Irvine Machine Learning Repository ,result showed a good k-means algorithm
initialization
Note de contenu : Contents
Dedication 1
abstract 2
Introduction 6
1 DATA Mining 8
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2 Etymology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1 Definition DATA MINIG . . . . . . . . . . . . . . . . . . . 8
1.3.2 Definition KNOWLEDGE Discovery in Databases . . . . . . 9
1.3.3 Definition machine learning . . . . . . . . . . . . . . . . . . 9
1.3.3.1 Leaning style . . . . . . . . . . . . . . . . . . . . 10
1.3.3.1.1 Supervised Learning: . . . . . . . . . . . 10
1.3.3.1.2 Unsupervised Learning . . . . . . . . . . 10
1.3.3.1.3 Semi-Supervised Learning . . . . . . . . 10
1.3.3.1.4 Reinforcement Learning: . . . . . . . . . 10
1.4 data mining tasks [Kan11] . . . . . . . . . . . . . . . . . . . . . . . 10
1.4.1 Predictive Method . . . . . . . . . . . . . . . . . . . . . . . 10
1.4.2 Description Method . . . . . . . . . . . . . . . . . . . . . . 11
1.5 Types of Data Mining System . . . . . . . . . . . . . . . . . . . . . 11
1.5.1 Classification of data mining systems according to the type of
data source mined . . . . . . . . . . . . . . . . . . . . . . . 11
1.5.2 Classification of data mining systems according to the data model 11
1.5.3 Classification of data mining systems according to the kind of
knowledge discovered . . . . . . . . . . . . . . . . . . . . . 12
1.5.4 Classification of data mining systems according to mining techniques used . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.6 Data Mining in the real world [UGP96] . . . . . . . . . . . . . . . . 12
1.6.1 Finance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.6.2 Telecommunication . . . . . . . . . . . . . . . . . . . . . . . 12
1.6.3 Biological Data Analysis . . . . . . . . . . . . . . . . . . . . 12
1.6.4 Intrusion Detection . . . . . . . . . . . . . . . . . . . . . . . 13
1.7 Clustering and classification . . . . . . . . . . . . . . . . . . . . . . 13
1.7.1 Classification . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.7.1.1 The decision tree . . . . . . . . . . . . . . . . . . . 13
1.7.2 cluster and Clustering . . . . . . . . . . . . . . . . . . . . . 13
1.7.3 Reasons of clustering . . . . . . . . . . . . . . . . . . . . . . 13
1.7.4 application of cluster analysis . . . . . . . . . . . . . . . . . 14
1.7.4.1 market Research . . . . . . . . . . . . . . . . . . 14
1.7.4.2 Astronomy . . . . . . . . . . . . . . . . . . . . . . 14
1.7.4.3 psychology . . . . . . . . . . . . . . . . . . . . . . 14
1.7.4.4 Weather classification . . . . . . . . . . . . . . . . 14
1.7.4.5 Archeology . . . . . . . . . . . . . . . . . . . . . 14
1.7.5 Data type in cluster analysis . . . . . . . . . . . . . . . . . . 14
1.7.5.1 Clustering categorical Data . . . . . . . . . . . . . 14
1.7.5.2 Clustering Text Data . . . . . . . . . . . . . . . . 15
1.7.5.3 Clustring multimedia data . . . . . . . . . . . . . 15
1.7.5.4 Clustering time-series data . . . . . . . . . . . . . 15
1.7.6 Distances and similarities . . . . . . . . . . . . . . . . . . . 16
1.7.7 Clustering algorithms . . . . . . . . . . . . . . . . . . . . . 16
1.7.7.1 The hierarchical clustering . . . . . . . . . . . . . 16
1.7.7.1.1 Agglomerative and divisive methods . . . 17
1.7.7.1.2 BIRCH ALGORITHEM [TzRr96] . . . . 18
1.7.7.2 The partitional clustering . . . . . . . . . . . . . . 19
1.7.7.2.1 The Heuristics methods . . . . . . . . . . 20
1.7.7.2.1.1 K-means . . . . . . . . . . . . . . 20
1.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2 MetaHeuristics 22
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2 Etymology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3 Deintion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4 properties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.5 Metaheuristics for Clustering . . . . . . . . . . . . . . . . . . . . . . 23
2.5.1 Clustering by evolutionary algorithms . . . . . . . . . . . . . 23
2.5.2 Clustering by artificial ants . . . . . . . . . . . . . . . . . . . 26
2.5.3 Clustering particle swarm . . . . . . . . . . . . . . . . . . . 27
2.5.4 Clustering by artificial immune system . . . . . . . . . . . . 28
2.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3 Meta-heuristics+K-means 30
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2 K-Means and firefly . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.3 K-Means and PSO . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.4 Integrating Nature-inspired Optimization Algorithms to K-means Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.5 Firefly and k-means in image processing . . . . . . . . . . . . . . . . 36
3.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4 implementation 38
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.2 Our approach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.3 Benchmark . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.3.1 Iris Data Set . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.3.1.1 Data Set Information . . . . . . . . . . . . . . . . 39
4.3.2 Wine Data Set . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.3.2.1 Data Set Information . . . . . . . . . . . . . . . . 39
4.3.3 Poker Hand Data Set . . . . . . . . . . . . . . . . . . . . . . 39
4.3.4 datasets uses . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.4 Algorithm k-means/cuckoo-search . . . . . . . . . . . . . . . . . . . 40
4.5 Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.5.1 Hardware used . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.5.2 Software used . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.5.3 Software manual guide . . . . . . . . . . . . . . . . . . . . . 41
4.5.3.1 Cluster validity . . . . . . . . . . . . . . . . . . . 42
4.5.3.2 Clusters . . . . . . . . . . . . . . . . . . . . . . . 42
4.5.4 Screen shot . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.6 Results and evaluation . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.6.1 Compactness intra-cluster . . . . . . . . . . . . . . . . . . . 44
4.6.2 Separation inter-cluster . . . . . . . . . . . . . . . . . . . . . 44
4.6.3 Iteration . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.7 Decision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.8 Future work . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.9 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
General conclusion 46
References 49Côte titre : MAI/0080 En ligne : https://drive.google.com/file/d/1y8oDElqZXLYljFg0uiN0Fl4Et9sDZYJ4/view?usp=shari [...] Format de la ressource électronique : Clustering algorithm using K-means and Cuckoo Search [texte imprimé] / LEGRIB, Med El-Amine ; KAMEL, N, Directeur de thèse . - [S.l.] : Setif:UFA, 2015 . - 1 vol (49f.) ; 29 cm.
Langues : Anglais (eng)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Cluster,clustering data,k-means,cuckoo search,metaheuristics,datamining,
Knowledge Discovery.Index. décimale : 004 Informatique Résumé : Abstract
Cluster analysis comprises a range of methods for classifying multivariate data into
subgroups. By organizing multivariate data into such subgroups, clustering can help
reveal the characteristics of any structure or patterns present. These techniques have
proven useful in a wide range of areas such as medicine, psychology, market research
and bioinformatics. in this thesis we will take a look on many clustering algorithms
and implement our solution for clustering data using k-means and cuckoo search algorithms evaluate the result of our work using the benchmark of various dataset proposed
in UC Irvine Machine Learning Repository ,result showed a good k-means algorithm
initialization
Note de contenu : Contents
Dedication 1
abstract 2
Introduction 6
1 DATA Mining 8
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2 Etymology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1 Definition DATA MINIG . . . . . . . . . . . . . . . . . . . 8
1.3.2 Definition KNOWLEDGE Discovery in Databases . . . . . . 9
1.3.3 Definition machine learning . . . . . . . . . . . . . . . . . . 9
1.3.3.1 Leaning style . . . . . . . . . . . . . . . . . . . . 10
1.3.3.1.1 Supervised Learning: . . . . . . . . . . . 10
1.3.3.1.2 Unsupervised Learning . . . . . . . . . . 10
1.3.3.1.3 Semi-Supervised Learning . . . . . . . . 10
1.3.3.1.4 Reinforcement Learning: . . . . . . . . . 10
1.4 data mining tasks [Kan11] . . . . . . . . . . . . . . . . . . . . . . . 10
1.4.1 Predictive Method . . . . . . . . . . . . . . . . . . . . . . . 10
1.4.2 Description Method . . . . . . . . . . . . . . . . . . . . . . 11
1.5 Types of Data Mining System . . . . . . . . . . . . . . . . . . . . . 11
1.5.1 Classification of data mining systems according to the type of
data source mined . . . . . . . . . . . . . . . . . . . . . . . 11
1.5.2 Classification of data mining systems according to the data model 11
1.5.3 Classification of data mining systems according to the kind of
knowledge discovered . . . . . . . . . . . . . . . . . . . . . 12
1.5.4 Classification of data mining systems according to mining techniques used . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.6 Data Mining in the real world [UGP96] . . . . . . . . . . . . . . . . 12
1.6.1 Finance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.6.2 Telecommunication . . . . . . . . . . . . . . . . . . . . . . . 12
1.6.3 Biological Data Analysis . . . . . . . . . . . . . . . . . . . . 12
1.6.4 Intrusion Detection . . . . . . . . . . . . . . . . . . . . . . . 13
1.7 Clustering and classification . . . . . . . . . . . . . . . . . . . . . . 13
1.7.1 Classification . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.7.1.1 The decision tree . . . . . . . . . . . . . . . . . . . 13
1.7.2 cluster and Clustering . . . . . . . . . . . . . . . . . . . . . 13
1.7.3 Reasons of clustering . . . . . . . . . . . . . . . . . . . . . . 13
1.7.4 application of cluster analysis . . . . . . . . . . . . . . . . . 14
1.7.4.1 market Research . . . . . . . . . . . . . . . . . . 14
1.7.4.2 Astronomy . . . . . . . . . . . . . . . . . . . . . . 14
1.7.4.3 psychology . . . . . . . . . . . . . . . . . . . . . . 14
1.7.4.4 Weather classification . . . . . . . . . . . . . . . . 14
1.7.4.5 Archeology . . . . . . . . . . . . . . . . . . . . . 14
1.7.5 Data type in cluster analysis . . . . . . . . . . . . . . . . . . 14
1.7.5.1 Clustering categorical Data . . . . . . . . . . . . . 14
1.7.5.2 Clustering Text Data . . . . . . . . . . . . . . . . 15
1.7.5.3 Clustring multimedia data . . . . . . . . . . . . . 15
1.7.5.4 Clustering time-series data . . . . . . . . . . . . . 15
1.7.6 Distances and similarities . . . . . . . . . . . . . . . . . . . 16
1.7.7 Clustering algorithms . . . . . . . . . . . . . . . . . . . . . 16
1.7.7.1 The hierarchical clustering . . . . . . . . . . . . . 16
1.7.7.1.1 Agglomerative and divisive methods . . . 17
1.7.7.1.2 BIRCH ALGORITHEM [TzRr96] . . . . 18
1.7.7.2 The partitional clustering . . . . . . . . . . . . . . 19
1.7.7.2.1 The Heuristics methods . . . . . . . . . . 20
1.7.7.2.1.1 K-means . . . . . . . . . . . . . . 20
1.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2 MetaHeuristics 22
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2 Etymology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3 Deintion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4 properties . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.5 Metaheuristics for Clustering . . . . . . . . . . . . . . . . . . . . . . 23
2.5.1 Clustering by evolutionary algorithms . . . . . . . . . . . . . 23
2.5.2 Clustering by artificial ants . . . . . . . . . . . . . . . . . . . 26
2.5.3 Clustering particle swarm . . . . . . . . . . . . . . . . . . . 27
2.5.4 Clustering by artificial immune system . . . . . . . . . . . . 28
2.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3 Meta-heuristics+K-means 30
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2 K-Means and firefly . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.3 K-Means and PSO . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.4 Integrating Nature-inspired Optimization Algorithms to K-means Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.5 Firefly and k-means in image processing . . . . . . . . . . . . . . . . 36
3.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4 implementation 38
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.2 Our approach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.3 Benchmark . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.3.1 Iris Data Set . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.3.1.1 Data Set Information . . . . . . . . . . . . . . . . 39
4.3.2 Wine Data Set . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.3.2.1 Data Set Information . . . . . . . . . . . . . . . . 39
4.3.3 Poker Hand Data Set . . . . . . . . . . . . . . . . . . . . . . 39
4.3.4 datasets uses . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.4 Algorithm k-means/cuckoo-search . . . . . . . . . . . . . . . . . . . 40
4.5 Software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.5.1 Hardware used . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.5.2 Software used . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.5.3 Software manual guide . . . . . . . . . . . . . . . . . . . . . 41
4.5.3.1 Cluster validity . . . . . . . . . . . . . . . . . . . 42
4.5.3.2 Clusters . . . . . . . . . . . . . . . . . . . . . . . 42
4.5.4 Screen shot . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.6 Results and evaluation . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.6.1 Compactness intra-cluster . . . . . . . . . . . . . . . . . . . 44
4.6.2 Separation inter-cluster . . . . . . . . . . . . . . . . . . . . . 44
4.6.3 Iteration . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.7 Decision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.8 Future work . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.9 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
General conclusion 46
References 49Côte titre : MAI/0080 En ligne : https://drive.google.com/file/d/1y8oDElqZXLYljFg0uiN0Fl4Et9sDZYJ4/view?usp=shari [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0080 MAI/0080 Mémoire Bibliothéque des sciences Anglais Disponible
Disponible
Titre : Clustering de données en utilisant les algorithmes Bat et Kmeans Type de document : texte imprimé Auteurs : MEDJOUBI, Hichem ; KAMEL, N, Directeur de thèse Editeur : Setif:UFA Année de publication : 2015 Importance : 1 vol (52f.) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Data Mining, Clustering, Kmeans, Métaheuristic, Bat Algorithm. Index. décimale : 004 Informatique Résumé : Résumé
Le travail du clustering consiste à regrouper les données en classe ; nous obtenons par ce
biais une forte similarité intra-classe et une faible similarité inter-classe. Dans ce mémoire,
nous proposons un nouvel algorithme d’optimisation, dit Algorithme de chauves-souris
pour résoudre le problème d’initialisation de l’algorithme k-means, Les résultats obtenus
après une étude expérimentale et comparative illustrent une amélioration significative dans
clustering des données par rapport aux K-means classiques,De surcroît, les
expérimentations menées ainsi que les résultats prouvent que l’utilisation de l’algorithme
des chauves-souris peut améliorer l’efficacité de recherche des groupes optimales.
Note de contenu : Table de matière
Introduction................................................................................................... 2
1. Fouille de données (Data Mining).............................................................................................. 2
1.1. Définition : ......................................................................................................................... 2
1.2. Processus du data mining ................................................................................................... 3
1.2.1. CRISP-DM.................................................................................................................... 3
2. Méthodes d’exploration des données......................................................................................... 5
2.1. Classification supervisée .................................................................................................... 6
2.1.1. Arbres de décision ...................................................................................................... 6
2.1.2. Réseaux de neurones.................................................................................................. 7
2.2. Classification non supervisée(ou Clustering)..................................................................... 8
3. Méthodes de segmentation......................................................................................................... 9
3.1. La segmentation hiérarchique .......................................................................................... 10
3.1.1. Méthodes ascendantes ou agglomératives.............................................................. 10
3.1.2. Méthodes descendantes........................................................................................... 12
3.2. La segmentation par partition........................................................................................... 12
3.2.1. Méthode basé sur la densité .................................................................................... 12
3.2.2. Méthode basée sur les grilles................................................................................... 13
3.2.3. Méthodes basés sur la minimisation d’une fonction objective ................................ 14
4. Segmentation par la méthode de k-means :.............................................................................. 14
4.1. L’algorithmes de la méthode des ‘K-means’ ................................................................... 15
4.2. Les avantages................................................................................................................... 16
4.3. Les inconvénients............................................................................................................. 17
5. Les critères de dissimilarité :.................................................................................................... 17
CONCLUSION............................................................................................................. 18
Introduction...................................................................................................... 19
1. Pourquoi le bio-inspiré ............................................................................................................. 19
1.1. Définition du domaine bio-inspiré : ................................................................................. 20
2. Taxonomie................................................................................................................................ 21
2.1. Algorithmes évolutionnaires............................................................................................ 22
2.2. Intelligence en essaim ...................................................................................................... 22
3. Variantes d’algorithmes basés essaim :.................................................................................... 23
3.1. Optimisation par essaim particulaire :.............................................................................. 23
3.2. Algorithme de chauves-souris.......................................................................................... 24
3.2.1. Echolocation des chauves-souris.............................................................................. 25
3.2.2. L’acoustique d’écholocation..................................................................................... 26
3.2.3. Optimisation par l’algorithme des chauves-souris................................................... 27
3.3. Cuckoo Search ................................................................................................................. 30
3.4. Algorithme de Firefly........................................................................................................ 31
Conclusion........................................................................................... 33
Introduction................................................................................................ 34
1. Clustering Basé sur Coucou Recherche et K-means................................................................ 34
2. Firefly et k-means pour la quantification des couleurs ............................................................ 36
2.1. Algorithme proposé.......................................................................................................... 37
3. Clustering Basé sur PSO et K-means....................................................................................... 39
4. Clustering Basé sur K-means et des algorithmes Bio-inspiré ................................................. 43
Conclusion.......................................................................................................... 44
Introduction............................................................................................................... 45
1. Conception de Notre Approche................................................................................................ 45
1.1. Principe de l’approche...................................................................................................... 45
1.2. Les paramètres utilisés..................................................................................................... 47
1.3. Benchmark ....................................................................................................................... 47
1.4. Validité des clusters ......................................................................................................... 48
1.5. Environnement de travail ................................................................................................. 49
2. Résultats Expérimentaux.......................................................................................................... 50
Conclusion.................................................................................................................. 51Côte titre : MAI/0066 En ligne : https://drive.google.com/file/d/1H8WKMGNQQWU0d9brq_Lydj1F75hF7ro9/view?usp=shari [...] Format de la ressource électronique : Clustering de données en utilisant les algorithmes Bat et Kmeans [texte imprimé] / MEDJOUBI, Hichem ; KAMEL, N, Directeur de thèse . - [S.l.] : Setif:UFA, 2015 . - 1 vol (52f.) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Data Mining, Clustering, Kmeans, Métaheuristic, Bat Algorithm. Index. décimale : 004 Informatique Résumé : Résumé
Le travail du clustering consiste à regrouper les données en classe ; nous obtenons par ce
biais une forte similarité intra-classe et une faible similarité inter-classe. Dans ce mémoire,
nous proposons un nouvel algorithme d’optimisation, dit Algorithme de chauves-souris
pour résoudre le problème d’initialisation de l’algorithme k-means, Les résultats obtenus
après une étude expérimentale et comparative illustrent une amélioration significative dans
clustering des données par rapport aux K-means classiques,De surcroît, les
expérimentations menées ainsi que les résultats prouvent que l’utilisation de l’algorithme
des chauves-souris peut améliorer l’efficacité de recherche des groupes optimales.
Note de contenu : Table de matière
Introduction................................................................................................... 2
1. Fouille de données (Data Mining).............................................................................................. 2
1.1. Définition : ......................................................................................................................... 2
1.2. Processus du data mining ................................................................................................... 3
1.2.1. CRISP-DM.................................................................................................................... 3
2. Méthodes d’exploration des données......................................................................................... 5
2.1. Classification supervisée .................................................................................................... 6
2.1.1. Arbres de décision ...................................................................................................... 6
2.1.2. Réseaux de neurones.................................................................................................. 7
2.2. Classification non supervisée(ou Clustering)..................................................................... 8
3. Méthodes de segmentation......................................................................................................... 9
3.1. La segmentation hiérarchique .......................................................................................... 10
3.1.1. Méthodes ascendantes ou agglomératives.............................................................. 10
3.1.2. Méthodes descendantes........................................................................................... 12
3.2. La segmentation par partition........................................................................................... 12
3.2.1. Méthode basé sur la densité .................................................................................... 12
3.2.2. Méthode basée sur les grilles................................................................................... 13
3.2.3. Méthodes basés sur la minimisation d’une fonction objective ................................ 14
4. Segmentation par la méthode de k-means :.............................................................................. 14
4.1. L’algorithmes de la méthode des ‘K-means’ ................................................................... 15
4.2. Les avantages................................................................................................................... 16
4.3. Les inconvénients............................................................................................................. 17
5. Les critères de dissimilarité :.................................................................................................... 17
CONCLUSION............................................................................................................. 18
Introduction...................................................................................................... 19
1. Pourquoi le bio-inspiré ............................................................................................................. 19
1.1. Définition du domaine bio-inspiré : ................................................................................. 20
2. Taxonomie................................................................................................................................ 21
2.1. Algorithmes évolutionnaires............................................................................................ 22
2.2. Intelligence en essaim ...................................................................................................... 22
3. Variantes d’algorithmes basés essaim :.................................................................................... 23
3.1. Optimisation par essaim particulaire :.............................................................................. 23
3.2. Algorithme de chauves-souris.......................................................................................... 24
3.2.1. Echolocation des chauves-souris.............................................................................. 25
3.2.2. L’acoustique d’écholocation..................................................................................... 26
3.2.3. Optimisation par l’algorithme des chauves-souris................................................... 27
3.3. Cuckoo Search ................................................................................................................. 30
3.4. Algorithme de Firefly........................................................................................................ 31
Conclusion........................................................................................... 33
Introduction................................................................................................ 34
1. Clustering Basé sur Coucou Recherche et K-means................................................................ 34
2. Firefly et k-means pour la quantification des couleurs ............................................................ 36
2.1. Algorithme proposé.......................................................................................................... 37
3. Clustering Basé sur PSO et K-means....................................................................................... 39
4. Clustering Basé sur K-means et des algorithmes Bio-inspiré ................................................. 43
Conclusion.......................................................................................................... 44
Introduction............................................................................................................... 45
1. Conception de Notre Approche................................................................................................ 45
1.1. Principe de l’approche...................................................................................................... 45
1.2. Les paramètres utilisés..................................................................................................... 47
1.3. Benchmark ....................................................................................................................... 47
1.4. Validité des clusters ......................................................................................................... 48
1.5. Environnement de travail ................................................................................................. 49
2. Résultats Expérimentaux.......................................................................................................... 50
Conclusion.................................................................................................................. 51Côte titre : MAI/0066 En ligne : https://drive.google.com/file/d/1H8WKMGNQQWU0d9brq_Lydj1F75hF7ro9/view?usp=shari [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0066 MAI/0066 Mémoire Bibliothéque des sciences Français Disponible
DisponibleClustering de données en utilisant les algorithmes firefly et Kmeans / BELHAMEL, Achref
Titre : Clustering de données en utilisant les algorithmes firefly et Kmeans Type de document : texte imprimé Auteurs : BELHAMEL, Achref ; KAMEL, N, Directeur de thèse Editeur : Setif:UFA Année de publication : 2015 Importance : 1 vol (53f.) Format : 29 cm Langues : Français (fre) Catégories : Informatique
Thèses & Mémoires:InformatiqueMots-clés : Réseaux
Systèmes Distribués
algorithme
Kmeans
firefly
clusteringIndex. décimale : 004 Informatique Résumé :
CONCLUSION
Grace aux outils de programmation uml qui m’a aider a réaliser la partie de conception de mon projet et a l’aide du java éclipse j’ai généré le code source de mon système ,ainsi que le SQL qui m’a permet de créé une base de donnée pour le but de stocker les informations insérés lors de l’exécution du système .
Malgré les difficultés qui m’ont confrontés lors de développement de mon système comme(la manipulation du java éclipse ) qui était très difficile pour moi car j’ai jamais étudié ça au préalable ,ainsi que la modélisation avec argouml ,je suis arrivé a créer une application pour le suivi d’une école primaire privée qui va s’améliorer si on crée le suivi d’emploie du temps ,et le suivi des différents frais(scolaire, transport).
Côte titre : MAI/0068 Clustering de données en utilisant les algorithmes firefly et Kmeans [texte imprimé] / BELHAMEL, Achref ; KAMEL, N, Directeur de thèse . - [S.l.] : Setif:UFA, 2015 . - 1 vol (53f.) ; 29 cm.
Langues : Français (fre)
Catégories : Informatique
Thèses & Mémoires:InformatiqueMots-clés : Réseaux
Systèmes Distribués
algorithme
Kmeans
firefly
clusteringIndex. décimale : 004 Informatique Résumé :
CONCLUSION
Grace aux outils de programmation uml qui m’a aider a réaliser la partie de conception de mon projet et a l’aide du java éclipse j’ai généré le code source de mon système ,ainsi que le SQL qui m’a permet de créé une base de donnée pour le but de stocker les informations insérés lors de l’exécution du système .
Malgré les difficultés qui m’ont confrontés lors de développement de mon système comme(la manipulation du java éclipse ) qui était très difficile pour moi car j’ai jamais étudié ça au préalable ,ainsi que la modélisation avec argouml ,je suis arrivé a créer une application pour le suivi d’une école primaire privée qui va s’améliorer si on crée le suivi d’emploie du temps ,et le suivi des différents frais(scolaire, transport).
Côte titre : MAI/0068 Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0068 MAI/0068 Mémoire Bibliothéque des sciences Français Disponible
DisponibleUtilisation de l'algorithme Bat pour la découverte de règles d'association / BENDJEDIA, souad
Titre : Utilisation de l'algorithme Bat pour la découverte de règles d'association Type de document : texte imprimé Auteurs : BENDJEDIA, souad, Auteur ; KAMEL, N, Directeur de thèse Editeur : Setif:UFA Année de publication : 2017 Importance : 1 vol (59f.) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Génie logiciel
algorithme
règle d'associationIndex. décimale : 004 Informatique Côte titre : MAI/0210 Utilisation de l'algorithme Bat pour la découverte de règles d'association [texte imprimé] / BENDJEDIA, souad, Auteur ; KAMEL, N, Directeur de thèse . - [S.l.] : Setif:UFA, 2017 . - 1 vol (59f.) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Génie logiciel
algorithme
règle d'associationIndex. décimale : 004 Informatique Côte titre : MAI/0210 Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0210 MAI/0210 Mémoire Bibliothéque des sciences Français Disponible
Disponible
Titre : Utilisation de Firefly pour la détection de communautés Type de document : texte imprimé Auteurs : Chouarfa, Touba, Auteur ; KAMEL, N, Directeur de thèse Editeur : Setif:UFA Année de publication : 2017 Importance : 1 vol (41f.) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Ingénierie des Données
Technologie Web
firefly
détection de communautésIndex. décimale : 004 - Informatique Résumé : Abstract
Empirical analysis of network data has been widely conducted for understanding and
predicting the structure and function of real systems and identifying interesting patterns and
anomalies. One of the most widely studied structural properties of networks is their
community structure. These structures become complex when communities overlap every
time. Many algorithms have been developed to detect such structures. In our dissertation,
we use firefly algorithm to discover community structures. Firefly algorithm is a metaheuristic, based on the light behavior of fireflies. The algorithms we propose generate a
division of the network into groups that contains adjacent elements, and optimize an
objective function that identify the brightest firefly in which the density of these elements
is higher. The space search is explored thanks to the dynamicity of fireflies, where the less
bright firefly move towards the brighter one. The experimentations on real world networks
show that the communities discovered by our approach have a good qualityNote de contenu : Contents
Abstract............................................................................................................................ i
Acknowledgements ........................................................................................................ ii
Contents......................................................................................................................... iii
List of figures................................................................................................................ vii
General introduction ..................................................................................................... 1
1 Community detection................................................................................................ 3
1.1 Introduction..................................................................................................... 3
1.2 Elements of graph theory ................................................................................ 3
1.2.1 Basics definitions..................................................................................... 3
1.2.2 Graph matrices......................................................................................... 4
1.2.3 Real world graphs .................................................................................... 4
1.2.3.1 Social networks................................................................................. 5
1.2.3.2 Biological networks .......................................................................... 6
1.3 Elements of Community Detection................................................................. 6
1.3.1 Definitions of communities...................................................................... 6
1.3.1.1 Local definitions ............................................................................... 7
1.3.1.2 Global definitions.............................................................................. 7
1.3.1.3 Definitions based on vertex similarity .............................................. 7
1.3.2 Community structure................................................................................ 8
1.3.2.1 Basics................................................................................................ 8
1.3.2.2 Modularity......................................................................................... 8
1.3.4 Applications........................................................................................... 10
1.4 Approaches of Community Detection........................................................... 10
1.4.1 Approaches for non-overlapping community detection......................... 11
1.4.1.1 Graph partitioning ........................................................................... 11
1.4.1.2 Hierarchical clustering .................................................................... 11
1.4.1.3 Modularity optimization ................................................................. 12
1.4.2 Approaches for overlapping community detection ................................ 12
1.4.2.1 Link partitioning algorithm............................................................. 12
1.4.2.2 Clique based algorithms.................................................................. 13
1.4.2.3 Fuzzy algorithms............................................................................. 14
1.4.2.4 Local Expansion and Optimization Algorithms.............................. 15
1.4.2.5 Agent-based and dynamic algorithms............................................. 15
1.5 Conclusion .................................................................................................... 16
2 Meta-heuristics for Community detection............................................................ 17
2.1 Introduction................................................................................................... 17
2.2 Meta-heuristics.............................................................................................. 17
2.2.1 Meta-heuristics based unique solution................................................... 17
2.2.1.1 Simulated Annealing....................................................................... 17
2.2.1.2 Tabu search ..................................................................................... 18
2.2.2 Meta-heuristics based population of solutions....................................... 20
2.2.2.1 Evolutionary methods ..................................................................... 20
2.2.2.2 Swarm intelligence methods........................................................... 21
2.3 Firefly algorithm ........................................................................................... 25
2.3.1 Natural behaviors of fireflies ................................................................. 25
2.3.2 Firefly algorithm .................................................................................... 25
2.3.3 Light intensity and attractiveness........................................................... 26
2.4 Metaheuristics for community detection: The state of art ............................ 28
2.5 Conclusion .................................................................................................... 29
3 Proposed algorithms ............................................................................................... 30
3.1 Introduction................................................................................................... 30
3.2 Node-based algorithm................................................................................... 30
3.2.1 Generation of initial population ............................................................. 31
3.2.1.1 Representation of fireflies............................................................... 32
3.2.1.2 Initialization of fireflies population ................................................ 32
3.2.1.3 Extract community structures ......................................................... 32
3.2.2 Objective function.................................................................................. 33
3.2.3 Behavior of fireflies ................................................................................. 34
3.2.3.1 Light intensity and attractiveness.................................................... 34
3.2.3.2 Distance between two fireflies........................................................ 34
3.2.3.3 Movement strategy.......................................................................... 34
3.3 Link-based algorithm .................................................................................... 35
3.3.1 Phase 1: Link communities.................................................................... 36
3.3.1.1 Generation of an initial population ................................................. 36
3.3.1.2 Objective function........................................................................... 38
3.3.2 Phase 2: Nodes communities ................................................................. 39
3.4 Discussion ..................................................................................................... 40
3.5 Implementation ............................................................................................. 40
3.6 Conclusion .................................................................................................... 40
4 Experimentations and results ................................................................................ 42
4.1 Introduction................................................................................................... 42
4.2 Benchmarks................................................................................................... 42
4.2.1 Karate ..................................................................................................... 42
4.2.2 Dolphins................................................................................................. 43
4.2.3 Polbooks................................................................................................. 43
4.2.4 Football .................................................................................................. 43
4.3 Experimental results...................................................................................... 43
4.3.1 Node-based algorithm............................................................................ 43
4.3.2 Link-based algorithm ............................................................................. 45
4.4 Conclusion .................................................................................................... 45
General conclusion....................................................................................................... 46
Bibliography................................................................................................................. 48En ligne : https://drive.google.com/file/d/1rB18zShDjae3vvyJoYI2GtgyKjY7rw1G/view?usp=shari [...] Format de la ressource électronique : Utilisation de Firefly pour la détection de communautés [texte imprimé] / Chouarfa, Touba, Auteur ; KAMEL, N, Directeur de thèse . - [S.l.] : Setif:UFA, 2017 . - 1 vol (41f.) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Ingénierie des Données
Technologie Web
firefly
détection de communautésIndex. décimale : 004 - Informatique Résumé : Abstract
Empirical analysis of network data has been widely conducted for understanding and
predicting the structure and function of real systems and identifying interesting patterns and
anomalies. One of the most widely studied structural properties of networks is their
community structure. These structures become complex when communities overlap every
time. Many algorithms have been developed to detect such structures. In our dissertation,
we use firefly algorithm to discover community structures. Firefly algorithm is a metaheuristic, based on the light behavior of fireflies. The algorithms we propose generate a
division of the network into groups that contains adjacent elements, and optimize an
objective function that identify the brightest firefly in which the density of these elements
is higher. The space search is explored thanks to the dynamicity of fireflies, where the less
bright firefly move towards the brighter one. The experimentations on real world networks
show that the communities discovered by our approach have a good qualityNote de contenu : Contents
Abstract............................................................................................................................ i
Acknowledgements ........................................................................................................ ii
Contents......................................................................................................................... iii
List of figures................................................................................................................ vii
General introduction ..................................................................................................... 1
1 Community detection................................................................................................ 3
1.1 Introduction..................................................................................................... 3
1.2 Elements of graph theory ................................................................................ 3
1.2.1 Basics definitions..................................................................................... 3
1.2.2 Graph matrices......................................................................................... 4
1.2.3 Real world graphs .................................................................................... 4
1.2.3.1 Social networks................................................................................. 5
1.2.3.2 Biological networks .......................................................................... 6
1.3 Elements of Community Detection................................................................. 6
1.3.1 Definitions of communities...................................................................... 6
1.3.1.1 Local definitions ............................................................................... 7
1.3.1.2 Global definitions.............................................................................. 7
1.3.1.3 Definitions based on vertex similarity .............................................. 7
1.3.2 Community structure................................................................................ 8
1.3.2.1 Basics................................................................................................ 8
1.3.2.2 Modularity......................................................................................... 8
1.3.4 Applications........................................................................................... 10
1.4 Approaches of Community Detection........................................................... 10
1.4.1 Approaches for non-overlapping community detection......................... 11
1.4.1.1 Graph partitioning ........................................................................... 11
1.4.1.2 Hierarchical clustering .................................................................... 11
1.4.1.3 Modularity optimization ................................................................. 12
1.4.2 Approaches for overlapping community detection ................................ 12
1.4.2.1 Link partitioning algorithm............................................................. 12
1.4.2.2 Clique based algorithms.................................................................. 13
1.4.2.3 Fuzzy algorithms............................................................................. 14
1.4.2.4 Local Expansion and Optimization Algorithms.............................. 15
1.4.2.5 Agent-based and dynamic algorithms............................................. 15
1.5 Conclusion .................................................................................................... 16
2 Meta-heuristics for Community detection............................................................ 17
2.1 Introduction................................................................................................... 17
2.2 Meta-heuristics.............................................................................................. 17
2.2.1 Meta-heuristics based unique solution................................................... 17
2.2.1.1 Simulated Annealing....................................................................... 17
2.2.1.2 Tabu search ..................................................................................... 18
2.2.2 Meta-heuristics based population of solutions....................................... 20
2.2.2.1 Evolutionary methods ..................................................................... 20
2.2.2.2 Swarm intelligence methods........................................................... 21
2.3 Firefly algorithm ........................................................................................... 25
2.3.1 Natural behaviors of fireflies ................................................................. 25
2.3.2 Firefly algorithm .................................................................................... 25
2.3.3 Light intensity and attractiveness........................................................... 26
2.4 Metaheuristics for community detection: The state of art ............................ 28
2.5 Conclusion .................................................................................................... 29
3 Proposed algorithms ............................................................................................... 30
3.1 Introduction................................................................................................... 30
3.2 Node-based algorithm................................................................................... 30
3.2.1 Generation of initial population ............................................................. 31
3.2.1.1 Representation of fireflies............................................................... 32
3.2.1.2 Initialization of fireflies population ................................................ 32
3.2.1.3 Extract community structures ......................................................... 32
3.2.2 Objective function.................................................................................. 33
3.2.3 Behavior of fireflies ................................................................................. 34
3.2.3.1 Light intensity and attractiveness.................................................... 34
3.2.3.2 Distance between two fireflies........................................................ 34
3.2.3.3 Movement strategy.......................................................................... 34
3.3 Link-based algorithm .................................................................................... 35
3.3.1 Phase 1: Link communities.................................................................... 36
3.3.1.1 Generation of an initial population ................................................. 36
3.3.1.2 Objective function........................................................................... 38
3.3.2 Phase 2: Nodes communities ................................................................. 39
3.4 Discussion ..................................................................................................... 40
3.5 Implementation ............................................................................................. 40
3.6 Conclusion .................................................................................................... 40
4 Experimentations and results ................................................................................ 42
4.1 Introduction................................................................................................... 42
4.2 Benchmarks................................................................................................... 42
4.2.1 Karate ..................................................................................................... 42
4.2.2 Dolphins................................................................................................. 43
4.2.3 Polbooks................................................................................................. 43
4.2.4 Football .................................................................................................. 43
4.3 Experimental results...................................................................................... 43
4.3.1 Node-based algorithm............................................................................ 43
4.3.2 Link-based algorithm ............................................................................. 45
4.4 Conclusion .................................................................................................... 45
General conclusion....................................................................................................... 46
Bibliography................................................................................................................. 48En ligne : https://drive.google.com/file/d/1rB18zShDjae3vvyJoYI2GtgyKjY7rw1G/view?usp=shari [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0209 MAI/0209 Mémoire Bibliothéque des sciences Français Disponible
DisponibleUtilisation des méthodes formelles pour la vérification des systèmes interactifs / MOUFFOK, Reguia
PermalinkUtilisation de pso pour la localisation des capteurs / Annane,hadda
Permalink