University Sétif 1 FERHAT ABBAS Faculty of Sciences
Détail de l'auteur
Auteur ZENBOUT,Imene |
Documents disponibles écrits par cet auteur
Ajouter le résultat dans votre panier Affiner la recherche
Titre : Approche bioinspere pour l’extraction des connaissances dans les big data Type de document : texte imprimé Auteurs : ZENBOUT,Imene ; A Moussaoui, Directeur de thèse Editeur : Setif:UFA Année de publication : 2016 Importance : 1 vol (72f.) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Big data, data analytics, bioinformatique, ADN, metaheuristiues, NP-Hard,
problem, Assemblage des fragment d’ADNIndex. décimale : 004 Informatique Résumé : résumé
Les Big data sont devenues le maitre et le contrôleur des deux mondes réel et digitale, l’explosion dans les données amènent des bénéfices ainsi que des défis, parmi ces
défis c’est comment peut’ on extraire des connaissances d’après ces données?. le bioinformatiques et la fragmentation d’ADN sont considérés maintenant parmi les sources
principales de la génération des données et pour le besoin de l’extraction des connaissance de ces données, il faut de les formuler comme des problèmes NP-hard pour les
résoudre avec des metaheuristiques. Pour ces raisons nous avons proposé un algorithm
bio inspirés basé sur l’algorithme des penguins pour traiter l’exemple de l’assemblage
des fragments d’ADN.
Note de contenu : Contents
1 Big Data:Background 3
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Getting Started . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.1 Toward big data . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 What is Big Data? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4 Big data characteristics . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4.1 Volume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4.2 Variety . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4.3 Velocity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4.4 Value . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4.5 Veracity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4.6 Variability . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5 Related Technologies . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5.1 Cloud Computing . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5.2 Internet of Thing . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5.3 Hadoop/MapReduce . . . . . . . . . . . . . . . . . . . . . . . . 11
1.6 Big data analytic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.6.1 Data Collection . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.6.2 Data Storage . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.6.3 Data Processing . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.6.4 Data Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.6.5 Data Visualization . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.7 Big data impact . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.7.1 Big data and Retail industry . . . . . . . . . . . . . . . . . . . . 18
1.7.2 Big data and Healthcare . . . . . . . . . . . . . . . . . . . . . . 18
1.7.3 Big data and Biology . . . . . . . . . . . . . . . . . . . . . . . 19
1.8 Big data Challenges . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.8.1 Big Data Challenges . . . . . . . . . . . . . . . . . . . . . . . . 21
1.9 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2 Combinatorial Optimization Problem 24
2.1 Combinatorial Optimization . . . . . . . . . . . . . . . . . . . . . . . . 24
2.1.1 Combinatorial Optimization Problem . . . . . . . . . . . . . . . 24
2.1.2 Problems Classification . . . . . . . . . . . . . . . . . . . . . . . 25
2.1.3 Combinatorial optimization methods . . . . . . . . . . . . . . . 26
2.2 Metaheuristics and bioinspiration to resolve COP . . . . . . . . . . . . 28
2.2.1 Bioinspired Optimality Search algorithms . . . . . . . . . . . . . 29
3 Biological Knowledge Discovery:DNA fragment Assembly 35
3.1 DNA structure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.2 Overview on Genome Sequencing . . . . . . . . . . . . . . . . . . . . . 36
3.3 DNA Fragment Assembly . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.4 Bioinspired approachs for DFA problem . . . . . . . . . . . . . . . . . 38
3.4.1 Genetic Algorithm in DFA problem . . . . . . . . . . . . . . . . 38
3.4.2 Swarm intelligence for DFA problem . . . . . . . . . . . . . . . 39
3.4.3 Cuckoo Search for DFA problem . . . . . . . . . . . . . . . . . . 39
3.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4 Contribution 40
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.2 Proposed Approach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.2.1 DFA problem formulation . . . . . . . . . . . . . . . . . . . . . 40
4.2.2 Penguin search optimization algorithm for DFA . . . . . . . . . 41
4.2.3 Overlap Graph based on PeSOA for DNA fragment assembly
problem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.3 Conception . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.3.1 Use-Cases Diagram . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.3.2 StateChart diagram . . . . . . . . . . . . . . . . . . . . . . . . 52
4.3.3 Classes Diagram . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.4 Realisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.4.1 tools and methods . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.4.2 Implementation . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.4.3 Experimental Result . . . . . . . . . . . . . . . . . . . . . . . . 58
4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Bibliography 65Côte titre : MAI/0097 En ligne : https://drive.google.com/file/d/1gmA18QtMFFN762RWASIi4A0XB5WgW99R/view?usp=shari [...] Format de la ressource électronique : Approche bioinspere pour l’extraction des connaissances dans les big data [texte imprimé] / ZENBOUT,Imene ; A Moussaoui, Directeur de thèse . - [S.l.] : Setif:UFA, 2016 . - 1 vol (72f.) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Big data, data analytics, bioinformatique, ADN, metaheuristiues, NP-Hard,
problem, Assemblage des fragment d’ADNIndex. décimale : 004 Informatique Résumé : résumé
Les Big data sont devenues le maitre et le contrôleur des deux mondes réel et digitale, l’explosion dans les données amènent des bénéfices ainsi que des défis, parmi ces
défis c’est comment peut’ on extraire des connaissances d’après ces données?. le bioinformatiques et la fragmentation d’ADN sont considérés maintenant parmi les sources
principales de la génération des données et pour le besoin de l’extraction des connaissance de ces données, il faut de les formuler comme des problèmes NP-hard pour les
résoudre avec des metaheuristiques. Pour ces raisons nous avons proposé un algorithm
bio inspirés basé sur l’algorithme des penguins pour traiter l’exemple de l’assemblage
des fragments d’ADN.
Note de contenu : Contents
1 Big Data:Background 3
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Getting Started . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.1 Toward big data . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 What is Big Data? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4 Big data characteristics . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4.1 Volume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4.2 Variety . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4.3 Velocity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4.4 Value . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4.5 Veracity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4.6 Variability . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5 Related Technologies . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5.1 Cloud Computing . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5.2 Internet of Thing . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5.3 Hadoop/MapReduce . . . . . . . . . . . . . . . . . . . . . . . . 11
1.6 Big data analytic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.6.1 Data Collection . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.6.2 Data Storage . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.6.3 Data Processing . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.6.4 Data Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.6.5 Data Visualization . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.7 Big data impact . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.7.1 Big data and Retail industry . . . . . . . . . . . . . . . . . . . . 18
1.7.2 Big data and Healthcare . . . . . . . . . . . . . . . . . . . . . . 18
1.7.3 Big data and Biology . . . . . . . . . . . . . . . . . . . . . . . 19
1.8 Big data Challenges . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.8.1 Big Data Challenges . . . . . . . . . . . . . . . . . . . . . . . . 21
1.9 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2 Combinatorial Optimization Problem 24
2.1 Combinatorial Optimization . . . . . . . . . . . . . . . . . . . . . . . . 24
2.1.1 Combinatorial Optimization Problem . . . . . . . . . . . . . . . 24
2.1.2 Problems Classification . . . . . . . . . . . . . . . . . . . . . . . 25
2.1.3 Combinatorial optimization methods . . . . . . . . . . . . . . . 26
2.2 Metaheuristics and bioinspiration to resolve COP . . . . . . . . . . . . 28
2.2.1 Bioinspired Optimality Search algorithms . . . . . . . . . . . . . 29
3 Biological Knowledge Discovery:DNA fragment Assembly 35
3.1 DNA structure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.2 Overview on Genome Sequencing . . . . . . . . . . . . . . . . . . . . . 36
3.3 DNA Fragment Assembly . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.4 Bioinspired approachs for DFA problem . . . . . . . . . . . . . . . . . 38
3.4.1 Genetic Algorithm in DFA problem . . . . . . . . . . . . . . . . 38
3.4.2 Swarm intelligence for DFA problem . . . . . . . . . . . . . . . 39
3.4.3 Cuckoo Search for DFA problem . . . . . . . . . . . . . . . . . . 39
3.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4 Contribution 40
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.2 Proposed Approach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.2.1 DFA problem formulation . . . . . . . . . . . . . . . . . . . . . 40
4.2.2 Penguin search optimization algorithm for DFA . . . . . . . . . 41
4.2.3 Overlap Graph based on PeSOA for DNA fragment assembly
problem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.3 Conception . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.3.1 Use-Cases Diagram . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.3.2 StateChart diagram . . . . . . . . . . . . . . . . . . . . . . . . 52
4.3.3 Classes Diagram . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.4 Realisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.4.1 tools and methods . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.4.2 Implementation . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.4.3 Experimental Result . . . . . . . . . . . . . . . . . . . . . . . . 58
4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Bibliography 65Côte titre : MAI/0097 En ligne : https://drive.google.com/file/d/1gmA18QtMFFN762RWASIi4A0XB5WgW99R/view?usp=shari [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0097 MAI/0097 Mémoire Bibliothéque des sciences Français Disponible
Disponible