University Sétif 1 FERHAT ABBAS Faculty of Sciences
Détail de l'auteur
Auteur Driai, Noor El Imene |
Documents disponibles écrits par cet auteur
Ajouter le résultat dans votre panier Affiner la recherche
Titre : Analyse des Données Génomiques Massives Type de document : texte imprimé Auteurs : Driai, Noor El Imene, Auteur ; NasriI,Khaled, Directeur de thèse Editeur : Setif:UFA Année de publication : 2018 Importance : 1 vol (58 f .) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Big Data Analytics
Infrastructure Big Data
Analyse avancéeIndex. décimale : 004 - Informatique Résumé : Résumé
Les progrès récents des technologies de séquençage de l’ADN (séquençage de nouvelle génération) ont réduit le temps de séquençage du génome humain de plusieurs semaines à quelques heures et le coût du séquençage d’un génome humain de plusieurs millions de dollars à mille dollars. En raison de cette baisse des coûts, une grande quantité de données génomiques est produite. Cette quantité de données génomiques disponibles a permis l’établissement de projets de données de séquençage à grande échelle et l’application des techniques d’analyse de données massives dans le domaine de la génomique.
Récemment, la science du Big Data a été un sujet d'actualité dans le monde scientifique, industriel et commercial. Les sciences de la santé et les sciences biomédicales sont devenues rapidement intensives en données car les enquêteurs génèrent et utilisent de grands ensembles de données spécifiques aux domaines, complexes, de grande dimension et diversifiés. L'analyse des données volumineuses permet de découvrir des modèles cachés, des corrélations inconnues et d'autres informations en examinant divers ensembles de données à grande échelle.
Cette thèse introduit une analyse des données génomiques et est structurée comme suit:
 La première partie de cette thèse, représentant des informations générales sur le génome humain et les données de séquençage de l'ADN. Nous examinons les défis posés par les données génomiques ainsi que l'analyse des données génomiques et cliniques. Nous introduisons le développement futur de l'analyse des données génomiques, la gestion et l'analyse des données génomiques et cliniques pour mettre en œuvre la médecine génomique.
 La seconde partie aborde les problèmes et défis posés par plusieurs problèmes de données massives en bioinformatique et donne un aperçu de l'état de l'art et des possibilités de recherche futures.
 La dernière partie montre comment utiliser les outils ADAM pour analyser de grandes données génomiques.Note de contenu :
Sommaire
1 Introduction ................................................................................................................... 3
2 Genetic material composition of Genome ......................................................................................... 4
2.1 Human Genome ........................................................................................................................4
2.2 Genome sequencing: .................................................................................................................5
2.2.1 The importance of Genome sequencing: ............................................................................. 6
2.2.2 DNA Sequencing Technologies .......................................................................................... 6
3 Genomic Data .................................................................................................................................. 8
3.1 Data ..........................................................................................................................................8
3.1.1 Definition ........................................................................................................................... 8
3.2 Genomic ...................................................................................................................................8
3.2.1 Definition ........................................................................................................................... 8
3.2.2 Genomics Analysis Techniques .......................................................................................... 8
3.3 Genomic Data ...........................................................................................................................9
3.3.1 Genomic Data Resources: Challenges and Promises ........................................................... 9
3.3.2 Security of Genomic Data ................................................................................................. 11
3.3.3 Analysis of Genomic Data ................................................................................................ 11
3.3.4 Statistical Analysis of Genomic Data ................................................................................ 13
4 Analysis of Genomic and Clinical Data .......................................................................................... 13
5 Future development in genomic data analysis ................................................................................. 14
6 Conclusion ................................................................................................................ 15
CHAPITRE II
1 Introduction ............................................................................................................ 17
2 Big Data ............................................................................................................... 18
2.1 Definition ............................................................................................................... 18
2.1.1 Applications of Big Data: ................................................................................................. 18
3 Data Science .................................................................................................................................. 19
3.1 Applications of Data Science ................................................................................................... 19
4 Data Analytic ................................................................................................................................. 19
4.1 Applications of Data Analytic: ................................................................................................ 20
5 HADOOP Architecture .................................................................................................................. 19
5.1 Introduction to HADOOP ........................................................................................................ 20
5.2 HADOOP Attributes .............................................................................................................. 20
5.3 HADOOP Components ........................................................................................................... 21
5.3.1 Hadoop Distributed File System - HDFS .......................................................................... 21
5.3.2 MapReduce ..................................................................................................................... 22
6 BIG Data Allied Technologies ....................................................................................................... 22
6.1 NoSQL DataBse ...................................................................................................................... 22
6.2 Cloud Computing .................................................................................................................... 23
6.2.1 Reasons to consider cloud computing ............................................................................... 24
6.2.2 Challenges with cloud computing ..................................................................................... 24
7 Bioinformatics ............................................................................................................................... 24
8 Big Data In Bioinformatics ............................................................................................................ 24
8.1 Introduction............................................................................................................................. 24
8.2 Types of big data in bioinformatics .......................................................................................... 25
8.3 Big data problems in bioinformatics ........................................................................................ 26
8.3.1 Microarray data analysis ................................................................................................... 26
8.3.2 Gene-gene network analysis ............................................................................................. 26
8.3.3 PPI data analysis............................................................................................................... 26
8.3.4 Sequence analysis ............................................................................................................. 27
9 Tools for Big Data Analytics in Bioinformatics .............................................................................. 27
9.1 Tools for microarray data analysis ........................................................................................... 27
9.2 Tools for gene-gene network analysis ...................................................................................... 28
9.3 Tools for PPI data analysis ...................................................................................................... 28
9.4 Tools for sequence analysis ..................................................................................................... 28
10 Big Data Analytics in Genomic Studies ........................................................................................ 28
10.1 NGS Read Alignment ............................................................................................................ 28
10.2 Calling Variants .................................................................................................................... 29
11 Big Data Analytics in Health Research ......................................................................................... 29
11.1 Health Informatics ................................................................................................................. 30
11.2 Medical Imaging Analysis ..................................................................................................... 30
12 Challenges and issues in BIG DATA analytics ............................................................................. 31
12.1 Challenges in big data analytics ............................................................................................. 31
12.1 Issues in big data Analytics ................................................................................................... 31
13 Conclusion ................................................................................................................................... 32
CHAPITRE III
1 Introduction .............................................................................................................. 34
2 ADAM ......................................................................................................................... 35
2.1 Introduction............................................................................................................................. 35
2.2 The reason of choosing ADAM ............................................................................................... 35
2.3 The ADAM/Big Data Genomics Ecosystem ............................................................................ 36
3 Architecture Overview ................................................................................................................... 37
4 ADAM Tools ................................................................................................................................. 38
4.1 Apache Maven ........................................................................................................................ 38
4.1.1 Introduction ...................................................................................................................... 38
4.1.2 Maven’s Objectives .......................................................................................................... 38
4.2 Apache spark ..................................................................................................................... 38
4.3 Apache HADOOP ................................................................................................................... 39
5 Installation of tools ............................................................................................................ 39
6 Genome analysis with ADAM ...............................................................................................39
6.1 Data base ................................................................................................................... 40
6.2 The ADAM Data Format ......................................................................................................... 41
6.3 Genome Visualization ............................................................................................................. 42
6.4 Interactive Analysis ................................................................................................................. 42
7 Conclusion ...................................................................................................................... 44
ANNEX.............................................................................................................................. 44
CONCUSION ................................................................................................................................... 53
REFERENCES .................................................................................................................................Côte titre : MAI/0269 En ligne : https://drive.google.com/file/d/142pxVun7mHGRup6wUHWzLhbvV9zS9bQR/view?usp=shari [...] Format de la ressource électronique : Analyse des Données Génomiques Massives [texte imprimé] / Driai, Noor El Imene, Auteur ; NasriI,Khaled, Directeur de thèse . - [S.l.] : Setif:UFA, 2018 . - 1 vol (58 f .) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Big Data Analytics
Infrastructure Big Data
Analyse avancéeIndex. décimale : 004 - Informatique Résumé : Résumé
Les progrès récents des technologies de séquençage de l’ADN (séquençage de nouvelle génération) ont réduit le temps de séquençage du génome humain de plusieurs semaines à quelques heures et le coût du séquençage d’un génome humain de plusieurs millions de dollars à mille dollars. En raison de cette baisse des coûts, une grande quantité de données génomiques est produite. Cette quantité de données génomiques disponibles a permis l’établissement de projets de données de séquençage à grande échelle et l’application des techniques d’analyse de données massives dans le domaine de la génomique.
Récemment, la science du Big Data a été un sujet d'actualité dans le monde scientifique, industriel et commercial. Les sciences de la santé et les sciences biomédicales sont devenues rapidement intensives en données car les enquêteurs génèrent et utilisent de grands ensembles de données spécifiques aux domaines, complexes, de grande dimension et diversifiés. L'analyse des données volumineuses permet de découvrir des modèles cachés, des corrélations inconnues et d'autres informations en examinant divers ensembles de données à grande échelle.
Cette thèse introduit une analyse des données génomiques et est structurée comme suit:
 La première partie de cette thèse, représentant des informations générales sur le génome humain et les données de séquençage de l'ADN. Nous examinons les défis posés par les données génomiques ainsi que l'analyse des données génomiques et cliniques. Nous introduisons le développement futur de l'analyse des données génomiques, la gestion et l'analyse des données génomiques et cliniques pour mettre en œuvre la médecine génomique.
 La seconde partie aborde les problèmes et défis posés par plusieurs problèmes de données massives en bioinformatique et donne un aperçu de l'état de l'art et des possibilités de recherche futures.
 La dernière partie montre comment utiliser les outils ADAM pour analyser de grandes données génomiques.Note de contenu :
Sommaire
1 Introduction ................................................................................................................... 3
2 Genetic material composition of Genome ......................................................................................... 4
2.1 Human Genome ........................................................................................................................4
2.2 Genome sequencing: .................................................................................................................5
2.2.1 The importance of Genome sequencing: ............................................................................. 6
2.2.2 DNA Sequencing Technologies .......................................................................................... 6
3 Genomic Data .................................................................................................................................. 8
3.1 Data ..........................................................................................................................................8
3.1.1 Definition ........................................................................................................................... 8
3.2 Genomic ...................................................................................................................................8
3.2.1 Definition ........................................................................................................................... 8
3.2.2 Genomics Analysis Techniques .......................................................................................... 8
3.3 Genomic Data ...........................................................................................................................9
3.3.1 Genomic Data Resources: Challenges and Promises ........................................................... 9
3.3.2 Security of Genomic Data ................................................................................................. 11
3.3.3 Analysis of Genomic Data ................................................................................................ 11
3.3.4 Statistical Analysis of Genomic Data ................................................................................ 13
4 Analysis of Genomic and Clinical Data .......................................................................................... 13
5 Future development in genomic data analysis ................................................................................. 14
6 Conclusion ................................................................................................................ 15
CHAPITRE II
1 Introduction ............................................................................................................ 17
2 Big Data ............................................................................................................... 18
2.1 Definition ............................................................................................................... 18
2.1.1 Applications of Big Data: ................................................................................................. 18
3 Data Science .................................................................................................................................. 19
3.1 Applications of Data Science ................................................................................................... 19
4 Data Analytic ................................................................................................................................. 19
4.1 Applications of Data Analytic: ................................................................................................ 20
5 HADOOP Architecture .................................................................................................................. 19
5.1 Introduction to HADOOP ........................................................................................................ 20
5.2 HADOOP Attributes .............................................................................................................. 20
5.3 HADOOP Components ........................................................................................................... 21
5.3.1 Hadoop Distributed File System - HDFS .......................................................................... 21
5.3.2 MapReduce ..................................................................................................................... 22
6 BIG Data Allied Technologies ....................................................................................................... 22
6.1 NoSQL DataBse ...................................................................................................................... 22
6.2 Cloud Computing .................................................................................................................... 23
6.2.1 Reasons to consider cloud computing ............................................................................... 24
6.2.2 Challenges with cloud computing ..................................................................................... 24
7 Bioinformatics ............................................................................................................................... 24
8 Big Data In Bioinformatics ............................................................................................................ 24
8.1 Introduction............................................................................................................................. 24
8.2 Types of big data in bioinformatics .......................................................................................... 25
8.3 Big data problems in bioinformatics ........................................................................................ 26
8.3.1 Microarray data analysis ................................................................................................... 26
8.3.2 Gene-gene network analysis ............................................................................................. 26
8.3.3 PPI data analysis............................................................................................................... 26
8.3.4 Sequence analysis ............................................................................................................. 27
9 Tools for Big Data Analytics in Bioinformatics .............................................................................. 27
9.1 Tools for microarray data analysis ........................................................................................... 27
9.2 Tools for gene-gene network analysis ...................................................................................... 28
9.3 Tools for PPI data analysis ...................................................................................................... 28
9.4 Tools for sequence analysis ..................................................................................................... 28
10 Big Data Analytics in Genomic Studies ........................................................................................ 28
10.1 NGS Read Alignment ............................................................................................................ 28
10.2 Calling Variants .................................................................................................................... 29
11 Big Data Analytics in Health Research ......................................................................................... 29
11.1 Health Informatics ................................................................................................................. 30
11.2 Medical Imaging Analysis ..................................................................................................... 30
12 Challenges and issues in BIG DATA analytics ............................................................................. 31
12.1 Challenges in big data analytics ............................................................................................. 31
12.1 Issues in big data Analytics ................................................................................................... 31
13 Conclusion ................................................................................................................................... 32
CHAPITRE III
1 Introduction .............................................................................................................. 34
2 ADAM ......................................................................................................................... 35
2.1 Introduction............................................................................................................................. 35
2.2 The reason of choosing ADAM ............................................................................................... 35
2.3 The ADAM/Big Data Genomics Ecosystem ............................................................................ 36
3 Architecture Overview ................................................................................................................... 37
4 ADAM Tools ................................................................................................................................. 38
4.1 Apache Maven ........................................................................................................................ 38
4.1.1 Introduction ...................................................................................................................... 38
4.1.2 Maven’s Objectives .......................................................................................................... 38
4.2 Apache spark ..................................................................................................................... 38
4.3 Apache HADOOP ................................................................................................................... 39
5 Installation of tools ............................................................................................................ 39
6 Genome analysis with ADAM ...............................................................................................39
6.1 Data base ................................................................................................................... 40
6.2 The ADAM Data Format ......................................................................................................... 41
6.3 Genome Visualization ............................................................................................................. 42
6.4 Interactive Analysis ................................................................................................................. 42
7 Conclusion ...................................................................................................................... 44
ANNEX.............................................................................................................................. 44
CONCUSION ................................................................................................................................... 53
REFERENCES .................................................................................................................................Côte titre : MAI/0269 En ligne : https://drive.google.com/file/d/142pxVun7mHGRup6wUHWzLhbvV9zS9bQR/view?usp=shari [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0269 MAI/0269 Mémoire Bibliothéque des sciences Français Disponible
Disponible