Titre : |
Big data filtering using multithreading on high performance computing (HPC) |
Type de document : |
texte imprimé |
Auteurs : |
Sara Seghir ; Aya Yatoui ; Mohamed Haddadi, Directeur de thèse |
Editeur : |
Setif:UFA |
Année de publication : |
2023 |
Importance : |
1 vol. (65 f.) |
Format : |
29 cm |
Langues : |
Français (fre) |
Catégories : |
Thèses & Mémoires:Informatique
|
Mots-clés : |
Big data Multithreading High Performance Computing (HPC) Big Data filtering Mégadonnées Calcul haute performance (HPC) Filtrage du Big Data |
Index. décimale : |
004 Informatique |
Résumé : |
Big data refers to large, complex datasets that cannot be efficiently managed or analyzed using traditional data processing tools. It is characterized by its volume, velocity, and variety, representing the vast amount of data generated from diverse sources, the speed at which it is generated, and the different data formats and types. While Big Data offers valuable insights, it poses challenges such as storing, managing, and processing massive volumes of data within reasonable timeframes. Ensuring data quality, privacy, and security is also crucial. Traditional tools struggle with the complexity and heterogeneity of Big Data, necessitating innovative approaches and technologies to overcome these challenges. in this dissertation we propose a novel solution that leverages the power of Multithreading on High Performance Computing (HPC) infrastructure. By employing Multithreading on HPC, we aim to enable efficient and real-time analysis of large datasets. This approach allows for parallel processing, utilizing the computational resources of HPC systems to overcome the limitations of single-threaded processing on a single-core system, thereby enhancing the speed and scalability of Big Data filtering tasks = Les mégadonnées font référence à des ensembles de données volumineux et complexes qui ne peuvent pas être gérés ou analysés efficacement à l'aide d'outils de traitement de données traditionnels. Il se caractérise par son volume, sa vitesse et sa variété, représentant la grande quantité de données générées à partir de diverses sources, la vitesse à laquelle elles sont générées et les différents formats et types de données. Bien que le Big Data offre des informations précieuses, il pose des défis tels que le stockage, la gestion et le traitement de volumes massifs de données dans des délais raisonnables. Garantir la qualité, la confidentialité et la sécurité des données est également crucial. Les outils traditionnels sont confrontés à la complexité et à l'hétérogénéité des mégadonnées, ce qui nécessite des approches et des technologies innovantes pour surmonter ces défis. dans cette thèse, nous proposons une nouvelle solution qui tire parti de la puissance du multithreading sur une infrastructure de calcul haute performance (HPC). En utilisant le multithreading sur HPC, nous visent à permettre une analyse efficace et en temps réel de grands ensembles de données. Cette approche permet un traitement parallèle, en utilisant les ressources de calcul des systèmes HPC pour surmonter les limites du traitement à un seul thread sur un seul coeur système, améliorant ainsi la vitesse et l'évolutivité des tâches de filtrage du Big Data |
Côte titre : |
MAI/0750 |
En ligne : |
https://drive.google.com/file/d/1RCKtlRK7ErEr1SlN0BPD5d3z9o8xMkD3/view?usp=drive [...] |
Format de la ressource électronique : |
pdf |
Big data filtering using multithreading on high performance computing (HPC) [texte imprimé] / Sara Seghir ; Aya Yatoui ; Mohamed Haddadi, Directeur de thèse . - [S.l.] : Setif:UFA, 2023 . - 1 vol. (65 f.) ; 29 cm. Langues : Français ( fre)
Catégories : |
Thèses & Mémoires:Informatique
|
Mots-clés : |
Big data Multithreading High Performance Computing (HPC) Big Data filtering Mégadonnées Calcul haute performance (HPC) Filtrage du Big Data |
Index. décimale : |
004 Informatique |
Résumé : |
Big data refers to large, complex datasets that cannot be efficiently managed or analyzed using traditional data processing tools. It is characterized by its volume, velocity, and variety, representing the vast amount of data generated from diverse sources, the speed at which it is generated, and the different data formats and types. While Big Data offers valuable insights, it poses challenges such as storing, managing, and processing massive volumes of data within reasonable timeframes. Ensuring data quality, privacy, and security is also crucial. Traditional tools struggle with the complexity and heterogeneity of Big Data, necessitating innovative approaches and technologies to overcome these challenges. in this dissertation we propose a novel solution that leverages the power of Multithreading on High Performance Computing (HPC) infrastructure. By employing Multithreading on HPC, we aim to enable efficient and real-time analysis of large datasets. This approach allows for parallel processing, utilizing the computational resources of HPC systems to overcome the limitations of single-threaded processing on a single-core system, thereby enhancing the speed and scalability of Big Data filtering tasks = Les mégadonnées font référence à des ensembles de données volumineux et complexes qui ne peuvent pas être gérés ou analysés efficacement à l'aide d'outils de traitement de données traditionnels. Il se caractérise par son volume, sa vitesse et sa variété, représentant la grande quantité de données générées à partir de diverses sources, la vitesse à laquelle elles sont générées et les différents formats et types de données. Bien que le Big Data offre des informations précieuses, il pose des défis tels que le stockage, la gestion et le traitement de volumes massifs de données dans des délais raisonnables. Garantir la qualité, la confidentialité et la sécurité des données est également crucial. Les outils traditionnels sont confrontés à la complexité et à l'hétérogénéité des mégadonnées, ce qui nécessite des approches et des technologies innovantes pour surmonter ces défis. dans cette thèse, nous proposons une nouvelle solution qui tire parti de la puissance du multithreading sur une infrastructure de calcul haute performance (HPC). En utilisant le multithreading sur HPC, nous visent à permettre une analyse efficace et en temps réel de grands ensembles de données. Cette approche permet un traitement parallèle, en utilisant les ressources de calcul des systèmes HPC pour surmonter les limites du traitement à un seul thread sur un seul coeur système, améliorant ainsi la vitesse et l'évolutivité des tâches de filtrage du Big Data |
Côte titre : |
MAI/0750 |
En ligne : |
https://drive.google.com/file/d/1RCKtlRK7ErEr1SlN0BPD5d3z9o8xMkD3/view?usp=drive [...] |
Format de la ressource électronique : |
pdf |
|