University Sétif 1 FERHAT ABBAS Faculty of Sciences
Détail de l'auteur
Auteur Aya Yatoui |
Documents disponibles écrits par cet auteur
Ajouter le résultat dans votre panier Affiner la recherche
Titre : Big data filtering using multithreading on high performance computing (HPC) Type de document : texte imprimé Auteurs : Sara Seghir ; Aya Yatoui ; Mohamed Haddadi, Directeur de thèse Editeur : Setif:UFA Année de publication : 2023 Importance : 1 vol. (65 f.) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Big data Multithreading High Performance Computing (HPC) Big Data filtering Mégadonnées Calcul haute performance (HPC) Filtrage du Big Data Index. décimale : 004 Informatique Résumé : Big data refers to large, complex datasets that cannot be efficiently managed or analyzed using traditional data processing tools. It is characterized by its volume, velocity, and variety, representing the vast amount of data generated from diverse sources, the speed at which it is generated, and the different data formats and types. While Big Data offers valuable insights, it poses challenges such as storing, managing, and processing massive volumes of data within reasonable timeframes. Ensuring data quality, privacy, and security is also crucial. Traditional tools struggle with the complexity and heterogeneity of Big Data, necessitating innovative approaches and technologies to overcome these challenges. in this dissertation we propose a novel solution that leverages the power of Multithreading on High Performance Computing (HPC) infrastructure. By employing Multithreading on HPC, we aim to enable efficient and real-time analysis of large datasets. This approach allows for parallel processing, utilizing the computational resources of HPC systems to overcome the limitations of single-threaded processing on a single-core system, thereby enhancing the speed and scalability of Big Data filtering tasks = Les mégadonnées font référence à des ensembles de données volumineux et complexes qui ne peuvent pas être gérés ou analysés efficacement à l'aide d'outils de traitement de données traditionnels. Il se caractérise par son volume, sa vitesse et sa variété, représentant la grande quantité de données générées à partir de diverses sources, la vitesse à laquelle elles sont générées et les différents formats et types de données. Bien que le Big Data offre des informations précieuses, il pose des défis tels que le stockage, la gestion et le traitement de volumes massifs de données dans des délais raisonnables. Garantir la qualité, la confidentialité et la sécurité des données est également crucial. Les outils traditionnels sont confrontés à la complexité et à l'hétérogénéité des mégadonnées, ce qui nécessite des approches et des technologies innovantes pour surmonter ces défis. dans cette thèse, nous proposons une nouvelle solution qui tire parti de la puissance du multithreading sur une infrastructure de calcul haute performance (HPC). En utilisant le multithreading sur HPC, nous visent à permettre une analyse efficace et en temps réel de grands ensembles de données. Cette approche permet un traitement parallèle, en utilisant les ressources de calcul des systèmes HPC pour surmonter les limites du traitement à un seul thread sur un seul coeur système, améliorant ainsi la vitesse et l'évolutivité des tâches de filtrage du Big Data Côte titre : MAI/0750 En ligne : https://drive.google.com/file/d/1RCKtlRK7ErEr1SlN0BPD5d3z9o8xMkD3/view?usp=drive [...] Format de la ressource électronique : Big data filtering using multithreading on high performance computing (HPC) [texte imprimé] / Sara Seghir ; Aya Yatoui ; Mohamed Haddadi, Directeur de thèse . - [S.l.] : Setif:UFA, 2023 . - 1 vol. (65 f.) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Big data Multithreading High Performance Computing (HPC) Big Data filtering Mégadonnées Calcul haute performance (HPC) Filtrage du Big Data Index. décimale : 004 Informatique Résumé : Big data refers to large, complex datasets that cannot be efficiently managed or analyzed using traditional data processing tools. It is characterized by its volume, velocity, and variety, representing the vast amount of data generated from diverse sources, the speed at which it is generated, and the different data formats and types. While Big Data offers valuable insights, it poses challenges such as storing, managing, and processing massive volumes of data within reasonable timeframes. Ensuring data quality, privacy, and security is also crucial. Traditional tools struggle with the complexity and heterogeneity of Big Data, necessitating innovative approaches and technologies to overcome these challenges. in this dissertation we propose a novel solution that leverages the power of Multithreading on High Performance Computing (HPC) infrastructure. By employing Multithreading on HPC, we aim to enable efficient and real-time analysis of large datasets. This approach allows for parallel processing, utilizing the computational resources of HPC systems to overcome the limitations of single-threaded processing on a single-core system, thereby enhancing the speed and scalability of Big Data filtering tasks = Les mégadonnées font référence à des ensembles de données volumineux et complexes qui ne peuvent pas être gérés ou analysés efficacement à l'aide d'outils de traitement de données traditionnels. Il se caractérise par son volume, sa vitesse et sa variété, représentant la grande quantité de données générées à partir de diverses sources, la vitesse à laquelle elles sont générées et les différents formats et types de données. Bien que le Big Data offre des informations précieuses, il pose des défis tels que le stockage, la gestion et le traitement de volumes massifs de données dans des délais raisonnables. Garantir la qualité, la confidentialité et la sécurité des données est également crucial. Les outils traditionnels sont confrontés à la complexité et à l'hétérogénéité des mégadonnées, ce qui nécessite des approches et des technologies innovantes pour surmonter ces défis. dans cette thèse, nous proposons une nouvelle solution qui tire parti de la puissance du multithreading sur une infrastructure de calcul haute performance (HPC). En utilisant le multithreading sur HPC, nous visent à permettre une analyse efficace et en temps réel de grands ensembles de données. Cette approche permet un traitement parallèle, en utilisant les ressources de calcul des systèmes HPC pour surmonter les limites du traitement à un seul thread sur un seul coeur système, améliorant ainsi la vitesse et l'évolutivité des tâches de filtrage du Big Data Côte titre : MAI/0750 En ligne : https://drive.google.com/file/d/1RCKtlRK7ErEr1SlN0BPD5d3z9o8xMkD3/view?usp=drive [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0750 MAI/0750 Mémoire Bibliothéque des sciences Anglais Disponible
Disponible