University Sétif 1 FERHAT ABBAS Faculty of Sciences
Détail de l'auteur
Auteur Harrag, Fouz |
Documents disponibles écrits par cet auteur
Ajouter le résultat dans votre panier Affiner la recherche
Titre : Fighting Arabic deep fake text Type de document : texte imprimé Auteurs : Debbah,Maria, Auteur ; Harrag, Fouz, Directeur de thèse Editeur : Setif:UFA Année de publication : 2020 Importance : 1 vol (57 f .) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : brofond Faux Texte
Détection de texte généré automatiquement
langue arabe
Médias
sociaux, AraBERT, GPT2.Index. décimale : 004 Informatique Résumé :
Au cours des deux dernières décennies, nous nous sommes progressivement
tournés vers Internet et les médias sociaux pour trouver des nouvelles, entretenir
des conversations et partager des opinions. Récemment, OpenAI a développé
un système d’apprentissage automatique appelé GPT-2 pour Transformateur préentraîné
génératif-2; il est également connu sous le nom de faux profonds pour le
texte. Cet outil peut générer des blocs de texte basés sur de brèves invites d’écriture
qui semblent avoir été écrites par des humains, ce qui facilite désormais la diffusion
de fausses informations. Dans le prolongement de ces progrès, et afin de contrer
les dangers potentiels, plusieurs méthodes ont été proposées pour détecter les textes
écrits par ces modèles de langage. Dans cet article, nous proposons un modèle basé
sur l’apprentissage par transfert qui sera capable de détecter si une phrase arabe est
écrite par des humains ou automatiquement générée par des bots. Notre phrase 7k
a été collectée en utilisant l’API Twitter pour collecter des tweets manuels et GPT2-
Small-Arabic pour générer des phrases arabes. Afin d’évaluer notre modèle, différents
modèles basés sur des imbrications de mots de réseaux neuronaux récurrents (RNN)
ont été utilisés: LSTM, BI-LSTM, GRU et BI-GRU. Notre nouveau modèle combiné
d’apprentissage par transfert a obtenu une précision allant jusqu’à 98 %. À notre
connaissance, ce travail est la première étude où ARABERT et gpt2 ont été combinés
pour détecter et classer les textes arabes auto-générés.Côte titre : MAI/0344 En ligne : https://drive.google.com/file/d/15fV5VuWfFPx-2A4ZZwNFXOS5uy0vQSxI/view?usp=share [...] Format de la ressource électronique : Fighting Arabic deep fake text [texte imprimé] / Debbah,Maria, Auteur ; Harrag, Fouz, Directeur de thèse . - [S.l.] : Setif:UFA, 2020 . - 1 vol (57 f .) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : brofond Faux Texte
Détection de texte généré automatiquement
langue arabe
Médias
sociaux, AraBERT, GPT2.Index. décimale : 004 Informatique Résumé :
Au cours des deux dernières décennies, nous nous sommes progressivement
tournés vers Internet et les médias sociaux pour trouver des nouvelles, entretenir
des conversations et partager des opinions. Récemment, OpenAI a développé
un système d’apprentissage automatique appelé GPT-2 pour Transformateur préentraîné
génératif-2; il est également connu sous le nom de faux profonds pour le
texte. Cet outil peut générer des blocs de texte basés sur de brèves invites d’écriture
qui semblent avoir été écrites par des humains, ce qui facilite désormais la diffusion
de fausses informations. Dans le prolongement de ces progrès, et afin de contrer
les dangers potentiels, plusieurs méthodes ont été proposées pour détecter les textes
écrits par ces modèles de langage. Dans cet article, nous proposons un modèle basé
sur l’apprentissage par transfert qui sera capable de détecter si une phrase arabe est
écrite par des humains ou automatiquement générée par des bots. Notre phrase 7k
a été collectée en utilisant l’API Twitter pour collecter des tweets manuels et GPT2-
Small-Arabic pour générer des phrases arabes. Afin d’évaluer notre modèle, différents
modèles basés sur des imbrications de mots de réseaux neuronaux récurrents (RNN)
ont été utilisés: LSTM, BI-LSTM, GRU et BI-GRU. Notre nouveau modèle combiné
d’apprentissage par transfert a obtenu une précision allant jusqu’à 98 %. À notre
connaissance, ce travail est la première étude où ARABERT et gpt2 ont été combinés
pour détecter et classer les textes arabes auto-générés.Côte titre : MAI/0344 En ligne : https://drive.google.com/file/d/15fV5VuWfFPx-2A4ZZwNFXOS5uy0vQSxI/view?usp=share [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0344 MAI/0344 Mémoire Bibliothéque des sciences Français Disponible
Disponible
Titre : Mining software repositories to recommend solution for software bugs Type de document : texte imprimé Auteurs : Khemliche ,Mokdad, Auteur ; Harrag, Fouz, Directeur de thèse Editeur : Setif:UFA Année de publication : 2019 Importance : 1 vol (59 f .) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Recommender System
learning to rank
Mining software repositories
Text Mining
Deep learning
Stack OverflowIndex. décimale : 004 - Informatique Résumé : En développement logiciel, les développeurs ont reçu des rapports d’erreur décrivant l’erreur. Les développeurs trouvent la cause d’erreur en examinant le code et en reproduisant le comportement anormal qui peut être considéré comme un processus fastidieux et chronophage. Les développeurs ont besoin d’un système automatisé intégrant de vastes connaissances du domaine et recommandant une solution à ces erreurs afin de les soulager au lieu de consacrer plus d’efforts manuels à la résolution des bogues ou d’attendre que les autres sites Web répondent aux questions. Stack Overflow est un site populaire de questions-réponses axé sur les problèmes de programmation. Nous pouvons ainsi bénéficier des connaissances disponibles sur cette plate-forme riche. Dans ce travail, nous avons proposé une architecture permettant de construire un système de recommandation utilisant l’approche Learning to Rank. Les techniques de texte mining et deep learning seront utilisées pour extraire, évaluer et recommander les réponses les plus pertinentes pour la résolution de ce rapport d’erreur. Note de contenu :
Sommaire
Table of contents............................................................................... v
List of figures…... .......................................................................... viii
List of Tables………………………………………………………ix
Introduction..... ................................................................................. 1
1 Chapter 1: State of the art ..................................... 1
1.1 Introduction ..........................................................................................................
1 1.2 Software data: .......................................................................................................
1 1.2.1 Software repositories ....................................................................................
1 1.2.2 Type of Software repositories ....................................................................... 2
1.2.3 Importance of Software repositories: ............................................................ 4
1.2.4 Bug reports .................................................................................................... 5
1.2.4.1 Definition of bug report .......................................................................... 5
1.2.4.2 The bug life cycle .................................................................................... 5
1.2.4.3 Bug Report Information’s ....................................................................... 6
1.2.5 Stack Overflow as a Knowledge Repository ................................................ 9
1.3 Mining Software repositories (MSR) .................................................................
11 1.3.1 Data mining Definition ............................................................................... 11
1.3.2 What is mean Mining Software repositories? ............................................. 11
1.3.3 Application of MSR .................................................................................... 12
1.3.4 Machine Learning ....................................................................................... 12
1.3.5 Deep Learning ............................................................................................. 14
1.3.5.1 Deep Learning Concepts ....................................................................... 14
vi
1.3.5.2 Model parameters .................................................................................. 16
1.3.6 NLP Techniques for Data Preprocessing .................................................... 16
1.3.7 Information retrieval ................................................................................... 17
1.3.8 Recommender Systems ............................................................................... 17
1.3.9 Conclusion .................................................................................................. 18
2 Chapter 2 Related Works .................................... 19
2.1 Introduction ........................................................................................................ 19
2.2 State of the art .................................................................................................... 19
2.3 Conclusion .......................................................................................................... 22
3 Chapter 3 Proposed Approach ............................ 23
3.1 Overall Framework ............................................................................................ 23
3.2 Data Preprocessing ............................................................................................. 23
3.3 Building TF-IDF Index of questions .................................................................. 24
3.4 Similarity Calculation ........................................................................................ 25
3.5 Features Extraction ............................................................................................. 25
3.6 Learning to rank model ...................................................................................... 26
4 Chapter 4 Implementation .................................. 28
4.1 Introduction ........................................................................................................ 28
4.2 Stack Overflow Dataset description ................................................................... 28
4.3 Implementation frameworks and tools ............................................................... 31
4.4 Model evaluation metrics ................................................................................... 34
4.5 Development stages ............................................................................................ 36
4.5.1 Storing Data in PostgresSQL data base ...................................................... 36
4.5.2 Preprocessing Steps .................................................................................... 37
4.5.3 Building TF-IDF Index of questions ........................................................... 39
vii
4.5.4 Extracting and preparing Features .............................................................. 39
4.5.5 Building Model ........................................................................................... 45
4.6 Conclusion .......................................................................................................... 48
5 Chapter 5 Experiments and results .................... 49
Chapter 6 Conclusion .......................................................... ……..56
Bibliography …………………………………………………...57Côte titre : MAI/0289 En ligne : https://drive.google.com/file/d/1QANkx_bFqFb0-lSgFK6cnMCLGQuigh2D/view?usp=shari [...] Format de la ressource électronique : Mining software repositories to recommend solution for software bugs [texte imprimé] / Khemliche ,Mokdad, Auteur ; Harrag, Fouz, Directeur de thèse . - [S.l.] : Setif:UFA, 2019 . - 1 vol (59 f .) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Recommender System
learning to rank
Mining software repositories
Text Mining
Deep learning
Stack OverflowIndex. décimale : 004 - Informatique Résumé : En développement logiciel, les développeurs ont reçu des rapports d’erreur décrivant l’erreur. Les développeurs trouvent la cause d’erreur en examinant le code et en reproduisant le comportement anormal qui peut être considéré comme un processus fastidieux et chronophage. Les développeurs ont besoin d’un système automatisé intégrant de vastes connaissances du domaine et recommandant une solution à ces erreurs afin de les soulager au lieu de consacrer plus d’efforts manuels à la résolution des bogues ou d’attendre que les autres sites Web répondent aux questions. Stack Overflow est un site populaire de questions-réponses axé sur les problèmes de programmation. Nous pouvons ainsi bénéficier des connaissances disponibles sur cette plate-forme riche. Dans ce travail, nous avons proposé une architecture permettant de construire un système de recommandation utilisant l’approche Learning to Rank. Les techniques de texte mining et deep learning seront utilisées pour extraire, évaluer et recommander les réponses les plus pertinentes pour la résolution de ce rapport d’erreur. Note de contenu :
Sommaire
Table of contents............................................................................... v
List of figures…... .......................................................................... viii
List of Tables………………………………………………………ix
Introduction..... ................................................................................. 1
1 Chapter 1: State of the art ..................................... 1
1.1 Introduction ..........................................................................................................
1 1.2 Software data: .......................................................................................................
1 1.2.1 Software repositories ....................................................................................
1 1.2.2 Type of Software repositories ....................................................................... 2
1.2.3 Importance of Software repositories: ............................................................ 4
1.2.4 Bug reports .................................................................................................... 5
1.2.4.1 Definition of bug report .......................................................................... 5
1.2.4.2 The bug life cycle .................................................................................... 5
1.2.4.3 Bug Report Information’s ....................................................................... 6
1.2.5 Stack Overflow as a Knowledge Repository ................................................ 9
1.3 Mining Software repositories (MSR) .................................................................
11 1.3.1 Data mining Definition ............................................................................... 11
1.3.2 What is mean Mining Software repositories? ............................................. 11
1.3.3 Application of MSR .................................................................................... 12
1.3.4 Machine Learning ....................................................................................... 12
1.3.5 Deep Learning ............................................................................................. 14
1.3.5.1 Deep Learning Concepts ....................................................................... 14
vi
1.3.5.2 Model parameters .................................................................................. 16
1.3.6 NLP Techniques for Data Preprocessing .................................................... 16
1.3.7 Information retrieval ................................................................................... 17
1.3.8 Recommender Systems ............................................................................... 17
1.3.9 Conclusion .................................................................................................. 18
2 Chapter 2 Related Works .................................... 19
2.1 Introduction ........................................................................................................ 19
2.2 State of the art .................................................................................................... 19
2.3 Conclusion .......................................................................................................... 22
3 Chapter 3 Proposed Approach ............................ 23
3.1 Overall Framework ............................................................................................ 23
3.2 Data Preprocessing ............................................................................................. 23
3.3 Building TF-IDF Index of questions .................................................................. 24
3.4 Similarity Calculation ........................................................................................ 25
3.5 Features Extraction ............................................................................................. 25
3.6 Learning to rank model ...................................................................................... 26
4 Chapter 4 Implementation .................................. 28
4.1 Introduction ........................................................................................................ 28
4.2 Stack Overflow Dataset description ................................................................... 28
4.3 Implementation frameworks and tools ............................................................... 31
4.4 Model evaluation metrics ................................................................................... 34
4.5 Development stages ............................................................................................ 36
4.5.1 Storing Data in PostgresSQL data base ...................................................... 36
4.5.2 Preprocessing Steps .................................................................................... 37
4.5.3 Building TF-IDF Index of questions ........................................................... 39
vii
4.5.4 Extracting and preparing Features .............................................................. 39
4.5.5 Building Model ........................................................................................... 45
4.6 Conclusion .......................................................................................................... 48
5 Chapter 5 Experiments and results .................... 49
Chapter 6 Conclusion .......................................................... ……..56
Bibliography …………………………………………………...57Côte titre : MAI/0289 En ligne : https://drive.google.com/file/d/1QANkx_bFqFb0-lSgFK6cnMCLGQuigh2D/view?usp=shari [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0289 MAI/0289 Mémoire Bibliothéque des sciences Français Disponible
Disponible