Titre : |
Fighting Arabic deep fake text |
Type de document : |
texte imprimé |
Auteurs : |
Debbah,Maria, Auteur ; Harrag, Fouz, Directeur de thèse |
Editeur : |
Setif:UFA |
Année de publication : |
2020 |
Importance : |
1 vol (57 f .) |
Format : |
29 cm |
Langues : |
Français (fre) |
Catégories : |
Thèses & Mémoires:Informatique
|
Mots-clés : |
brofond Faux Texte
Détection de texte généré automatiquement
langue arabe
Médias
sociaux, AraBERT, GPT2. |
Index. décimale : |
004 Informatique |
Résumé : |
Au cours des deux dernières décennies, nous nous sommes progressivement
tournés vers Internet et les médias sociaux pour trouver des nouvelles, entretenir
des conversations et partager des opinions. Récemment, OpenAI a développé
un système d’apprentissage automatique appelé GPT-2 pour Transformateur préentraîné
génératif-2; il est également connu sous le nom de faux profonds pour le
texte. Cet outil peut générer des blocs de texte basés sur de brèves invites d’écriture
qui semblent avoir été écrites par des humains, ce qui facilite désormais la diffusion
de fausses informations. Dans le prolongement de ces progrès, et afin de contrer
les dangers potentiels, plusieurs méthodes ont été proposées pour détecter les textes
écrits par ces modèles de langage. Dans cet article, nous proposons un modèle basé
sur l’apprentissage par transfert qui sera capable de détecter si une phrase arabe est
écrite par des humains ou automatiquement générée par des bots. Notre phrase 7k
a été collectée en utilisant l’API Twitter pour collecter des tweets manuels et GPT2-
Small-Arabic pour générer des phrases arabes. Afin d’évaluer notre modèle, différents
modèles basés sur des imbrications de mots de réseaux neuronaux récurrents (RNN)
ont été utilisés: LSTM, BI-LSTM, GRU et BI-GRU. Notre nouveau modèle combiné
d’apprentissage par transfert a obtenu une précision allant jusqu’à 98 %. À notre
connaissance, ce travail est la première étude où ARABERT et gpt2 ont été combinés
pour détecter et classer les textes arabes auto-générés. |
Côte titre : |
MAI/0344 |
En ligne : |
https://drive.google.com/file/d/15fV5VuWfFPx-2A4ZZwNFXOS5uy0vQSxI/view?usp=share [...] |
Format de la ressource électronique : |
pdf |
Fighting Arabic deep fake text [texte imprimé] / Debbah,Maria, Auteur ; Harrag, Fouz, Directeur de thèse . - [S.l.] : Setif:UFA, 2020 . - 1 vol (57 f .) ; 29 cm. Langues : Français ( fre)
Catégories : |
Thèses & Mémoires:Informatique
|
Mots-clés : |
brofond Faux Texte
Détection de texte généré automatiquement
langue arabe
Médias
sociaux, AraBERT, GPT2. |
Index. décimale : |
004 Informatique |
Résumé : |
Au cours des deux dernières décennies, nous nous sommes progressivement
tournés vers Internet et les médias sociaux pour trouver des nouvelles, entretenir
des conversations et partager des opinions. Récemment, OpenAI a développé
un système d’apprentissage automatique appelé GPT-2 pour Transformateur préentraîné
génératif-2; il est également connu sous le nom de faux profonds pour le
texte. Cet outil peut générer des blocs de texte basés sur de brèves invites d’écriture
qui semblent avoir été écrites par des humains, ce qui facilite désormais la diffusion
de fausses informations. Dans le prolongement de ces progrès, et afin de contrer
les dangers potentiels, plusieurs méthodes ont été proposées pour détecter les textes
écrits par ces modèles de langage. Dans cet article, nous proposons un modèle basé
sur l’apprentissage par transfert qui sera capable de détecter si une phrase arabe est
écrite par des humains ou automatiquement générée par des bots. Notre phrase 7k
a été collectée en utilisant l’API Twitter pour collecter des tweets manuels et GPT2-
Small-Arabic pour générer des phrases arabes. Afin d’évaluer notre modèle, différents
modèles basés sur des imbrications de mots de réseaux neuronaux récurrents (RNN)
ont été utilisés: LSTM, BI-LSTM, GRU et BI-GRU. Notre nouveau modèle combiné
d’apprentissage par transfert a obtenu une précision allant jusqu’à 98 %. À notre
connaissance, ce travail est la première étude où ARABERT et gpt2 ont été combinés
pour détecter et classer les textes arabes auto-générés. |
Côte titre : |
MAI/0344 |
En ligne : |
https://drive.google.com/file/d/15fV5VuWfFPx-2A4ZZwNFXOS5uy0vQSxI/view?usp=share [...] |
Format de la ressource électronique : |
pdf |
|