Titre : |
D´etection De La Langue Arabe Offensante Dans Les M´edias Sociaux |
Type de document : |
texte imprimé |
Auteurs : |
Anis Mebarki, Auteur ; Mortadha Hasniou Akli, Auteur ; Sadik Bessou, Directeur de thèse |
Année de publication : |
2022 |
Importance : |
1 vol (49 f .) |
Format : |
29cm |
Langues : |
Français (fre) |
Catégories : |
Thèses & Mémoires:Informatique
|
Mots-clés : |
Langage offensant
Apprentissage automatique |
Index. décimale : |
004 Informatique |
Résumé : |
De nos jours maintenant le discours offensant augmente jour apr`es jour dans notre soci´et´e et
particuli`erement dans les m´edias sociaux.
Ce discours offensant se compose de plusieurs cat´egories comme le racisme, l’insulte ...
Au cours des derni`eres ann´ees, c’´etait la d´ecouverte et l’´elimination du langage offensant en
ligne `a l’aide d’une analyse manuelle, qui est une m´ethode traditionnelle tr`es difficile en raison
de l’´enorme volume de donn´ees et de la consommation de beaucoup de temps et de l’argent.
Pour cela, il est important de d´etecter et d’´eliminer le langage offensant en ligne grˆace `a un
syst`eme d’identification et de cat´egorisation de la langue arabe offensante sur les r´eseaux
sociaux.
Dans ce projet, nous discutons de cas pratique pour la d´etection automatique de
commentaires offensants qui ciblent sp´ecifiquement notre soci´et´e alg´erienne sur des
plates-formes sociales connues. Nous avons utilis´e le traitement automatique du langage
naturel pour nettoyer bien les donn´ees , grˆace `a l’utilisation du pr´etraitement.
Ensuite, nous avons appliqu´e l’´etape d’apprentissage automatique avec plusieurs algorithmes
(r´egression logistique, LinearSVC, MultinomialNB, BernoulliNB, SGDClassifier, Random
Forest), o`u nous sommes arriv´es que le meilleur mod`ele est MultinomialNB avec l’utilisation
de GridSearch et BOW, o`u la pr´ecision ´etait 0,91% suivi du mod`ele LinearSVC avec une
pr´ecision de 90,77%. |
Côte titre : |
MAI/0622 |
En ligne : |
https://drive.google.com/file/d/1CQhpJUfPup4o152saAkCt8PjRg3tDGPG/view?usp=share [...] |
Format de la ressource électronique : |
pdf |
D´etection De La Langue Arabe Offensante Dans Les M´edias Sociaux [texte imprimé] / Anis Mebarki, Auteur ; Mortadha Hasniou Akli, Auteur ; Sadik Bessou, Directeur de thèse . - 2022 . - 1 vol (49 f .) ; 29cm. Langues : Français ( fre)
Catégories : |
Thèses & Mémoires:Informatique
|
Mots-clés : |
Langage offensant
Apprentissage automatique |
Index. décimale : |
004 Informatique |
Résumé : |
De nos jours maintenant le discours offensant augmente jour apr`es jour dans notre soci´et´e et
particuli`erement dans les m´edias sociaux.
Ce discours offensant se compose de plusieurs cat´egories comme le racisme, l’insulte ...
Au cours des derni`eres ann´ees, c’´etait la d´ecouverte et l’´elimination du langage offensant en
ligne `a l’aide d’une analyse manuelle, qui est une m´ethode traditionnelle tr`es difficile en raison
de l’´enorme volume de donn´ees et de la consommation de beaucoup de temps et de l’argent.
Pour cela, il est important de d´etecter et d’´eliminer le langage offensant en ligne grˆace `a un
syst`eme d’identification et de cat´egorisation de la langue arabe offensante sur les r´eseaux
sociaux.
Dans ce projet, nous discutons de cas pratique pour la d´etection automatique de
commentaires offensants qui ciblent sp´ecifiquement notre soci´et´e alg´erienne sur des
plates-formes sociales connues. Nous avons utilis´e le traitement automatique du langage
naturel pour nettoyer bien les donn´ees , grˆace `a l’utilisation du pr´etraitement.
Ensuite, nous avons appliqu´e l’´etape d’apprentissage automatique avec plusieurs algorithmes
(r´egression logistique, LinearSVC, MultinomialNB, BernoulliNB, SGDClassifier, Random
Forest), o`u nous sommes arriv´es que le meilleur mod`ele est MultinomialNB avec l’utilisation
de GridSearch et BOW, o`u la pr´ecision ´etait 0,91% suivi du mod`ele LinearSVC avec une
pr´ecision de 90,77%. |
Côte titre : |
MAI/0622 |
En ligne : |
https://drive.google.com/file/d/1CQhpJUfPup4o152saAkCt8PjRg3tDGPG/view?usp=share [...] |
Format de la ressource électronique : |
pdf |
|