University Sétif 1 FERHAT ABBAS Faculty of Sciences
Détail de l'auteur
Auteur Sadik Bessou |
Documents disponibles écrits par cet auteur



Advanced Detection of Arabic Offensive Language in Social Media Using Machine Learning and Natural Language Processing / Asma Kahla
Titre : Advanced Detection of Arabic Offensive Language in Social Media Using Machine Learning and Natural Language Processing Type de document : texte imprimé Auteurs : Asma Kahla, Auteur ; Yassina Belguet ; Sadik Bessou, Directeur de thèse Editeur : Setif:UFA Année de publication : 2024 Importance : 1 vol (93 f .) Format : 29 cm Langues : Anglais (eng) Catégories : Thèses & Mémoires:Informatique Mots-clés : Offensive Language
Machine Learning
Natural Language Processing
TransformersIndex. décimale : 004 - Informatique Résumé :
Because social media platforms like Facebook offer so many services, they have become an
essential part of our everyday life. However, there has also been an increase in offensive
speech on these platforms, which has become a major issue. The massive amount of data
and the significant consumption of time and money make the old way of manually finding
and removing offensive language online extremely challenging. As a result, there is an
increasing need for automatic offensive language identification, particularly in cases when
posts are written in complex languages or lack resources, such as Arabic.
In this work, we focused on Algerian dialects. We used different machine learning algorithms:
Logistic Regression, SVM, MultinomialNB, BernoulliNB, and Stochastic Gradient
Descent. Our best results yielded accuracies of 89.70% and 89.19% for the Term
Frequency-Inverse Document Frequency (TFIDF) with n-gram and Bag of Words (BoW)
with n-gram, respectively, using MultinomialNB and BernoulliNB classifiers.
Additionally, we utilized Convolutional Neural Networks (CNN) and Long Short-Term
Memory (LSTM) models with BERT for data analysis, in our case we used marBERT v2.
In this experiment, LSTM achieved an accuracy of 89.20%. However, marBERT v2 alone
outperformed all previous experiments with an accuracy of 95%.Note de contenu : Sommaire
List of Figures i
List of Tables iv
General introduction 1
1 Offensive Language 3
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Offensive language . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.2 Offensive language types . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.3 Offensive language categories . . . . . . . . . . . . . . . . . . . . . 7
1.2.4 Different definitions of offensive language . . . . . . . . . . . . . . . 8
1.2.5 Offensive language in social media and peoples’ cultures . . . . . . 9
1.3 International laws . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4 Related works . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4.1 Current state in offensive language detection and related concept . 13
1.4.2 Summary and Analysis . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2 Machine Learning 20
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3 Machine Learning types . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.1 Supervised Learning . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.2 Unsupervised Learning . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.3 Reinforcement Learning . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3.4 Semi-supervised Learning . . . . . . . . . . . . . . . . . . . . . . . 23
2.4 Machine Learning algorithms . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4.1 Logistic regression . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4.2 Naive Bayes classifier . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4.3 Stochastic Gradient Descent . . . . . . . . . . . . . . . . . . . . . . 24
2.4.4 Support Vector Machine . . . . . . . . . . . . . . . . . . . . . . . . 24
2.5 Machine Learning concepts . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.6 Machine Learning process . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.6.1 Data collection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.6.2 Preparation data . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.6.3 Choosing a model . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6.4 Training the model . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6.5 Testing the model . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6.6 Improve the model . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
.6.7 Prediction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.7 Deep Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.7.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.7.2 Deep Learning types . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3 Sentiment Analysis 31
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2 Sentiment Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2.1 Sentiments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2.2 Sentiments Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.3 Subjectivity classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.4 Sentiment analysis levels . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.4.1 Document-level sentiment analysis . . . . . . . . . . . . . . . . . . 33
3.4.2 Sentence level of sentiment analysis . . . . . . . . . . . . . . . . . . 33
3.4.3 Word/Phrase Level of sentiment analysis . . . . . . . . . . . . . . . 33
3.5 Sentiment Analysis approaches . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.5.1 Machine Learning (ML) . . . . . . . . . . . . . . . . . . . . . . . . 33
3.5.2 Lexicon-based approach . . . . . . . . . . . . . . . . . . . . . . . . 34
3.5.3 Hybrid approach . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.6 Types of Sentiment Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.6.1 Emotion Recognition . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.6.2 Fine-Grained . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
...........Côte titre : MAI/0913
Advanced Detection of Arabic Offensive Language in Social Media Using Machine Learning and Natural Language Processing [texte imprimé] / Asma Kahla, Auteur ; Yassina Belguet ; Sadik Bessou, Directeur de thèse . - [S.l.] : Setif:UFA, 2024 . - 1 vol (93 f .) ; 29 cm.
Langues : Anglais (eng)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Offensive Language
Machine Learning
Natural Language Processing
TransformersIndex. décimale : 004 - Informatique Résumé :
Because social media platforms like Facebook offer so many services, they have become an
essential part of our everyday life. However, there has also been an increase in offensive
speech on these platforms, which has become a major issue. The massive amount of data
and the significant consumption of time and money make the old way of manually finding
and removing offensive language online extremely challenging. As a result, there is an
increasing need for automatic offensive language identification, particularly in cases when
posts are written in complex languages or lack resources, such as Arabic.
In this work, we focused on Algerian dialects. We used different machine learning algorithms:
Logistic Regression, SVM, MultinomialNB, BernoulliNB, and Stochastic Gradient
Descent. Our best results yielded accuracies of 89.70% and 89.19% for the Term
Frequency-Inverse Document Frequency (TFIDF) with n-gram and Bag of Words (BoW)
with n-gram, respectively, using MultinomialNB and BernoulliNB classifiers.
Additionally, we utilized Convolutional Neural Networks (CNN) and Long Short-Term
Memory (LSTM) models with BERT for data analysis, in our case we used marBERT v2.
In this experiment, LSTM achieved an accuracy of 89.20%. However, marBERT v2 alone
outperformed all previous experiments with an accuracy of 95%.Note de contenu : Sommaire
List of Figures i
List of Tables iv
General introduction 1
1 Offensive Language 3
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Offensive language . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.2 Offensive language types . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.3 Offensive language categories . . . . . . . . . . . . . . . . . . . . . 7
1.2.4 Different definitions of offensive language . . . . . . . . . . . . . . . 8
1.2.5 Offensive language in social media and peoples’ cultures . . . . . . 9
1.3 International laws . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4 Related works . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4.1 Current state in offensive language detection and related concept . 13
1.4.2 Summary and Analysis . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2 Machine Learning 20
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3 Machine Learning types . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.1 Supervised Learning . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.2 Unsupervised Learning . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.3 Reinforcement Learning . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3.4 Semi-supervised Learning . . . . . . . . . . . . . . . . . . . . . . . 23
2.4 Machine Learning algorithms . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4.1 Logistic regression . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4.2 Naive Bayes classifier . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4.3 Stochastic Gradient Descent . . . . . . . . . . . . . . . . . . . . . . 24
2.4.4 Support Vector Machine . . . . . . . . . . . . . . . . . . . . . . . . 24
2.5 Machine Learning concepts . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.6 Machine Learning process . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.6.1 Data collection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.6.2 Preparation data . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.6.3 Choosing a model . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6.4 Training the model . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6.5 Testing the model . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6.6 Improve the model . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
.6.7 Prediction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.7 Deep Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.7.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.7.2 Deep Learning types . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3 Sentiment Analysis 31
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2 Sentiment Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2.1 Sentiments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2.2 Sentiments Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.3 Subjectivity classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.4 Sentiment analysis levels . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.4.1 Document-level sentiment analysis . . . . . . . . . . . . . . . . . . 33
3.4.2 Sentence level of sentiment analysis . . . . . . . . . . . . . . . . . . 33
3.4.3 Word/Phrase Level of sentiment analysis . . . . . . . . . . . . . . . 33
3.5 Sentiment Analysis approaches . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.5.1 Machine Learning (ML) . . . . . . . . . . . . . . . . . . . . . . . . 33
3.5.2 Lexicon-based approach . . . . . . . . . . . . . . . . . . . . . . . . 34
3.5.3 Hybrid approach . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.6 Types of Sentiment Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.6.1 Emotion Recognition . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.6.2 Fine-Grained . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
...........Côte titre : MAI/0913
Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0913 MAI/0913 Mémoire Bibliothéque des sciences Anglais Disponible
DisponibleAnalyse des sentiments des commentaires en arabe des lecteurs des journaux en lignes / Rania,Aberkane
Titre : Analyse des sentiments des commentaires en arabe des lecteurs des journaux en lignes Type de document : texte imprimé Auteurs : Rania,Aberkane, Auteur ; Sadik Bessou, Directeur de thèse Editeur : Setif:UFA Année de publication : 2018 Importance : 1 vol (77 f .) Présentation : ill. Format : 29 cm Langues : Français (fre) Langues originales : Français (fre) Catégories : Thèses & Mémoires:Informatique Index. décimale : 004 Informatique Côte titre : MAI/0218 Analyse des sentiments des commentaires en arabe des lecteurs des journaux en lignes [texte imprimé] / Rania,Aberkane, Auteur ; Sadik Bessou, Directeur de thèse . - [S.l.] : Setif:UFA, 2018 . - 1 vol (77 f .) : ill. ; 29 cm.
Langues : Français (fre) Langues originales : Français (fre)
Catégories : Thèses & Mémoires:Informatique Index. décimale : 004 Informatique Côte titre : MAI/0218 Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0218 MAI/0218 Mémoire Bibliothéque des sciences Français Disponible
DisponibleAPPROCHE POUR L’INDEXATION ET L’UTILISATION DES RESSOURCES PEDAGOGIQUES DANS UN SYSTEME E-LEARNING PERVASIF / Brik ,Mourad
![]()
Titre : APPROCHE POUR L’INDEXATION ET L’UTILISATION DES RESSOURCES PEDAGOGIQUES DANS UN SYSTEME E-LEARNING PERVASIF Type de document : texte imprimé Auteurs : Brik ,Mourad, Auteur ; Sadik Bessou, Directeur de thèse Editeur : Setif:UFA Année de publication : 2021 Importance : 1 vol (96 f .) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Systèmes de recommandation
Sensibilité au contexteIndex. décimale : 004 - Informatique Résumé :
Le travail présenté dans cette thèse concerne les systèmes de recommandation sensibles au
contexte (CARS), plus précisément nous concentrons sur la détection automatique des
conditions contextuelles (valeurs des facteurs contextuelles) qui influencent le processus de
recommandation. Dans les recherches récentes, l’intégration du contexte dans les applications
de recommandation a été démontrée leur efficacité en générant des items aux utilisateurs non
seulement pertinents mais également convenables à leurs contexte. Tandis que, la sélection des
facteurs de contexte est une tache exigeante en ressources qui nécessite dans la plus part des
cas l’intervention d’un expert de domaine.
Le principale contribution de ce travail de thèse est basée sur l'analyse des comportements
des utilisateurs au sein d’un système de recommandation à base de filtrage collaboratif afin de
deviner les conditions contextuelles relatives à la consommation adéquate des items en utilisant
la matrice des votes générée par les systèmes de recommandation à base de filtrage collaboratif.
Un profil d'utilisateur qui englobe à la fois les données concernant les utilisateurs et les données
de contexte a été proposé dans ce travail. Nous proposons aussi une méthode de modélisation
de contexte à base de règles sémantiques qui se penche sur l'analyse de comportement des
utilisateurs. Nous avons appliqué cette proposition dans le domaine de l'éducation dans lequel
nous avons conçu un outil permettant la création des objets d'apprentissages. Ce système vise Ã
améliorer la tâche de production des objets d'apprentissage (création, révision, édition…) en
offrant un environnement collaboratif grâce aux technologies fournies par les systèmes de
filtrage collaboratifs ainsi que l’analyse des comportements des utilisateurs pour améliorer le
processus de recommandation dans les environnements pervasifs.
La prise en compte du contexte pour la génération de recommandations futures adopte
l’approche pré-filtrage contextuel avec une méthode probabiliste (Naïve Bayes), qui permet la
génération des items personnalisés avant que les recommandations soient faites.
Un test a été mené sur des utilisateurs réels montre que l’approche sémantique proposée est
promoteur pour ce genre de contexte.Côte titre : DI/0067 En ligne : https://drive.google.com/file/d/1dTbBpVFDTbS_2r20_z2KY3iYdlYgTjpt/view?usp=shari [...] Format de la ressource électronique : APPROCHE POUR L’INDEXATION ET L’UTILISATION DES RESSOURCES PEDAGOGIQUES DANS UN SYSTEME E-LEARNING PERVASIF [texte imprimé] / Brik ,Mourad, Auteur ; Sadik Bessou, Directeur de thèse . - [S.l.] : Setif:UFA, 2021 . - 1 vol (96 f .) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Systèmes de recommandation
Sensibilité au contexteIndex. décimale : 004 - Informatique Résumé :
Le travail présenté dans cette thèse concerne les systèmes de recommandation sensibles au
contexte (CARS), plus précisément nous concentrons sur la détection automatique des
conditions contextuelles (valeurs des facteurs contextuelles) qui influencent le processus de
recommandation. Dans les recherches récentes, l’intégration du contexte dans les applications
de recommandation a été démontrée leur efficacité en générant des items aux utilisateurs non
seulement pertinents mais également convenables à leurs contexte. Tandis que, la sélection des
facteurs de contexte est une tache exigeante en ressources qui nécessite dans la plus part des
cas l’intervention d’un expert de domaine.
Le principale contribution de ce travail de thèse est basée sur l'analyse des comportements
des utilisateurs au sein d’un système de recommandation à base de filtrage collaboratif afin de
deviner les conditions contextuelles relatives à la consommation adéquate des items en utilisant
la matrice des votes générée par les systèmes de recommandation à base de filtrage collaboratif.
Un profil d'utilisateur qui englobe à la fois les données concernant les utilisateurs et les données
de contexte a été proposé dans ce travail. Nous proposons aussi une méthode de modélisation
de contexte à base de règles sémantiques qui se penche sur l'analyse de comportement des
utilisateurs. Nous avons appliqué cette proposition dans le domaine de l'éducation dans lequel
nous avons conçu un outil permettant la création des objets d'apprentissages. Ce système vise Ã
améliorer la tâche de production des objets d'apprentissage (création, révision, édition…) en
offrant un environnement collaboratif grâce aux technologies fournies par les systèmes de
filtrage collaboratifs ainsi que l’analyse des comportements des utilisateurs pour améliorer le
processus de recommandation dans les environnements pervasifs.
La prise en compte du contexte pour la génération de recommandations futures adopte
l’approche pré-filtrage contextuel avec une méthode probabiliste (Naïve Bayes), qui permet la
génération des items personnalisés avant que les recommandations soient faites.
Un test a été mené sur des utilisateurs réels montre que l’approche sémantique proposée est
promoteur pour ce genre de contexte.Côte titre : DI/0067 En ligne : https://drive.google.com/file/d/1dTbBpVFDTbS_2r20_z2KY3iYdlYgTjpt/view?usp=shari [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité DI/0067 DI/0067 Thèse Bibliothéque des sciences Français Disponible
Disponible
Titre : Arabic Sentiments Analysis Using Machine Learning Type de document : texte imprimé Auteurs : Hamza,Hiba, Auteur ; Sadik Bessou, Directeur de thèse Editeur : Setif:UFA Année de publication : 2021 Importance : 1 vol (57 f .) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Analyse des sentiments
Langue arabe
Traitement du langage naturelIndex. décimale : 004 - Informatique Résumé :
L’analyse des sentiments est une tâche de traitement du langage naturel qui a récemment
attiré une attention croissante, en particulier dans les entreprises, le marketing et les politiques,
où l’analyse des sentiments donne une idée complète de ce que les gens aiment et
n’aiment pas, et de leur sentiment envers les produits, les idées, services, etc. L’analyse des
sentiments est apparue après la prolifération des services de réseaux sociaux comme Facebook,
Twitter, Youtube, des plateformes de blogs et des forums où les internautes peuvent
partager facilement leurs pensées et leurs points de vue via ces plateformes où une quantité
massive de données est générée quotidiennement. Cependant, les recherches sur l’analyse
des sentiments ont été principalement menées pour la langue anglaise. Bien que l’arabe devienne
l’une des langues les plus utilisées sur Internet, seules quelques études se sont jusqu’Ã
présent concentrées sur l’analyse des sentiments en arabe.
Dans cette thèse, nous présentons les détails de la collecte d’un grand ensemble de don–nées
"corpus" des commentaires et des publications en langue arabe provenant de plateformes de
médias sociaux. Les techniques utilisées pour le prétraitement de l’ensemble de données collectées
sont expliquées. Nous présentons nos trois classes : positive, négative et neutre.
Nous avons proposé et évalué plusieurs méthodes d’apprentissage automatique pour classer
les commentaires: Machine à Vecteurs de Support, Régression Logistique, Forêt Aléatoire et
Bayes Naïves. Et un modèle N-gram a été proposé où les documents sont classés sur la base
de: unigrammes, bigramset trigrammes.Les meilleurs résultats de la précision que nous avons
obtenue de mot en utilisant Tfidfvectorizer unigrammes était 88.26% avec le classificateur
Forêt Aléatoire, et Les meilleurs précisions de caractère 87.42% en utilisant Countvectorize
avec le classificateur Régression Logistique en utilisant trigrammmes.Côte titre : MAI/0478 En ligne : https://drive.google.com/file/d/18DpQVRvHdHXDmaMYF3Kqmmk5JD2UbPGi/view?usp=shari [...] Format de la ressource électronique : Arabic Sentiments Analysis Using Machine Learning [texte imprimé] / Hamza,Hiba, Auteur ; Sadik Bessou, Directeur de thèse . - [S.l.] : Setif:UFA, 2021 . - 1 vol (57 f .) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Analyse des sentiments
Langue arabe
Traitement du langage naturelIndex. décimale : 004 - Informatique Résumé :
L’analyse des sentiments est une tâche de traitement du langage naturel qui a récemment
attiré une attention croissante, en particulier dans les entreprises, le marketing et les politiques,
où l’analyse des sentiments donne une idée complète de ce que les gens aiment et
n’aiment pas, et de leur sentiment envers les produits, les idées, services, etc. L’analyse des
sentiments est apparue après la prolifération des services de réseaux sociaux comme Facebook,
Twitter, Youtube, des plateformes de blogs et des forums où les internautes peuvent
partager facilement leurs pensées et leurs points de vue via ces plateformes où une quantité
massive de données est générée quotidiennement. Cependant, les recherches sur l’analyse
des sentiments ont été principalement menées pour la langue anglaise. Bien que l’arabe devienne
l’une des langues les plus utilisées sur Internet, seules quelques études se sont jusqu’Ã
présent concentrées sur l’analyse des sentiments en arabe.
Dans cette thèse, nous présentons les détails de la collecte d’un grand ensemble de don–nées
"corpus" des commentaires et des publications en langue arabe provenant de plateformes de
médias sociaux. Les techniques utilisées pour le prétraitement de l’ensemble de données collectées
sont expliquées. Nous présentons nos trois classes : positive, négative et neutre.
Nous avons proposé et évalué plusieurs méthodes d’apprentissage automatique pour classer
les commentaires: Machine à Vecteurs de Support, Régression Logistique, Forêt Aléatoire et
Bayes Naïves. Et un modèle N-gram a été proposé où les documents sont classés sur la base
de: unigrammes, bigramset trigrammes.Les meilleurs résultats de la précision que nous avons
obtenue de mot en utilisant Tfidfvectorizer unigrammes était 88.26% avec le classificateur
Forêt Aléatoire, et Les meilleurs précisions de caractère 87.42% en utilisant Countvectorize
avec le classificateur Régression Logistique en utilisant trigrammmes.Côte titre : MAI/0478 En ligne : https://drive.google.com/file/d/18DpQVRvHdHXDmaMYF3Kqmmk5JD2UbPGi/view?usp=shari [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0478 MAI/0478 Mémoire Bibliothéque des sciences Anglais Disponible
Disponible
Titre : Arabic Subjective Sentiment Analysis Using Machine Learning Type de document : texte imprimé Auteurs : Besma Mokrane Ghadir, Auteur ; Aouatif Bouchareb, Auteur ; Sadik Bessou, Directeur de thèse Année de publication : 2022 Importance : 1 vol (6 1f .) Format : 29cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Informatique Index. décimale : 004 Informatique Résumé :
Sentiment analysis has gotten a lot of attention in the recent decade because of the
benefits it may give in several fields, including politics, social sciences, marketing and
economics... because social networks are now full of texts in which Internet users express
themselves on a variety of topics and their opinions are important in making decisions in
many of these fields.
Unfortunately, most of the resources and systems developed in this field are designed
for English and other European languages, and sentiment analysis in the Arabic language
has only recently begun to be researched and developed, and progress is slow compared
to research in English and other languages.
In this work, we will make our mark in the field of Arabic sentiment analysis using
machine learning by doing several experiments on the effect of using word and character
grams with different N-grams (unigram, bigram, trigram and 4-gram) and different vectorizer
(CountVectorizer and Tfidfvectorizer), and see how the outcome will change also
we used in all our experiment five of ML algorithms (SVM, NB, LR, RF, DT).
We applied our experiments on two sets of data that were about Twitter comments
and restaurant reviews, categorized into three groups, positive, negative, and neutral, and
containing 23 414 comments.
After we did all the experiments on our data and saw all the results, we came to the
conclusion that the algorithm of Logistic Regression gave us the best result with wordgram
and char-gram which we reached accuracy 90% and 91% respectively and the best
n-gram was the bigram for the word-gram and the trigram for the char-gram and the best
vectorizer was TfidfVectorizer.Côte titre : MAI/0694 En ligne : https://drive.google.com/file/d/1yxnHJoZ6uOlD5yqlcNIKtVEfZd1oUeLI/view?usp=share [...] Format de la ressource électronique : Arabic Subjective Sentiment Analysis Using Machine Learning [texte imprimé] / Besma Mokrane Ghadir, Auteur ; Aouatif Bouchareb, Auteur ; Sadik Bessou, Directeur de thèse . - 2022 . - 1 vol (6 1f .) ; 29cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Informatique Index. décimale : 004 Informatique Résumé :
Sentiment analysis has gotten a lot of attention in the recent decade because of the
benefits it may give in several fields, including politics, social sciences, marketing and
economics... because social networks are now full of texts in which Internet users express
themselves on a variety of topics and their opinions are important in making decisions in
many of these fields.
Unfortunately, most of the resources and systems developed in this field are designed
for English and other European languages, and sentiment analysis in the Arabic language
has only recently begun to be researched and developed, and progress is slow compared
to research in English and other languages.
In this work, we will make our mark in the field of Arabic sentiment analysis using
machine learning by doing several experiments on the effect of using word and character
grams with different N-grams (unigram, bigram, trigram and 4-gram) and different vectorizer
(CountVectorizer and Tfidfvectorizer), and see how the outcome will change also
we used in all our experiment five of ML algorithms (SVM, NB, LR, RF, DT).
We applied our experiments on two sets of data that were about Twitter comments
and restaurant reviews, categorized into three groups, positive, negative, and neutral, and
containing 23 414 comments.
After we did all the experiments on our data and saw all the results, we came to the
conclusion that the algorithm of Logistic Regression gave us the best result with wordgram
and char-gram which we reached accuracy 90% and 91% respectively and the best
n-gram was the bigram for the word-gram and the trigram for the char-gram and the best
vectorizer was TfidfVectorizer.Côte titre : MAI/0694 En ligne : https://drive.google.com/file/d/1yxnHJoZ6uOlD5yqlcNIKtVEfZd1oUeLI/view?usp=share [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0694 MAI/0694 Mémoire Bibliothéque des sciences Anglais Disponible
DisponibleAuthor profiling for Algerian social media users in Modern standard Arabic and Algerian dialect / Khenafi, Amani
![]()
PermalinkPermalinkComplexité lexicale des textes Arabes par les techniques d’apprentissage automatique / Chenni,Ghozlene
![]()
PermalinkConception et Implémentation d’Architectures Modulaires et Hiérarchiques en Reconnaissance Biométrique / Regouid,Meryem
![]()
PermalinkConception et réalisation d'une application multi-plateforme pour la gestion numérique de l'Ecole (e-school) / Khadidja Barkat
![]()
PermalinkContribution au niveau de l’approche indirecte à base de transfert dans la traduction automatique / Sadik Bessou
![]()
PermalinkContribution au niveau de l’approche indirecte à base de transfert dans la traduction automatique / Sadik Bessou
![]()
PermalinkDEVELOPMENT OF A MOBILE APPLICATION IN THE CONTEXT OF UBERIZATION: ARCHITECTURE AND USER EXPERIENCE / Lydia Nakivumbi
PermalinkPermalinkHealthcare Solutions: Application cross- platform for instant medical services on demand easy-care / Rafik Zemouri
Permalink