Catalogue en ligne

University Sétif 1 FERHAT ABBAS Faculty of Sciences

Nouvelle recherche

Détail de l'auteur

Auteur Sadik Bessou

Documents disponibles écrits par cet auteur

Ajouter le résultat dans votre panier Affiner la recherche

Advanced Detection of Arabic Offensive Language in Social Media Using Machine Learning and Natural Language Processing / Asma Kahla

Public

ISBD

Titre : Advanced Detection of Arabic Offensive Language in Social Media Using Machine Learning and Natural Language Processing
Type de document : texte imprimé
Auteurs : Asma Kahla, Auteur ; Yassina Belguet ; Sadik Bessou, Directeur de thèse
Editeur : Setif:UFA
Année de publication : 2024
Importance : 1 vol (93 f .)
Format : 29 cm
Langues : Anglais (eng)
Catégories : Thèses & Mémoires:Informatique

Mots-clés : Offensive Language
Machine Learning
Natural Language Processing
Transformers
Index. décimale : 004 - Informatique
Résumé :
Because social media platforms like Facebook offer so many services, they have become an
essential part of our everyday life. However, there has also been an increase in offensive
speech on these platforms, which has become a major issue. The massive amount of data
and the significant consumption of time and money make the old way of manually finding
and removing offensive language online extremely challenging. As a result, there is an
increasing need for automatic offensive language identification, particularly in cases when
posts are written in complex languages or lack resources, such as Arabic.
In this work, we focused on Algerian dialects. We used different machine learning algorithms:
Logistic Regression, SVM, MultinomialNB, BernoulliNB, and Stochastic Gradient
Descent. Our best results yielded accuracies of 89.70% and 89.19% for the Term
Frequency-Inverse Document Frequency (TFIDF) with n-gram and Bag of Words (BoW)
with n-gram, respectively, using MultinomialNB and BernoulliNB classifiers.
Additionally, we utilized Convolutional Neural Networks (CNN) and Long Short-Term
Memory (LSTM) models with BERT for data analysis, in our case we used marBERT v2.
In this experiment, LSTM achieved an accuracy of 89.20%. However, marBERT v2 alone
outperformed all previous experiments with an accuracy of 95%.
Note de contenu : Sommaire
List of Figures i
List of Tables iv
General introduction 1
1 Offensive Language 3
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Offensive language . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.2 Offensive language types . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.3 Offensive language categories . . . . . . . . . . . . . . . . . . . . . 7
1.2.4 Different definitions of offensive language . . . . . . . . . . . . . . . 8
1.2.5 Offensive language in social media and peoples’ cultures . . . . . . 9
1.3 International laws . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4 Related works . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4.1 Current state in offensive language detection and related concept . 13
1.4.2 Summary and Analysis . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2 Machine Learning 20
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3 Machine Learning types . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.1 Supervised Learning . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.2 Unsupervised Learning . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.3 Reinforcement Learning . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3.4 Semi-supervised Learning . . . . . . . . . . . . . . . . . . . . . . . 23
2.4 Machine Learning algorithms . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4.1 Logistic regression . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4.2 Naive Bayes classifier . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4.3 Stochastic Gradient Descent . . . . . . . . . . . . . . . . . . . . . . 24
2.4.4 Support Vector Machine . . . . . . . . . . . . . . . . . . . . . . . . 24
2.5 Machine Learning concepts . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.6 Machine Learning process . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.6.1 Data collection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.6.2 Preparation data . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.6.3 Choosing a model . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6.4 Training the model . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6.5 Testing the model . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6.6 Improve the model . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
.6.7 Prediction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.7 Deep Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.7.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.7.2 Deep Learning types . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3 Sentiment Analysis 31
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2 Sentiment Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2.1 Sentiments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2.2 Sentiments Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.3 Subjectivity classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.4 Sentiment analysis levels . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.4.1 Document-level sentiment analysis . . . . . . . . . . . . . . . . . . 33
3.4.2 Sentence level of sentiment analysis . . . . . . . . . . . . . . . . . . 33
3.4.3 Word/Phrase Level of sentiment analysis . . . . . . . . . . . . . . . 33
3.5 Sentiment Analysis approaches . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.5.1 Machine Learning (ML) . . . . . . . . . . . . . . . . . . . . . . . . 33
3.5.2 Lexicon-based approach . . . . . . . . . . . . . . . . . . . . . . . . 34
3.5.3 Hybrid approach . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.6 Types of Sentiment Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.6.1 Emotion Recognition . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.6.2 Fine-Grained . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
...........
Côte titre : MAI/0913

Advanced Detection of Arabic Offensive Language in Social Media Using Machine Learning and Natural Language Processing [texte imprimé] / Asma Kahla, Auteur ; Yassina Belguet ; Sadik Bessou, Directeur de thèse . - [S.l.] : Setif:UFA, 2024 . - 1 vol (93 f .) ; 29 cm.
Langues : Anglais (eng)
Catégories : Thèses & Mémoires:Informatique

Mots-clés : Offensive Language
Machine Learning
Natural Language Processing
Transformers
Index. décimale : 004 - Informatique
Résumé :
Because social media platforms like Facebook offer so many services, they have become an
essential part of our everyday life. However, there has also been an increase in offensive
speech on these platforms, which has become a major issue. The massive amount of data
and the significant consumption of time and money make the old way of manually finding
and removing offensive language online extremely challenging. As a result, there is an
increasing need for automatic offensive language identification, particularly in cases when
posts are written in complex languages or lack resources, such as Arabic.
In this work, we focused on Algerian dialects. We used different machine learning algorithms:
Logistic Regression, SVM, MultinomialNB, BernoulliNB, and Stochastic Gradient
Descent. Our best results yielded accuracies of 89.70% and 89.19% for the Term
Frequency-Inverse Document Frequency (TFIDF) with n-gram and Bag of Words (BoW)
with n-gram, respectively, using MultinomialNB and BernoulliNB classifiers.
Additionally, we utilized Convolutional Neural Networks (CNN) and Long Short-Term
Memory (LSTM) models with BERT for data analysis, in our case we used marBERT v2.
In this experiment, LSTM achieved an accuracy of 89.20%. However, marBERT v2 alone
outperformed all previous experiments with an accuracy of 95%.
Note de contenu : Sommaire
List of Figures i
List of Tables iv
General introduction 1
1 Offensive Language 3
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Offensive language . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.2 Offensive language types . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.3 Offensive language categories . . . . . . . . . . . . . . . . . . . . . 7
1.2.4 Different definitions of offensive language . . . . . . . . . . . . . . . 8
1.2.5 Offensive language in social media and peoples’ cultures . . . . . . 9
1.3 International laws . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4 Related works . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4.1 Current state in offensive language detection and related concept . 13
1.4.2 Summary and Analysis . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2 Machine Learning 20
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3 Machine Learning types . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.1 Supervised Learning . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.2 Unsupervised Learning . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3.3 Reinforcement Learning . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3.4 Semi-supervised Learning . . . . . . . . . . . . . . . . . . . . . . . 23
2.4 Machine Learning algorithms . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4.1 Logistic regression . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4.2 Naive Bayes classifier . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4.3 Stochastic Gradient Descent . . . . . . . . . . . . . . . . . . . . . . 24
2.4.4 Support Vector Machine . . . . . . . . . . . . . . . . . . . . . . . . 24
2.5 Machine Learning concepts . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.6 Machine Learning process . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.6.1 Data collection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.6.2 Preparation data . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.6.3 Choosing a model . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6.4 Training the model . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6.5 Testing the model . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6.6 Improve the model . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
.6.7 Prediction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.7 Deep Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.7.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.7.2 Deep Learning types . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3 Sentiment Analysis 31
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2 Sentiment Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2.1 Sentiments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2.2 Sentiments Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.3 Subjectivity classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.4 Sentiment analysis levels . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.4.1 Document-level sentiment analysis . . . . . . . . . . . . . . . . . . 33
3.4.2 Sentence level of sentiment analysis . . . . . . . . . . . . . . . . . . 33
3.4.3 Word/Phrase Level of sentiment analysis . . . . . . . . . . . . . . . 33
3.5 Sentiment Analysis approaches . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.5.1 Machine Learning (ML) . . . . . . . . . . . . . . . . . . . . . . . . 33
3.5.2 Lexicon-based approach . . . . . . . . . . . . . . . . . . . . . . . . 34
3.5.3 Hybrid approach . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.6 Types of Sentiment Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.6.1 Emotion Recognition . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.6.2 Fine-Grained . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
...........
Côte titre : MAI/0913

Exemplaires (1)

Code-barres Cote Support Localisation Section Disponibilité
MAI/0913 MAI/0913 Mémoire Bibliothèque des sciences Anglais Disponible
Disponible

Analyse des sentiments des commentaires en arabe des lecteurs des journaux en lignes / Rania,Aberkane

Public

ISBD

Titre : Analyse des sentiments des commentaires en arabe des lecteurs des journaux en lignes
Type de document : texte imprimé
Auteurs : Rania,Aberkane, Auteur ; Sadik Bessou, Directeur de thèse
Editeur : Setif:UFA
Année de publication : 2018
Importance : 1 vol (77 f .)
Présentation : ill.
Format : 29 cm
Langues : Français (fre) Langues originales : Français (fre)
Catégories : Thèses & Mémoires:Informatique

Index. décimale : 004 Informatique
Côte titre : MAI/0218

Analyse des sentiments des commentaires en arabe des lecteurs des journaux en lignes [texte imprimé] / Rania,Aberkane, Auteur ; Sadik Bessou, Directeur de thèse . - [S.l.] : Setif:UFA, 2018 . - 1 vol (77 f .) : ill. ; 29 cm.
Langues : Français (fre) Langues originales : Français (fre)
Catégories : Thèses & Mémoires:Informatique

Index. décimale : 004 Informatique
Côte titre : MAI/0218

Exemplaires (1)

Code-barres Cote Support Localisation Section Disponibilité
MAI/0218 MAI/0218 Mémoire Bibliothèque des sciences Français Disponible
Disponible

APPROCHE POUR L’INDEXATION ET L’UTILISATION DES RESSOURCES PEDAGOGIQUES DANS UN SYSTEME E-LEARNING PERVASIF / Brik ,Mourad

Public

ISBD

Titre : APPROCHE POUR L’INDEXATION ET L’UTILISATION DES RESSOURCES PEDAGOGIQUES DANS UN SYSTEME E-LEARNING PERVASIF
Type de document : texte imprimé
Auteurs : Brik ,Mourad, Auteur ; Sadik Bessou, Directeur de thèse
Editeur : Setif:UFA
Année de publication : 2021
Importance : 1 vol (96 f .)
Format : 29 cm
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique

Mots-clés : Systèmes de recommandation
Sensibilité au contexte
Index. décimale : 004 - Informatique
Résumé :
Le travail présenté dans cette thèse concerne les systèmes de recommandation sensibles au
contexte (CARS), plus précisément nous concentrons sur la détection automatique des
conditions contextuelles (valeurs des facteurs contextuelles) qui influencent le processus de
recommandation. Dans les recherches récentes, l’intégration du contexte dans les applications
de recommandation a été démontrée leur efficacité en générant des items aux utilisateurs non
seulement pertinents mais également convenables à leurs contexte. Tandis que, la sélection des
facteurs de contexte est une tache exigeante en ressources qui nécessite dans la plus part des
cas l’intervention d’un expert de domaine.
Le principale contribution de ce travail de thèse est basée sur l'analyse des comportements
des utilisateurs au sein d’un système de recommandation à base de filtrage collaboratif afin de
deviner les conditions contextuelles relatives à la consommation adéquate des items en utilisant
la matrice des votes générée par les systèmes de recommandation à base de filtrage collaboratif.
Un profil d'utilisateur qui englobe à la fois les données concernant les utilisateurs et les données
de contexte a été proposé dans ce travail. Nous proposons aussi une méthode de modélisation
de contexte à base de règles sémantiques qui se penche sur l'analyse de comportement des
utilisateurs. Nous avons appliqué cette proposition dans le domaine de l'éducation dans lequel
nous avons conçu un outil permettant la création des objets d'apprentissages. Ce système vise à
améliorer la tâche de production des objets d'apprentissage (création, révision, édition…) en
offrant un environnement collaboratif grâce aux technologies fournies par les systèmes de
filtrage collaboratifs ainsi que l’analyse des comportements des utilisateurs pour améliorer le
processus de recommandation dans les environnements pervasifs.
La prise en compte du contexte pour la génération de recommandations futures adopte
l’approche pré-filtrage contextuel avec une méthode probabiliste (Naïve Bayes), qui permet la
génération des items personnalisés avant que les recommandations soient faites.
Un test a été mené sur des utilisateurs réels montre que l’approche sémantique proposée est
promoteur pour ce genre de contexte.
Côte titre : DI/0067
En ligne : https://drive.google.com/file/d/1dTbBpVFDTbS_2r20_z2KY3iYdlYgTjpt/view?usp=shari [...]
Format de la ressource électronique : pdf

APPROCHE POUR L’INDEXATION ET L’UTILISATION DES RESSOURCES PEDAGOGIQUES DANS UN SYSTEME E-LEARNING PERVASIF [texte imprimé] / Brik ,Mourad, Auteur ; Sadik Bessou, Directeur de thèse . - [S.l.] : Setif:UFA, 2021 . - 1 vol (96 f .) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique

Mots-clés : Systèmes de recommandation
Sensibilité au contexte
Index. décimale : 004 - Informatique
Résumé :
Le travail présenté dans cette thèse concerne les systèmes de recommandation sensibles au
contexte (CARS), plus précisément nous concentrons sur la détection automatique des
conditions contextuelles (valeurs des facteurs contextuelles) qui influencent le processus de
recommandation. Dans les recherches récentes, l’intégration du contexte dans les applications
de recommandation a été démontrée leur efficacité en générant des items aux utilisateurs non
seulement pertinents mais également convenables à leurs contexte. Tandis que, la sélection des
facteurs de contexte est une tache exigeante en ressources qui nécessite dans la plus part des
cas l’intervention d’un expert de domaine.
Le principale contribution de ce travail de thèse est basée sur l'analyse des comportements
des utilisateurs au sein d’un système de recommandation à base de filtrage collaboratif afin de
deviner les conditions contextuelles relatives à la consommation adéquate des items en utilisant
la matrice des votes générée par les systèmes de recommandation à base de filtrage collaboratif.
Un profil d'utilisateur qui englobe à la fois les données concernant les utilisateurs et les données
de contexte a été proposé dans ce travail. Nous proposons aussi une méthode de modélisation
de contexte à base de règles sémantiques qui se penche sur l'analyse de comportement des
utilisateurs. Nous avons appliqué cette proposition dans le domaine de l'éducation dans lequel
nous avons conçu un outil permettant la création des objets d'apprentissages. Ce système vise à
améliorer la tâche de production des objets d'apprentissage (création, révision, édition…) en
offrant un environnement collaboratif grâce aux technologies fournies par les systèmes de
filtrage collaboratifs ainsi que l’analyse des comportements des utilisateurs pour améliorer le
processus de recommandation dans les environnements pervasifs.
La prise en compte du contexte pour la génération de recommandations futures adopte
l’approche pré-filtrage contextuel avec une méthode probabiliste (Naïve Bayes), qui permet la
génération des items personnalisés avant que les recommandations soient faites.
Un test a été mené sur des utilisateurs réels montre que l’approche sémantique proposée est
promoteur pour ce genre de contexte.
Côte titre : DI/0067
En ligne : https://drive.google.com/file/d/1dTbBpVFDTbS_2r20_z2KY3iYdlYgTjpt/view?usp=shari [...]
Format de la ressource électronique : pdf

Exemplaires (1)

Code-barres Cote Support Localisation Section Disponibilité
DI/0067 DI/0067 Thèse Bibliothèque des sciences Français Disponible
Disponible

Arabic Sentiments Analysis Using Machine Learning / Hamza,Hiba

Public

ISBD

Titre : Arabic Sentiments Analysis Using Machine Learning
Type de document : texte imprimé
Auteurs : Hamza,Hiba, Auteur ; Sadik Bessou, Directeur de thèse
Editeur : Setif:UFA
Année de publication : 2021
Importance : 1 vol (57 f .)
Format : 29 cm
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique

Mots-clés : Analyse des sentiments
Langue arabe
Traitement du langage naturel
Index. décimale : 004 - Informatique
Résumé :
L’analyse des sentiments est une tâche de traitement du langage naturel qui a récemment
attiré une attention croissante, en particulier dans les entreprises, le marketing et les politiques,
où l’analyse des sentiments donne une idée complète de ce que les gens aiment et
n’aiment pas, et de leur sentiment envers les produits, les idées, services, etc. L’analyse des
sentiments est apparue après la prolifération des services de réseaux sociaux comme Facebook,
Twitter, Youtube, des plateformes de blogs et des forums où les internautes peuvent
partager facilement leurs pensées et leurs points de vue via ces plateformes où une quantité
massive de données est générée quotidiennement. Cependant, les recherches sur l’analyse
des sentiments ont été principalement menées pour la langue anglaise. Bien que l’arabe devienne
l’une des langues les plus utilisées sur Internet, seules quelques études se sont jusqu’à
présent concentrées sur l’analyse des sentiments en arabe.
Dans cette thèse, nous présentons les détails de la collecte d’un grand ensemble de don–nées
"corpus" des commentaires et des publications en langue arabe provenant de plateformes de
médias sociaux. Les techniques utilisées pour le prétraitement de l’ensemble de données collectées
sont expliquées. Nous présentons nos trois classes : positive, négative et neutre.
Nous avons proposé et évalué plusieurs méthodes d’apprentissage automatique pour classer
les commentaires: Machine à Vecteurs de Support, Régression Logistique, Forêt Aléatoire et
Bayes Naïves. Et un modèle N-gram a été proposé où les documents sont classés sur la base
de: unigrammes, bigramset trigrammes.Les meilleurs résultats de la précision que nous avons
obtenue de mot en utilisant Tfidfvectorizer unigrammes était 88.26% avec le classificateur
Forêt Aléatoire, et Les meilleurs précisions de caractère 87.42% en utilisant Countvectorize
avec le classificateur Régression Logistique en utilisant trigrammmes.
Côte titre : MAI/0478
En ligne : https://drive.google.com/file/d/18DpQVRvHdHXDmaMYF3Kqmmk5JD2UbPGi/view?usp=shari [...]
Format de la ressource électronique : pdf

Arabic Sentiments Analysis Using Machine Learning [texte imprimé] / Hamza,Hiba, Auteur ; Sadik Bessou, Directeur de thèse . - [S.l.] : Setif:UFA, 2021 . - 1 vol (57 f .) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique

Mots-clés : Analyse des sentiments
Langue arabe
Traitement du langage naturel
Index. décimale : 004 - Informatique
Résumé :
L’analyse des sentiments est une tâche de traitement du langage naturel qui a récemment
attiré une attention croissante, en particulier dans les entreprises, le marketing et les politiques,
où l’analyse des sentiments donne une idée complète de ce que les gens aiment et
n’aiment pas, et de leur sentiment envers les produits, les idées, services, etc. L’analyse des
sentiments est apparue après la prolifération des services de réseaux sociaux comme Facebook,
Twitter, Youtube, des plateformes de blogs et des forums où les internautes peuvent
partager facilement leurs pensées et leurs points de vue via ces plateformes où une quantité
massive de données est générée quotidiennement. Cependant, les recherches sur l’analyse
des sentiments ont été principalement menées pour la langue anglaise. Bien que l’arabe devienne
l’une des langues les plus utilisées sur Internet, seules quelques études se sont jusqu’à
présent concentrées sur l’analyse des sentiments en arabe.
Dans cette thèse, nous présentons les détails de la collecte d’un grand ensemble de don–nées
"corpus" des commentaires et des publications en langue arabe provenant de plateformes de
médias sociaux. Les techniques utilisées pour le prétraitement de l’ensemble de données collectées
sont expliquées. Nous présentons nos trois classes : positive, négative et neutre.
Nous avons proposé et évalué plusieurs méthodes d’apprentissage automatique pour classer
les commentaires: Machine à Vecteurs de Support, Régression Logistique, Forêt Aléatoire et
Bayes Naïves. Et un modèle N-gram a été proposé où les documents sont classés sur la base
de: unigrammes, bigramset trigrammes.Les meilleurs résultats de la précision que nous avons
obtenue de mot en utilisant Tfidfvectorizer unigrammes était 88.26% avec le classificateur
Forêt Aléatoire, et Les meilleurs précisions de caractère 87.42% en utilisant Countvectorize
avec le classificateur Régression Logistique en utilisant trigrammmes.
Côte titre : MAI/0478
En ligne : https://drive.google.com/file/d/18DpQVRvHdHXDmaMYF3Kqmmk5JD2UbPGi/view?usp=shari [...]
Format de la ressource électronique : pdf

Exemplaires (1)

Code-barres Cote Support Localisation Section Disponibilité
MAI/0478 MAI/0478 Mémoire Bibliothèque des sciences Anglais Disponible
Disponible

Arabic Subjective Sentiment Analysis Using Machine Learning / Besma Mokrane Ghadir

Public

ISBD

Titre : Arabic Subjective Sentiment Analysis Using Machine Learning
Type de document : texte imprimé
Auteurs : Besma Mokrane Ghadir, Auteur ; Aouatif Bouchareb, Auteur ; Sadik Bessou, Directeur de thèse
Année de publication : 2022
Importance : 1 vol (6 1f .)
Format : 29cm
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique

Mots-clés : Informatique
Index. décimale : 004 Informatique
Résumé :
Sentiment analysis has gotten a lot of attention in the recent decade because of the
benefits it may give in several fields, including politics, social sciences, marketing and
economics... because social networks are now full of texts in which Internet users express
themselves on a variety of topics and their opinions are important in making decisions in
many of these fields.
Unfortunately, most of the resources and systems developed in this field are designed
for English and other European languages, and sentiment analysis in the Arabic language
has only recently begun to be researched and developed, and progress is slow compared
to research in English and other languages.
In this work, we will make our mark in the field of Arabic sentiment analysis using
machine learning by doing several experiments on the effect of using word and character
grams with different N-grams (unigram, bigram, trigram and 4-gram) and different vectorizer
(CountVectorizer and Tfidfvectorizer), and see how the outcome will change also
we used in all our experiment five of ML algorithms (SVM, NB, LR, RF, DT).
We applied our experiments on two sets of data that were about Twitter comments
and restaurant reviews, categorized into three groups, positive, negative, and neutral, and
containing 23 414 comments.
After we did all the experiments on our data and saw all the results, we came to the
conclusion that the algorithm of Logistic Regression gave us the best result with wordgram
and char-gram which we reached accuracy 90% and 91% respectively and the best
n-gram was the bigram for the word-gram and the trigram for the char-gram and the best
vectorizer was TfidfVectorizer.
Côte titre : MAI/0694
En ligne : https://drive.google.com/file/d/1yxnHJoZ6uOlD5yqlcNIKtVEfZd1oUeLI/view?usp=share [...]
Format de la ressource électronique : pdf

Arabic Subjective Sentiment Analysis Using Machine Learning [texte imprimé] / Besma Mokrane Ghadir, Auteur ; Aouatif Bouchareb, Auteur ; Sadik Bessou, Directeur de thèse . - 2022 . - 1 vol (6 1f .) ; 29cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique

Mots-clés : Informatique
Index. décimale : 004 Informatique
Résumé :
Sentiment analysis has gotten a lot of attention in the recent decade because of the
benefits it may give in several fields, including politics, social sciences, marketing and
economics... because social networks are now full of texts in which Internet users express
themselves on a variety of topics and their opinions are important in making decisions in
many of these fields.
Unfortunately, most of the resources and systems developed in this field are designed
for English and other European languages, and sentiment analysis in the Arabic language
has only recently begun to be researched and developed, and progress is slow compared
to research in English and other languages.
In this work, we will make our mark in the field of Arabic sentiment analysis using
machine learning by doing several experiments on the effect of using word and character
grams with different N-grams (unigram, bigram, trigram and 4-gram) and different vectorizer
(CountVectorizer and Tfidfvectorizer), and see how the outcome will change also
we used in all our experiment five of ML algorithms (SVM, NB, LR, RF, DT).
We applied our experiments on two sets of data that were about Twitter comments
and restaurant reviews, categorized into three groups, positive, negative, and neutral, and
containing 23 414 comments.
After we did all the experiments on our data and saw all the results, we came to the
conclusion that the algorithm of Logistic Regression gave us the best result with wordgram
and char-gram which we reached accuracy 90% and 91% respectively and the best
n-gram was the bigram for the word-gram and the trigram for the char-gram and the best
vectorizer was TfidfVectorizer.
Côte titre : MAI/0694
En ligne : https://drive.google.com/file/d/1yxnHJoZ6uOlD5yqlcNIKtVEfZd1oUeLI/view?usp=share [...]
Format de la ressource électronique : pdf

Exemplaires (1)

Code-barres Cote Support Localisation Section Disponibilité
MAI/0694 MAI/0694 Mémoire Bibliothèque des sciences Anglais Disponible
Disponible

Author profiling for Algerian social media users in Modern standard Arabic and Algerian dialect / Khenafi, Amani

Permalink
Author proling for social media users in Arabic language / Ayad, Rayane

Permalink
Complexité lexicale des textes Arabes par les techniques d’apprentissage automatique / Chenni,Ghozlene

Permalink
Conception et Implémentation d’Architectures Modulaires et Hiérarchiques en Reconnaissance Biométrique / Regouid,Meryem

Permalink
Conception et réalisation d'une application multi-plateforme pour la gestion numérique de l'Ecole (e-school) / Khadidja Barkat

Permalink
Contribution au niveau de l’approche indirecte à base de transfert dans la traduction automatique / Sadik Bessou

Permalink
Contribution au niveau de l’approche indirecte à base de transfert dans la traduction automatique / Sadik Bessou

Permalink
DEVELOPMENT OF A MOBILE APPLICATION IN THE CONTEXT OF UBERIZATION: ARCHITECTURE AND USER EXPERIENCE / Lydia Nakivumbi

Permalink
D´etection De La Langue Arabe Offensante Dans Les M´edias Sociaux / Anis Mebarki

Permalink
Healthcare Solutions: Application cross- platform for instant medical services on demand easy-care / Rafik Zemouri

Permalink