University Sétif 1 FERHAT ABBAS Faculty of Sciences
Détail de l'auteur
Auteur Oussama Bouberrima |
Documents disponibles écrits par cet auteur



Comparison between deep and machine learning for Arabic sentiment analysis / Yahia Salah Eddine Sersoub
Titre : Comparison between deep and machine learning for Arabic sentiment analysis Type de document : texte imprimé Auteurs : Yahia Salah Eddine Sersoub, Auteur ; Oussama Bouberrima ; Fatiha Tebbani, Directeur de thèse Editeur : Setif:UFA Année de publication : 2024 Importance : 1 vol (47 f .) Format : 29 cm Langues : Anglais (eng) Catégories : Thèses & Mémoires:Informatique Mots-clés : Informatique Index. décimale : 004 - Informatique Résumé :
This work explores the effectiveness of machine learning and deep learning
methods for sentiment analysis in Arabic dialects. The goal is to determine
the most effective method for analyzing Arabic emotions, whether deep
learning or machine learning, and to classify text excerpts into three
emotional categories : positive, negative, and neutral. This work uses
several machine learning algorithms such as support vector machines and
random forests, as well as deep learning architectures such as
convolutional neural networks and recurrent neural networks. The results
and performance of these methods are compared and evaluated on datasets
specifically designed for the selected dialects.Note de contenu : Sommaire
General Introduction 1
1 Sentiment Analysis and the Arabic Language 1
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Sentiment analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3 Basic concepts of sentiment analysis . . . . . . . . . . . . . . . . . . . . . . 2
1.3.1 Objective vs. Subjective Sentences . . . . . . . . . . . . . . . . . . . 2
1.3.2 Categorization of feelings . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3.3 Sentiment analysis levels . . . . . . . . . . . . . . . . . . . . . . . 3
1.4 Sentiment analysis applications . . . . . . . . . . . . . . . . . . . . . . . . 4
1.5 Sentiment Analysis Classification (Approaches) . . . . . . . . . . . . . . . 5
1.6 Evaluation Measures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.7 Arabic language . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.7.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.7.2 Arabic language types . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.7.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2 Machine-Learning and Deep Learning 11
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2 Machine learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3 Why use machine learning . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3.1 Improve efficiency and automation . . . . . . . . . . . . . . . . . . 11
2.3.2 Better decision making . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3.3 Innovation and creation of new products and services . . . . . . . . 12
2.4 Types of machine learning . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.4.1 Supervised Learning . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.4.2 Unsupervised Learning . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4.3 Semi-Supervised Learning . . . . . . . . . . . . . . . . . . . . . . . 19
2.4.4 Reinforcement Learning . . . . . . . . . . . . . . . . . . . . . . . . 19
2.5 Machine Learning Steps . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.5.1 Data Collection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.5.2 Data Preprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.5.3 Choosing the right model . . . . . . . . . . . . . . . . . . . . . . . 21
2.5.4 Training the model . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.5.5 Evaluating the model . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.5.6 Hyperparameter tuning and optimization . . . . . . . . . . . . . . . 21
2.5.7 Predictions and deployment . . . . . . . . . . . . . . . . . . . . . . 21
2.6 Deep learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.6.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.7 Basic concepts of deep learning . . . . . . . . . . . . . . . . . . . . . . . . 22
2.7.1 Single Neuron . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.7.2 Activation functions . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.8 Deep learning architecture . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.8.1 Artificial Neural Networks (ANN) : . . . . . . . . . . . . . . . . . . 26
2.8.2 Recurrent Neural Networks (RNNs) : . . . . . . . . . . . . . . . . . 27
2.8.3 Long Short-Term Memory (LSTMs) . . . . . . . . . . . . . . . . . 28
2.8.4 Convolutional Neural Networks(CNN) . . . . . . . . . . . . . . . . 29
2.9 Conclusion : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3 Practical side 32
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2 Development environment . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2.1 Python : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2.2 Anaconda : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2.3 Jupyter notebook : . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2.4 Google colab : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2.5 Pandas : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2.6 Numpy : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2.7 Matplotlib . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2.8 Scikit-learn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2.9 Pickle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.2.10 NLTK (Natural Language ToolKit) . . . . . . . . . . . . . . . . . . 34
3.2.11 Gensim . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.2.12 Tkinter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.3 Data collection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.4 Implementation : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.4.1 Data pre-processing . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.4.2 Word Embedding . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.4.3 Implementation of Machine Learning algorithms : . . . . . . . . . . 38
3.4.4 Implementation of Deep Learning models : . . . . . . . . . . . . . . 41
3.4.5 Comparison of the results : . . . . . . . . . . . . . . . . . . . . . . 43
3.4.6 Model prediction result : . . . . . . . . . . . . . . . . . . . . . . . 46
3.4.7 Graphic Interface . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.5 Conclusion : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47Côte titre : MAI/0894 Comparison between deep and machine learning for Arabic sentiment analysis [texte imprimé] / Yahia Salah Eddine Sersoub, Auteur ; Oussama Bouberrima ; Fatiha Tebbani, Directeur de thèse . - [S.l.] : Setif:UFA, 2024 . - 1 vol (47 f .) ; 29 cm.
Langues : Anglais (eng)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Informatique Index. décimale : 004 - Informatique Résumé :
This work explores the effectiveness of machine learning and deep learning
methods for sentiment analysis in Arabic dialects. The goal is to determine
the most effective method for analyzing Arabic emotions, whether deep
learning or machine learning, and to classify text excerpts into three
emotional categories : positive, negative, and neutral. This work uses
several machine learning algorithms such as support vector machines and
random forests, as well as deep learning architectures such as
convolutional neural networks and recurrent neural networks. The results
and performance of these methods are compared and evaluated on datasets
specifically designed for the selected dialects.Note de contenu : Sommaire
General Introduction 1
1 Sentiment Analysis and the Arabic Language 1
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Sentiment analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3 Basic concepts of sentiment analysis . . . . . . . . . . . . . . . . . . . . . . 2
1.3.1 Objective vs. Subjective Sentences . . . . . . . . . . . . . . . . . . . 2
1.3.2 Categorization of feelings . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3.3 Sentiment analysis levels . . . . . . . . . . . . . . . . . . . . . . . 3
1.4 Sentiment analysis applications . . . . . . . . . . . . . . . . . . . . . . . . 4
1.5 Sentiment Analysis Classification (Approaches) . . . . . . . . . . . . . . . 5
1.6 Evaluation Measures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.7 Arabic language . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.7.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.7.2 Arabic language types . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.7.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2 Machine-Learning and Deep Learning 11
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2 Machine learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3 Why use machine learning . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3.1 Improve efficiency and automation . . . . . . . . . . . . . . . . . . 11
2.3.2 Better decision making . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3.3 Innovation and creation of new products and services . . . . . . . . 12
2.4 Types of machine learning . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.4.1 Supervised Learning . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.4.2 Unsupervised Learning . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4.3 Semi-Supervised Learning . . . . . . . . . . . . . . . . . . . . . . . 19
2.4.4 Reinforcement Learning . . . . . . . . . . . . . . . . . . . . . . . . 19
2.5 Machine Learning Steps . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.5.1 Data Collection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.5.2 Data Preprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.5.3 Choosing the right model . . . . . . . . . . . . . . . . . . . . . . . 21
2.5.4 Training the model . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.5.5 Evaluating the model . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.5.6 Hyperparameter tuning and optimization . . . . . . . . . . . . . . . 21
2.5.7 Predictions and deployment . . . . . . . . . . . . . . . . . . . . . . 21
2.6 Deep learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.6.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.7 Basic concepts of deep learning . . . . . . . . . . . . . . . . . . . . . . . . 22
2.7.1 Single Neuron . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.7.2 Activation functions . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.8 Deep learning architecture . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.8.1 Artificial Neural Networks (ANN) : . . . . . . . . . . . . . . . . . . 26
2.8.2 Recurrent Neural Networks (RNNs) : . . . . . . . . . . . . . . . . . 27
2.8.3 Long Short-Term Memory (LSTMs) . . . . . . . . . . . . . . . . . 28
2.8.4 Convolutional Neural Networks(CNN) . . . . . . . . . . . . . . . . 29
2.9 Conclusion : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3 Practical side 32
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2 Development environment . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2.1 Python : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2.2 Anaconda : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2.3 Jupyter notebook : . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2.4 Google colab : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2.5 Pandas : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2.6 Numpy : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2.7 Matplotlib . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2.8 Scikit-learn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2.9 Pickle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.2.10 NLTK (Natural Language ToolKit) . . . . . . . . . . . . . . . . . . 34
3.2.11 Gensim . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.2.12 Tkinter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.3 Data collection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.4 Implementation : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.4.1 Data pre-processing . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.4.2 Word Embedding . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.4.3 Implementation of Machine Learning algorithms : . . . . . . . . . . 38
3.4.4 Implementation of Deep Learning models : . . . . . . . . . . . . . . 41
3.4.5 Comparison of the results : . . . . . . . . . . . . . . . . . . . . . . 43
3.4.6 Model prediction result : . . . . . . . . . . . . . . . . . . . . . . . 46
3.4.7 Graphic Interface . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.5 Conclusion : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47Côte titre : MAI/0894 Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0894 MAI/0894 Mémoire Bibliothéque des sciences Anglais Disponible
Disponible