Titre : |
Analyse des Sentiments Dans un Corpus de Tweets : Eude Comparative de Classificateurs |
Type de document : |
texte imprimé |
Auteurs : |
Guettal ,Sarra, Auteur ; Benzine, Mehdi, Directeur de thèse |
Editeur : |
Setif:UFA |
Année de publication : |
2019 |
Importance : |
1 vol (66 f .) |
Format : |
29 cm |
Langues : |
Français (fre) |
Catégories : |
Thèses & Mémoires:Informatique
|
Mots-clés : |
Machine à vecteur de support
Complément Naïve Bayes
Arbres de décision
Multinomial Naïve Bayes
Régression logistique
Twitter
Twitter |
Index. décimale : |
004 - Informatique |
Résumé : |
Twitter est l’un des réseaux sociaux les plus populaire. Est un service de microblogging qui nous permet d’exprimer nos opinions et pour cette raison Twitter est devenu une source de données très populaire pour L’analyse des sentiments qui est une technologie d’analyse automatique des discours, écrits ou parlés dans le but consiste à extraire des informations subjectives comme des jugements, des évaluations ou des émotions pour détecter la polarité d’une opinion. L’importance de l’analyse des sentiments est présente dans plusieurs domaines, à savoir politique, marketing, gestion de la réputation, ... Dans ce mémoire, nous utiliserons Twitter comme une source pour nos données et ferons une étude comparative entre cinq classificateurs qui sont : Machine à vecteur de support, Complément Naïve Bayes, Arbres de décision, Multinomial Naïve Bayes et Régression logistique à fin d’évaluer leur performance. |
Note de contenu : |
Sommaire
DEDICACE ......................................................................................................... 1
REMERCIMENT ................................................................................................................ 2
Table de Matière .................................................................................................................. 3
Liste des Figures .................................................................................................................. 6
Liste des Tableaux ............................................................................................................... 8
Résumé .......................................................................................................
Abstract ....................................................................................................... 9
Introduction Générale ....................................................................................................... 10
Chapitre 1 ........................................................................................................................... 13
État de l’Art .................................................................................................. 13
1. Introduction ......................................................................................................... 13
2. L’apprentissage automatique............................................................................................... 13
2.1. Processus de l’apprentissage automatique ................................................................. 13
2.2. Types d’apprentissage .................................................................................................. 14
2.2.1. Apprentissage supervisé (prédictif) ..................................................................... 14
2.2.1.1. Algorithmes de l’apprentissage supervisé ....................................................... 14
2.2.1.1.1. Classification Naïve Bayes ......................................................................... 14
2.2.1.1.2. Machine a Vecteur de Support (SVM) ...................................................... 15
2.2.1.1.3. Arbre de décision ...........................................................................18
2.2.1.1.4. Régression logistique ................................................................................ 19
2.2.1.1.5. Réseau de neurones .................................................................................. 21
2.2.1.1.6. Régression linéaire .................................................................................... 24 2.2.1.1.7. K plus proches voisins (KNN) ..................................................................... 25
2.2.2. Apprentissage non-supervisé (descriptif) ............................................................ 26
2.2.2.1. Algorithmes de l’apprentissage non-supervisé ................................................ 26
2.2.2.1.1. K-Means .................................................................................................... 26
2.2.2.1.2. Règles d’association .................................................................................. 27
2.2.2.2. Quelques applications de l’apprentissage non-supervisé ................................ 28
3. Fouille de Texte (Text Mining) .............................................................................................. 28
3.1. Les étapes de Text Mining ............................................................................................ 28
3.1.1. La collecte de données ......................................................................................... 28
Analyse des Sentiments Dans un Corpus de Tweets : Eude Comparative de Classifieurs
4
3.1.2. Prétraitement de texte ......................................................................................... 28
3.1.3. Transformation ..................................................................................................... 29
3.2. Domaine d’application de Fouille de texte (Text Mining) ............................................ 30
4. Classification des textes ....................................................................................................... 31
4.1. Le processus de classification de texte .......................................................... 32
4.2. Algorithmes de classification de texte .......................................................... 33
5. Analyse des sentiments ........................................................................................................ 33
5.1. Les Composants de Sentiment ..................................................................................... 34 5.2. Les niveaux de classification des sentiments ............................................................... 34
5.3. Méthodes de classification des sentiments ................................................................. 34
5.3.1. Méthode basée sur le lexique .............................................................................. 34 5.3.2. Méthode d’apprentissage automatique .............................................................. 35
6. Traitement du Langage Naturel ........................................................................................... 36
7. Conclusion ............................................................................................................ 38
Chapitre 2 ........................................................................................................................... 40
Contribution ....................................................................................... 40
1. Introduction ........................................................................................ 40
2. Les médias sociaux ............................................................................................................... 40
3. Twitter ................................................................................... 40
4. Phase d’apprentissage ......................................................................................................... 42
4.1. La construction du corpus ............................................................................................ 42 4.2. Prétraitement ............................................................................................................... 43
4.2.1. Tokenisation ......................................................................................................... 43
4.2.2. Suppression des mots vides (stopwords) ............................................................. 44
4.2.3. Lemmatisation ...................................................................................................... 46
4.3. Transformation ............................................................................................................. 46
4.3.1. La représentation avec les co-occurrences ..........................................................
46 4.3.2. La représentation avec le modèle de pondération Tf-IDf .................................... 46
4.4. L’apprentissage (la classification) ................................................................................. 47
5. La phase test.................................................................................................. 49
6. Conclusion ............................................................................................................................ 50
Chapitre 3 ...................................................................................................... 52
Expérimentation ................................................................................................................ 52
1. Environnement de développement ........................................................................... 52
Analyse des Sentiments Dans un Corpus de Tweets : Eude Comparative de Classifieurs
Python............................................................................................... 52
1.2. Jupyter Notebook .................................................................................. 52
1.3. Anaconda .......................................................................................................... 53
1.4. Pandas................................................................................................................ 53
1.5. Numpy ............................................................................................................... 53
1.6. Nltk .................................................................................................................... 53
2. Implémentation ......................................................................................................... 54
3. Les résultats .............................................................................................................. 54
3.1. Multinomial Naïve Bayes.................................................................................. 54
3.2. Complément Naïve Bayes ................................................................................. 56
3.3. Arbre de décision .............................................................................................. 57
3.4. Machine a Vecteur de Support .......................................................................... 58
3.5. Régression Logistique ............................................................................ 59
4. Comparaison ............................................................................................................. 61
4.1. Par rapport au temps d’exécution ...................................................................... 61
4.2. Par rapport à la performance ............................................................................. 63
5. Conclusion ................................................................................................................ 64
Conclusion Générale ......................................................................................................... 65
Références........................................................................................... 66 |
Côte titre : |
MAI/0331 |
En ligne : |
https://drive.google.com/file/d/19_CotLXfMzYk6yQUr0-22-LB1sfPXK--/view?usp=shari [...] |
Format de la ressource électronique : |
pdf |
Analyse des Sentiments Dans un Corpus de Tweets : Eude Comparative de Classificateurs [texte imprimé] / Guettal ,Sarra, Auteur ; Benzine, Mehdi, Directeur de thèse . - [S.l.] : Setif:UFA, 2019 . - 1 vol (66 f .) ; 29 cm. Langues : Français ( fre)
Catégories : |
Thèses & Mémoires:Informatique
|
Mots-clés : |
Machine à vecteur de support
Complément Naïve Bayes
Arbres de décision
Multinomial Naïve Bayes
Régression logistique
Twitter
Twitter |
Index. décimale : |
004 - Informatique |
Résumé : |
Twitter est l’un des réseaux sociaux les plus populaire. Est un service de microblogging qui nous permet d’exprimer nos opinions et pour cette raison Twitter est devenu une source de données très populaire pour L’analyse des sentiments qui est une technologie d’analyse automatique des discours, écrits ou parlés dans le but consiste à extraire des informations subjectives comme des jugements, des évaluations ou des émotions pour détecter la polarité d’une opinion. L’importance de l’analyse des sentiments est présente dans plusieurs domaines, à savoir politique, marketing, gestion de la réputation, ... Dans ce mémoire, nous utiliserons Twitter comme une source pour nos données et ferons une étude comparative entre cinq classificateurs qui sont : Machine à vecteur de support, Complément Naïve Bayes, Arbres de décision, Multinomial Naïve Bayes et Régression logistique à fin d’évaluer leur performance. |
Note de contenu : |
Sommaire
DEDICACE ......................................................................................................... 1
REMERCIMENT ................................................................................................................ 2
Table de Matière .................................................................................................................. 3
Liste des Figures .................................................................................................................. 6
Liste des Tableaux ............................................................................................................... 8
Résumé .......................................................................................................
Abstract ....................................................................................................... 9
Introduction Générale ....................................................................................................... 10
Chapitre 1 ........................................................................................................................... 13
État de l’Art .................................................................................................. 13
1. Introduction ......................................................................................................... 13
2. L’apprentissage automatique............................................................................................... 13
2.1. Processus de l’apprentissage automatique ................................................................. 13
2.2. Types d’apprentissage .................................................................................................. 14
2.2.1. Apprentissage supervisé (prédictif) ..................................................................... 14
2.2.1.1. Algorithmes de l’apprentissage supervisé ....................................................... 14
2.2.1.1.1. Classification Naïve Bayes ......................................................................... 14
2.2.1.1.2. Machine a Vecteur de Support (SVM) ...................................................... 15
2.2.1.1.3. Arbre de décision ...........................................................................18
2.2.1.1.4. Régression logistique ................................................................................ 19
2.2.1.1.5. Réseau de neurones .................................................................................. 21
2.2.1.1.6. Régression linéaire .................................................................................... 24 2.2.1.1.7. K plus proches voisins (KNN) ..................................................................... 25
2.2.2. Apprentissage non-supervisé (descriptif) ............................................................ 26
2.2.2.1. Algorithmes de l’apprentissage non-supervisé ................................................ 26
2.2.2.1.1. K-Means .................................................................................................... 26
2.2.2.1.2. Règles d’association .................................................................................. 27
2.2.2.2. Quelques applications de l’apprentissage non-supervisé ................................ 28
3. Fouille de Texte (Text Mining) .............................................................................................. 28
3.1. Les étapes de Text Mining ............................................................................................ 28
3.1.1. La collecte de données ......................................................................................... 28
Analyse des Sentiments Dans un Corpus de Tweets : Eude Comparative de Classifieurs
4
3.1.2. Prétraitement de texte ......................................................................................... 28
3.1.3. Transformation ..................................................................................................... 29
3.2. Domaine d’application de Fouille de texte (Text Mining) ............................................ 30
4. Classification des textes ....................................................................................................... 31
4.1. Le processus de classification de texte .......................................................... 32
4.2. Algorithmes de classification de texte .......................................................... 33
5. Analyse des sentiments ........................................................................................................ 33
5.1. Les Composants de Sentiment ..................................................................................... 34 5.2. Les niveaux de classification des sentiments ............................................................... 34
5.3. Méthodes de classification des sentiments ................................................................. 34
5.3.1. Méthode basée sur le lexique .............................................................................. 34 5.3.2. Méthode d’apprentissage automatique .............................................................. 35
6. Traitement du Langage Naturel ........................................................................................... 36
7. Conclusion ............................................................................................................ 38
Chapitre 2 ........................................................................................................................... 40
Contribution ....................................................................................... 40
1. Introduction ........................................................................................ 40
2. Les médias sociaux ............................................................................................................... 40
3. Twitter ................................................................................... 40
4. Phase d’apprentissage ......................................................................................................... 42
4.1. La construction du corpus ............................................................................................ 42 4.2. Prétraitement ............................................................................................................... 43
4.2.1. Tokenisation ......................................................................................................... 43
4.2.2. Suppression des mots vides (stopwords) ............................................................. 44
4.2.3. Lemmatisation ...................................................................................................... 46
4.3. Transformation ............................................................................................................. 46
4.3.1. La représentation avec les co-occurrences ..........................................................
46 4.3.2. La représentation avec le modèle de pondération Tf-IDf .................................... 46
4.4. L’apprentissage (la classification) ................................................................................. 47
5. La phase test.................................................................................................. 49
6. Conclusion ............................................................................................................................ 50
Chapitre 3 ...................................................................................................... 52
Expérimentation ................................................................................................................ 52
1. Environnement de développement ........................................................................... 52
Analyse des Sentiments Dans un Corpus de Tweets : Eude Comparative de Classifieurs
Python............................................................................................... 52
1.2. Jupyter Notebook .................................................................................. 52
1.3. Anaconda .......................................................................................................... 53
1.4. Pandas................................................................................................................ 53
1.5. Numpy ............................................................................................................... 53
1.6. Nltk .................................................................................................................... 53
2. Implémentation ......................................................................................................... 54
3. Les résultats .............................................................................................................. 54
3.1. Multinomial Naïve Bayes.................................................................................. 54
3.2. Complément Naïve Bayes ................................................................................. 56
3.3. Arbre de décision .............................................................................................. 57
3.4. Machine a Vecteur de Support .......................................................................... 58
3.5. Régression Logistique ............................................................................ 59
4. Comparaison ............................................................................................................. 61
4.1. Par rapport au temps d’exécution ...................................................................... 61
4.2. Par rapport à la performance ............................................................................. 63
5. Conclusion ................................................................................................................ 64
Conclusion Générale ......................................................................................................... 65
Références........................................................................................... 66 |
Côte titre : |
MAI/0331 |
En ligne : |
https://drive.google.com/file/d/19_CotLXfMzYk6yQUr0-22-LB1sfPXK--/view?usp=shari [...] |
Format de la ressource électronique : |
pdf |
|