Titre : |
Arabic Sentiments Analysis Using Machine Learning |
Type de document : |
texte imprimé |
Auteurs : |
Hamza,Hiba, Auteur ; Sadik Bessou, Directeur de thèse |
Editeur : |
Setif:UFA |
Année de publication : |
2021 |
Importance : |
1 vol (57 f .) |
Format : |
29 cm |
Langues : |
Français (fre) |
Catégories : |
Thèses & Mémoires:Informatique
|
Mots-clés : |
Analyse des sentiments
Langue arabe
Traitement du langage naturel |
Index. décimale : |
004 - Informatique |
Résumé : |
L’analyse des sentiments est une tâche de traitement du langage naturel qui a récemment
attiré une attention croissante, en particulier dans les entreprises, le marketing et les politiques,
où l’analyse des sentiments donne une idée complète de ce que les gens aiment et
n’aiment pas, et de leur sentiment envers les produits, les idées, services, etc. L’analyse des
sentiments est apparue après la prolifération des services de réseaux sociaux comme Facebook,
Twitter, Youtube, des plateformes de blogs et des forums où les internautes peuvent
partager facilement leurs pensées et leurs points de vue via ces plateformes où une quantité
massive de données est générée quotidiennement. Cependant, les recherches sur l’analyse
des sentiments ont été principalement menées pour la langue anglaise. Bien que l’arabe devienne
l’une des langues les plus utilisées sur Internet, seules quelques études se sont jusqu’Ã
présent concentrées sur l’analyse des sentiments en arabe.
Dans cette thèse, nous présentons les détails de la collecte d’un grand ensemble de don–nées
"corpus" des commentaires et des publications en langue arabe provenant de plateformes de
médias sociaux. Les techniques utilisées pour le prétraitement de l’ensemble de données collectées
sont expliquées. Nous présentons nos trois classes : positive, négative et neutre.
Nous avons proposé et évalué plusieurs méthodes d’apprentissage automatique pour classer
les commentaires: Machine à Vecteurs de Support, Régression Logistique, Forêt Aléatoire et
Bayes Naïves. Et un modèle N-gram a été proposé où les documents sont classés sur la base
de: unigrammes, bigramset trigrammes.Les meilleurs résultats de la précision que nous avons
obtenue de mot en utilisant Tfidfvectorizer unigrammes était 88.26% avec le classificateur
Forêt Aléatoire, et Les meilleurs précisions de caractère 87.42% en utilisant Countvectorize
avec le classificateur Régression Logistique en utilisant trigrammmes. |
Côte titre : |
MAI/0478 |
En ligne : |
https://drive.google.com/file/d/18DpQVRvHdHXDmaMYF3Kqmmk5JD2UbPGi/view?usp=shari [...] |
Format de la ressource électronique : |
pdf |
Arabic Sentiments Analysis Using Machine Learning [texte imprimé] / Hamza,Hiba, Auteur ; Sadik Bessou, Directeur de thèse . - [S.l.] : Setif:UFA, 2021 . - 1 vol (57 f .) ; 29 cm. Langues : Français ( fre)
Catégories : |
Thèses & Mémoires:Informatique
|
Mots-clés : |
Analyse des sentiments
Langue arabe
Traitement du langage naturel |
Index. décimale : |
004 - Informatique |
Résumé : |
L’analyse des sentiments est une tâche de traitement du langage naturel qui a récemment
attiré une attention croissante, en particulier dans les entreprises, le marketing et les politiques,
où l’analyse des sentiments donne une idée complète de ce que les gens aiment et
n’aiment pas, et de leur sentiment envers les produits, les idées, services, etc. L’analyse des
sentiments est apparue après la prolifération des services de réseaux sociaux comme Facebook,
Twitter, Youtube, des plateformes de blogs et des forums où les internautes peuvent
partager facilement leurs pensées et leurs points de vue via ces plateformes où une quantité
massive de données est générée quotidiennement. Cependant, les recherches sur l’analyse
des sentiments ont été principalement menées pour la langue anglaise. Bien que l’arabe devienne
l’une des langues les plus utilisées sur Internet, seules quelques études se sont jusqu’Ã
présent concentrées sur l’analyse des sentiments en arabe.
Dans cette thèse, nous présentons les détails de la collecte d’un grand ensemble de don–nées
"corpus" des commentaires et des publications en langue arabe provenant de plateformes de
médias sociaux. Les techniques utilisées pour le prétraitement de l’ensemble de données collectées
sont expliquées. Nous présentons nos trois classes : positive, négative et neutre.
Nous avons proposé et évalué plusieurs méthodes d’apprentissage automatique pour classer
les commentaires: Machine à Vecteurs de Support, Régression Logistique, Forêt Aléatoire et
Bayes Naïves. Et un modèle N-gram a été proposé où les documents sont classés sur la base
de: unigrammes, bigramset trigrammes.Les meilleurs résultats de la précision que nous avons
obtenue de mot en utilisant Tfidfvectorizer unigrammes était 88.26% avec le classificateur
Forêt Aléatoire, et Les meilleurs précisions de caractère 87.42% en utilisant Countvectorize
avec le classificateur Régression Logistique en utilisant trigrammmes. |
Côte titre : |
MAI/0478 |
En ligne : |
https://drive.google.com/file/d/18DpQVRvHdHXDmaMYF3Kqmmk5JD2UbPGi/view?usp=shari [...] |
Format de la ressource électronique : |
pdf |
|