Titre : |
Modèle de Prédiction pour l’Extraction des Influenceurs les dans Réseaux Sociaux |
Type de document : |
texte imprimé |
Auteurs : |
Daîche ,Amina, Auteur ; Drif, Ahlam, Directeur de thèse |
Editeur : |
Setif:UFA |
Année de publication : |
2018 |
Importance : |
1 vol (74 f .) |
Format : |
29 cm |
Langues : |
Français (fre) Langues originales : Français (fre) |
Catégories : |
Thèses & Mémoires:Informatique
|
Mots-clés : |
Réseaux sociaux
Analyse de réseau
SVM
Extraction des connaissances
Détecter des influenceurs |
Index. décimale : |
004 Informatique |
Résumé : |
Résumé
Un média est par définition un outil émergeant du social. Les dispositifs de communication n’émergent qu’en société, sont produits par elle et évoluent en son niveau. Par ailleurs, le terme média appliqué aux différents sites Web et plateformes de réseaux sociaux par exemple Twitter et Foursquare. L’un des outils spécifiques à l’analyse de ces réseaux est la détection des influenceurs, et parmi les divers algorithmes de l’identification de l’influence il y a le PageRank, TwitterRank, IP Algorithm. Grâce à la disponibilité de grands volumes de données et du calcul intensif, sans oublier les avancées intéressantes en optimisation, les algorithmes et les systèmes d'apprentissage automatique ont connu d'importantes avancées, car ils ont une caractéristique majeure qui est la capacité à apprendre les descripteurs tout en effectuant le classement. Afin de prédire les utilisateurs influents sur le réseau Foursquare, nous effectuons sur notre benchmark choisi plusieurs étapes de prétraitement, visualisation et calcul de mesures structurelles de réseau, il soit prêt à l’application d’un algorithme d’apprentissage supervisé SVM, ce dernier prouve une performance remarquable dans la classification des noeuds influenceurs par apport à l’arbre de décision. |
Note de contenu : |
Sommaire
Partie théorique
Chapitre I: Les réseaux sociaux: concepts et définitions
I.2 Les médias sociaux ..................................................................................................... 5
I.2.1 Une mise en perspective historique .................................................................... 6
I.3 Les types des médias sociaux .................................................................................... 7
I.3.1 Twitter .................................................................................................................. 7
I.3.2 Les caractéristiques du Twitter ............................................................................ 9
I.3.3 Foursquare .......................................................................................................... 9
I.4 Diffusion de l’information ........................................................................................
I.4.1 La thématique .................................................................................................... 10
I.4.2 L’influence sociale ............................................................................................. 11
I.4.3 Les types des utilisateurs .................................................................................. 11
I.5 Les mesures des modèles de diffusion de l’information dans les OSN ................... 12
I.5 Conclusion ................................................................................................................ 13
Chapitre II : L’état de l’art
II.1 Introduction ............................................................................................................. 15
II.2 L’algorithme de Page Rank ..................................................................................... 15
II.3 Weighted PageRank ............................................................................................ 17
II.4 Topic-Sensitive PageRank ..................................................................................... 19
II.5 TwitterRank ............................................................................................................. 21
II.6 Influence- Passivity algorithm(IP algorithm) .......................................................... 23
II.7 Conclusion .............................................................................................................. 25
Chapitre III : Apprentissage automatique et classification
III.1 Introduction ............................................................................................................ 27
III.2 L’apprentissage automatique ................................................................................ 27
III.3 Objectif des algorithmes d’apprentissage ......................................................... 27
III.3.1 Par rapport à l'environnement ................................................................................. 27
III.3.2 Par rapport à la connaissance .................................................................................. 28
III.3.3 Par rapport aux structures de données ..................................................................... 28
III.4 Les modes d’apprentissage automatique .............................................................. 28
III.4.1 Apprentissage supervisé ................................................................................. 28
III.4.2 Apprentissage par renforcement ..................................................................... 29
III.4.3 Apprentissage non-supervisé .......................................................................... 29
III.4.4 Apprentissage semi-supervisé ......................................................................... 29
III.5 Les problèmes d’apprentissage ............................................................................. 30
III.6 Les méthodes de classification.............................................................................. 30
III.6.1 Méthodes de classification supervisées .......................................................... 30
III.6.1.1 L’arbre de décision .............................................................................................. 31
III.6.1.2 Les Réseaux de Neurones ....................................................................................
III.6.1.3 Algorithme des machines à support de vecteurs (SVM) ...................................... 32
III.6.1.4 Classification par analyse des règles d’association .............................................. 32
III.6.2 Méthodes de classification non supervisées .................................................... 33
Partie théorique
Chapitre IV : Extraction de connaissances à partir de réseaux Fouresquare et Twitter
IV.1 Introduction ........................................................................................................... 36
IV.2 Les langages utilisés et les outils d'implémentations ............................................. 36
IV.2.1 langage R ....................................................................................................... 36
IV.2.2 RStudio ........................................................................................................... 37
IV.2.3 Outil de visualisation Gephi ............................................................................ 39
IV.2.4 Langage GML ................................................................................................ 40
IV.3 Description des dataset ..........................................................................................
IV.3.1 Jeu de données FourSquare ............................................................................. 40
IV.3.1.1 Définition ............................................................................................................. 40
IV.3.1.2 Paramètres ............................................................................................................ 40
IV.3.2 Jeu de données Twitter .................................................................................... 41
IV.3.2.1 Définition ............................................................................................................. 41
IV.3.3.2 Paramètres ............................................................................................................ 42
IV.4 Extraction des connaiossances depuis les jeux des données étudiés ..................... 42
IV.4.1 Prétraitement des données ............................................................................... 42
IV.4.1.1 Nettoyage et traitement des données manquantes ou aberrantes ........................ 43
IV.4.1.2 Transformation ..................................................................................................... 43
IV.4.3 Visualisation des données ............................................................................... 46
IV.4.3.1 Les graphes ......................................................................................................... 46
IV.5 Mesures d’influence...............................................................................................
IV.6 Conclusion ............................................................................................................. 52
Chapitre V : Modèle de détection des influenceurs dans LSBN
V.1 Introduction ............................................................................................................. 54
V.2 Notre problématique ...............................................................................................
V.3 Approche d’apprentissage supervisé ....................................................................... 54
V.3.1 Centralité dans les graphes ............................................................................... 55
V.3.1.1 Centralité de degré ................................................................................................ 56
V.3.1.2 Centralité de proximité (Closeness centrality) ...................................................... 58
V.3.1.3 Centralité d’intermédiarité (betweeness centrality)............................................... 59
V.3.1.4 Centralité du vecteur propre (Eigen-vector centrality) .......................................... 60
V.3.1.5 Centralité M-reach de degré ..................................................................................
V.3.1.6 Centralité M-reach de proximité ........................................................................... 63
V.4 Implémentation du modèle et Résultats .................................................................. 64
V.4.1 Le modèle de SVM (Séparateurs à Vastes Marges) ......................................... 64
V.4.1.1 Description du modèle SVM ................................................................................. 64
V.4.1.2 Principe de fonctionnement général ...................................................................... 65
V.4.2 Discussion des résultas ..................................................................................... 66
V.5 Conclusion .............................................................................................................. 67
Conclusion général ....................................................................................................
Bibliographie…………………………………………………………………..70
Webographie………………………………………………………………….. |
Côte titre : |
MAI/0247 |
En ligne : |
https://drive.google.com/file/d/1owO0tWBO9qstXrf5VSdvPv-vUZMpp-8K/view?usp=shari [...] |
Format de la ressource électronique : |
pdf |
Modèle de Prédiction pour l’Extraction des Influenceurs les dans Réseaux Sociaux [texte imprimé] / Daîche ,Amina, Auteur ; Drif, Ahlam, Directeur de thèse . - [S.l.] : Setif:UFA, 2018 . - 1 vol (74 f .) ; 29 cm. Langues : Français ( fre) Langues originales : Français ( fre)
Catégories : |
Thèses & Mémoires:Informatique
|
Mots-clés : |
Réseaux sociaux
Analyse de réseau
SVM
Extraction des connaissances
Détecter des influenceurs |
Index. décimale : |
004 Informatique |
Résumé : |
Résumé
Un média est par définition un outil émergeant du social. Les dispositifs de communication n’émergent qu’en société, sont produits par elle et évoluent en son niveau. Par ailleurs, le terme média appliqué aux différents sites Web et plateformes de réseaux sociaux par exemple Twitter et Foursquare. L’un des outils spécifiques à l’analyse de ces réseaux est la détection des influenceurs, et parmi les divers algorithmes de l’identification de l’influence il y a le PageRank, TwitterRank, IP Algorithm. Grâce à la disponibilité de grands volumes de données et du calcul intensif, sans oublier les avancées intéressantes en optimisation, les algorithmes et les systèmes d'apprentissage automatique ont connu d'importantes avancées, car ils ont une caractéristique majeure qui est la capacité à apprendre les descripteurs tout en effectuant le classement. Afin de prédire les utilisateurs influents sur le réseau Foursquare, nous effectuons sur notre benchmark choisi plusieurs étapes de prétraitement, visualisation et calcul de mesures structurelles de réseau, il soit prêt à l’application d’un algorithme d’apprentissage supervisé SVM, ce dernier prouve une performance remarquable dans la classification des noeuds influenceurs par apport à l’arbre de décision. |
Note de contenu : |
Sommaire
Partie théorique
Chapitre I: Les réseaux sociaux: concepts et définitions
I.2 Les médias sociaux ..................................................................................................... 5
I.2.1 Une mise en perspective historique .................................................................... 6
I.3 Les types des médias sociaux .................................................................................... 7
I.3.1 Twitter .................................................................................................................. 7
I.3.2 Les caractéristiques du Twitter ............................................................................ 9
I.3.3 Foursquare .......................................................................................................... 9
I.4 Diffusion de l’information ........................................................................................
I.4.1 La thématique .................................................................................................... 10
I.4.2 L’influence sociale ............................................................................................. 11
I.4.3 Les types des utilisateurs .................................................................................. 11
I.5 Les mesures des modèles de diffusion de l’information dans les OSN ................... 12
I.5 Conclusion ................................................................................................................ 13
Chapitre II : L’état de l’art
II.1 Introduction ............................................................................................................. 15
II.2 L’algorithme de Page Rank ..................................................................................... 15
II.3 Weighted PageRank ............................................................................................ 17
II.4 Topic-Sensitive PageRank ..................................................................................... 19
II.5 TwitterRank ............................................................................................................. 21
II.6 Influence- Passivity algorithm(IP algorithm) .......................................................... 23
II.7 Conclusion .............................................................................................................. 25
Chapitre III : Apprentissage automatique et classification
III.1 Introduction ............................................................................................................ 27
III.2 L’apprentissage automatique ................................................................................ 27
III.3 Objectif des algorithmes d’apprentissage ......................................................... 27
III.3.1 Par rapport à l'environnement ................................................................................. 27
III.3.2 Par rapport à la connaissance .................................................................................. 28
III.3.3 Par rapport aux structures de données ..................................................................... 28
III.4 Les modes d’apprentissage automatique .............................................................. 28
III.4.1 Apprentissage supervisé ................................................................................. 28
III.4.2 Apprentissage par renforcement ..................................................................... 29
III.4.3 Apprentissage non-supervisé .......................................................................... 29
III.4.4 Apprentissage semi-supervisé ......................................................................... 29
III.5 Les problèmes d’apprentissage ............................................................................. 30
III.6 Les méthodes de classification.............................................................................. 30
III.6.1 Méthodes de classification supervisées .......................................................... 30
III.6.1.1 L’arbre de décision .............................................................................................. 31
III.6.1.2 Les Réseaux de Neurones ....................................................................................
III.6.1.3 Algorithme des machines à support de vecteurs (SVM) ...................................... 32
III.6.1.4 Classification par analyse des règles d’association .............................................. 32
III.6.2 Méthodes de classification non supervisées .................................................... 33
Partie théorique
Chapitre IV : Extraction de connaissances à partir de réseaux Fouresquare et Twitter
IV.1 Introduction ........................................................................................................... 36
IV.2 Les langages utilisés et les outils d'implémentations ............................................. 36
IV.2.1 langage R ....................................................................................................... 36
IV.2.2 RStudio ........................................................................................................... 37
IV.2.3 Outil de visualisation Gephi ............................................................................ 39
IV.2.4 Langage GML ................................................................................................ 40
IV.3 Description des dataset ..........................................................................................
IV.3.1 Jeu de données FourSquare ............................................................................. 40
IV.3.1.1 Définition ............................................................................................................. 40
IV.3.1.2 Paramètres ............................................................................................................ 40
IV.3.2 Jeu de données Twitter .................................................................................... 41
IV.3.2.1 Définition ............................................................................................................. 41
IV.3.3.2 Paramètres ............................................................................................................ 42
IV.4 Extraction des connaiossances depuis les jeux des données étudiés ..................... 42
IV.4.1 Prétraitement des données ............................................................................... 42
IV.4.1.1 Nettoyage et traitement des données manquantes ou aberrantes ........................ 43
IV.4.1.2 Transformation ..................................................................................................... 43
IV.4.3 Visualisation des données ............................................................................... 46
IV.4.3.1 Les graphes ......................................................................................................... 46
IV.5 Mesures d’influence...............................................................................................
IV.6 Conclusion ............................................................................................................. 52
Chapitre V : Modèle de détection des influenceurs dans LSBN
V.1 Introduction ............................................................................................................. 54
V.2 Notre problématique ...............................................................................................
V.3 Approche d’apprentissage supervisé ....................................................................... 54
V.3.1 Centralité dans les graphes ............................................................................... 55
V.3.1.1 Centralité de degré ................................................................................................ 56
V.3.1.2 Centralité de proximité (Closeness centrality) ...................................................... 58
V.3.1.3 Centralité d’intermédiarité (betweeness centrality)............................................... 59
V.3.1.4 Centralité du vecteur propre (Eigen-vector centrality) .......................................... 60
V.3.1.5 Centralité M-reach de degré ..................................................................................
V.3.1.6 Centralité M-reach de proximité ........................................................................... 63
V.4 Implémentation du modèle et Résultats .................................................................. 64
V.4.1 Le modèle de SVM (Séparateurs à Vastes Marges) ......................................... 64
V.4.1.1 Description du modèle SVM ................................................................................. 64
V.4.1.2 Principe de fonctionnement général ...................................................................... 65
V.4.2 Discussion des résultas ..................................................................................... 66
V.5 Conclusion .............................................................................................................. 67
Conclusion général ....................................................................................................
Bibliographie…………………………………………………………………..70
Webographie………………………………………………………………….. |
Côte titre : |
MAI/0247 |
En ligne : |
https://drive.google.com/file/d/1owO0tWBO9qstXrf5VSdvPv-vUZMpp-8K/view?usp=shari [...] |
Format de la ressource électronique : |
pdf |
|