University Sétif 1 FERHAT ABBAS Faculty of Sciences
Détail de l'auteur
Auteur Daîche ,Amina |
Documents disponibles écrits par cet auteur
Ajouter le résultat dans votre panier Affiner la recherche
Modèle de Prédiction pour l’Extraction des Influenceurs les dans Réseaux Sociaux / Daîche ,Amina
Titre : Modèle de Prédiction pour l’Extraction des Influenceurs les dans Réseaux Sociaux Type de document : texte imprimé Auteurs : Daîche ,Amina, Auteur ; Drif, Ahlam, Directeur de thèse Editeur : Setif:UFA Année de publication : 2018 Importance : 1 vol (74 f .) Format : 29 cm Langues : Français (fre) Langues originales : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Réseaux sociaux
Analyse de réseau
SVM
Extraction des connaissances
Détecter des influenceursIndex. décimale : 004 Informatique Résumé : Résumé
Un média est par définition un outil émergeant du social. Les dispositifs de communication n’émergent qu’en société, sont produits par elle et évoluent en son niveau. Par ailleurs, le terme média appliqué aux différents sites Web et plateformes de réseaux sociaux par exemple Twitter et Foursquare. L’un des outils spécifiques à l’analyse de ces réseaux est la détection des influenceurs, et parmi les divers algorithmes de l’identification de l’influence il y a le PageRank, TwitterRank, IP Algorithm. Grâce à la disponibilité de grands volumes de données et du calcul intensif, sans oublier les avancées intéressantes en optimisation, les algorithmes et les systèmes d'apprentissage automatique ont connu d'importantes avancées, car ils ont une caractéristique majeure qui est la capacité à apprendre les descripteurs tout en effectuant le classement. Afin de prédire les utilisateurs influents sur le réseau Foursquare, nous effectuons sur notre benchmark choisi plusieurs étapes de prétraitement, visualisation et calcul de mesures structurelles de réseau, il soit prêt à l’application d’un algorithme d’apprentissage supervisé SVM, ce dernier prouve une performance remarquable dans la classification des noeuds influenceurs par apport à l’arbre de décision.Note de contenu :
Sommaire
Partie théorique
Chapitre I: Les réseaux sociaux: concepts et définitions
I.2 Les médias sociaux ..................................................................................................... 5
I.2.1 Une mise en perspective historique .................................................................... 6
I.3 Les types des médias sociaux .................................................................................... 7
I.3.1 Twitter .................................................................................................................. 7
I.3.2 Les caractéristiques du Twitter ............................................................................ 9
I.3.3 Foursquare .......................................................................................................... 9
I.4 Diffusion de l’information ........................................................................................
I.4.1 La thématique .................................................................................................... 10
I.4.2 L’influence sociale ............................................................................................. 11
I.4.3 Les types des utilisateurs .................................................................................. 11
I.5 Les mesures des modèles de diffusion de l’information dans les OSN ................... 12
I.5 Conclusion ................................................................................................................ 13
Chapitre II : L’état de l’art
II.1 Introduction ............................................................................................................. 15
II.2 L’algorithme de Page Rank ..................................................................................... 15
II.3 Weighted PageRank ............................................................................................ 17
II.4 Topic-Sensitive PageRank ..................................................................................... 19
II.5 TwitterRank ............................................................................................................. 21
II.6 Influence- Passivity algorithm(IP algorithm) .......................................................... 23
II.7 Conclusion .............................................................................................................. 25
Chapitre III : Apprentissage automatique et classification
III.1 Introduction ............................................................................................................ 27
III.2 L’apprentissage automatique ................................................................................ 27
III.3 Objectif des algorithmes d’apprentissage ......................................................... 27
III.3.1 Par rapport à l'environnement ................................................................................. 27
III.3.2 Par rapport à la connaissance .................................................................................. 28
III.3.3 Par rapport aux structures de données ..................................................................... 28
III.4 Les modes d’apprentissage automatique .............................................................. 28
III.4.1 Apprentissage supervisé ................................................................................. 28
III.4.2 Apprentissage par renforcement ..................................................................... 29
III.4.3 Apprentissage non-supervisé .......................................................................... 29
III.4.4 Apprentissage semi-supervisé ......................................................................... 29
III.5 Les problèmes d’apprentissage ............................................................................. 30
III.6 Les méthodes de classification.............................................................................. 30
III.6.1 Méthodes de classification supervisées .......................................................... 30
III.6.1.1 L’arbre de décision .............................................................................................. 31
III.6.1.2 Les Réseaux de Neurones ....................................................................................
III.6.1.3 Algorithme des machines à support de vecteurs (SVM) ...................................... 32
III.6.1.4 Classification par analyse des règles d’association .............................................. 32
III.6.2 Méthodes de classification non supervisées .................................................... 33
Partie théorique
Chapitre IV : Extraction de connaissances à partir de réseaux Fouresquare et Twitter
IV.1 Introduction ........................................................................................................... 36
IV.2 Les langages utilisés et les outils d'implémentations ............................................. 36
IV.2.1 langage R ....................................................................................................... 36
IV.2.2 RStudio ........................................................................................................... 37
IV.2.3 Outil de visualisation Gephi ............................................................................ 39
IV.2.4 Langage GML ................................................................................................ 40
IV.3 Description des dataset ..........................................................................................
IV.3.1 Jeu de données FourSquare ............................................................................. 40
IV.3.1.1 Définition ............................................................................................................. 40
IV.3.1.2 Paramètres ............................................................................................................ 40
IV.3.2 Jeu de données Twitter .................................................................................... 41
IV.3.2.1 Définition ............................................................................................................. 41
IV.3.3.2 Paramètres ............................................................................................................ 42
IV.4 Extraction des connaiossances depuis les jeux des données étudiés ..................... 42
IV.4.1 Prétraitement des données ............................................................................... 42
IV.4.1.1 Nettoyage et traitement des données manquantes ou aberrantes ........................ 43
IV.4.1.2 Transformation ..................................................................................................... 43
IV.4.3 Visualisation des données ............................................................................... 46
IV.4.3.1 Les graphes ......................................................................................................... 46
IV.5 Mesures d’influence...............................................................................................
IV.6 Conclusion ............................................................................................................. 52
Chapitre V : Modèle de détection des influenceurs dans LSBN
V.1 Introduction ............................................................................................................. 54
V.2 Notre problématique ...............................................................................................
V.3 Approche d’apprentissage supervisé ....................................................................... 54
V.3.1 Centralité dans les graphes ............................................................................... 55
V.3.1.1 Centralité de degré ................................................................................................ 56
V.3.1.2 Centralité de proximité (Closeness centrality) ...................................................... 58
V.3.1.3 Centralité d’intermédiarité (betweeness centrality)............................................... 59
V.3.1.4 Centralité du vecteur propre (Eigen-vector centrality) .......................................... 60
V.3.1.5 Centralité M-reach de degré ..................................................................................
V.3.1.6 Centralité M-reach de proximité ........................................................................... 63
V.4 Implémentation du modèle et Résultats .................................................................. 64
V.4.1 Le modèle de SVM (Séparateurs à Vastes Marges) ......................................... 64
V.4.1.1 Description du modèle SVM ................................................................................. 64
V.4.1.2 Principe de fonctionnement général ...................................................................... 65
V.4.2 Discussion des résultas ..................................................................................... 66
V.5 Conclusion .............................................................................................................. 67
Conclusion général ....................................................................................................
Bibliographie…………………………………………………………………..70
Webographie…………………………………………………………………..Côte titre : MAI/0247 En ligne : https://drive.google.com/file/d/1owO0tWBO9qstXrf5VSdvPv-vUZMpp-8K/view?usp=shari [...] Format de la ressource électronique : Modèle de Prédiction pour l’Extraction des Influenceurs les dans Réseaux Sociaux [texte imprimé] / Daîche ,Amina, Auteur ; Drif, Ahlam, Directeur de thèse . - [S.l.] : Setif:UFA, 2018 . - 1 vol (74 f .) ; 29 cm.
Langues : Français (fre) Langues originales : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Réseaux sociaux
Analyse de réseau
SVM
Extraction des connaissances
Détecter des influenceursIndex. décimale : 004 Informatique Résumé : Résumé
Un média est par définition un outil émergeant du social. Les dispositifs de communication n’émergent qu’en société, sont produits par elle et évoluent en son niveau. Par ailleurs, le terme média appliqué aux différents sites Web et plateformes de réseaux sociaux par exemple Twitter et Foursquare. L’un des outils spécifiques à l’analyse de ces réseaux est la détection des influenceurs, et parmi les divers algorithmes de l’identification de l’influence il y a le PageRank, TwitterRank, IP Algorithm. Grâce à la disponibilité de grands volumes de données et du calcul intensif, sans oublier les avancées intéressantes en optimisation, les algorithmes et les systèmes d'apprentissage automatique ont connu d'importantes avancées, car ils ont une caractéristique majeure qui est la capacité à apprendre les descripteurs tout en effectuant le classement. Afin de prédire les utilisateurs influents sur le réseau Foursquare, nous effectuons sur notre benchmark choisi plusieurs étapes de prétraitement, visualisation et calcul de mesures structurelles de réseau, il soit prêt à l’application d’un algorithme d’apprentissage supervisé SVM, ce dernier prouve une performance remarquable dans la classification des noeuds influenceurs par apport à l’arbre de décision.Note de contenu :
Sommaire
Partie théorique
Chapitre I: Les réseaux sociaux: concepts et définitions
I.2 Les médias sociaux ..................................................................................................... 5
I.2.1 Une mise en perspective historique .................................................................... 6
I.3 Les types des médias sociaux .................................................................................... 7
I.3.1 Twitter .................................................................................................................. 7
I.3.2 Les caractéristiques du Twitter ............................................................................ 9
I.3.3 Foursquare .......................................................................................................... 9
I.4 Diffusion de l’information ........................................................................................
I.4.1 La thématique .................................................................................................... 10
I.4.2 L’influence sociale ............................................................................................. 11
I.4.3 Les types des utilisateurs .................................................................................. 11
I.5 Les mesures des modèles de diffusion de l’information dans les OSN ................... 12
I.5 Conclusion ................................................................................................................ 13
Chapitre II : L’état de l’art
II.1 Introduction ............................................................................................................. 15
II.2 L’algorithme de Page Rank ..................................................................................... 15
II.3 Weighted PageRank ............................................................................................ 17
II.4 Topic-Sensitive PageRank ..................................................................................... 19
II.5 TwitterRank ............................................................................................................. 21
II.6 Influence- Passivity algorithm(IP algorithm) .......................................................... 23
II.7 Conclusion .............................................................................................................. 25
Chapitre III : Apprentissage automatique et classification
III.1 Introduction ............................................................................................................ 27
III.2 L’apprentissage automatique ................................................................................ 27
III.3 Objectif des algorithmes d’apprentissage ......................................................... 27
III.3.1 Par rapport à l'environnement ................................................................................. 27
III.3.2 Par rapport à la connaissance .................................................................................. 28
III.3.3 Par rapport aux structures de données ..................................................................... 28
III.4 Les modes d’apprentissage automatique .............................................................. 28
III.4.1 Apprentissage supervisé ................................................................................. 28
III.4.2 Apprentissage par renforcement ..................................................................... 29
III.4.3 Apprentissage non-supervisé .......................................................................... 29
III.4.4 Apprentissage semi-supervisé ......................................................................... 29
III.5 Les problèmes d’apprentissage ............................................................................. 30
III.6 Les méthodes de classification.............................................................................. 30
III.6.1 Méthodes de classification supervisées .......................................................... 30
III.6.1.1 L’arbre de décision .............................................................................................. 31
III.6.1.2 Les Réseaux de Neurones ....................................................................................
III.6.1.3 Algorithme des machines à support de vecteurs (SVM) ...................................... 32
III.6.1.4 Classification par analyse des règles d’association .............................................. 32
III.6.2 Méthodes de classification non supervisées .................................................... 33
Partie théorique
Chapitre IV : Extraction de connaissances à partir de réseaux Fouresquare et Twitter
IV.1 Introduction ........................................................................................................... 36
IV.2 Les langages utilisés et les outils d'implémentations ............................................. 36
IV.2.1 langage R ....................................................................................................... 36
IV.2.2 RStudio ........................................................................................................... 37
IV.2.3 Outil de visualisation Gephi ............................................................................ 39
IV.2.4 Langage GML ................................................................................................ 40
IV.3 Description des dataset ..........................................................................................
IV.3.1 Jeu de données FourSquare ............................................................................. 40
IV.3.1.1 Définition ............................................................................................................. 40
IV.3.1.2 Paramètres ............................................................................................................ 40
IV.3.2 Jeu de données Twitter .................................................................................... 41
IV.3.2.1 Définition ............................................................................................................. 41
IV.3.3.2 Paramètres ............................................................................................................ 42
IV.4 Extraction des connaiossances depuis les jeux des données étudiés ..................... 42
IV.4.1 Prétraitement des données ............................................................................... 42
IV.4.1.1 Nettoyage et traitement des données manquantes ou aberrantes ........................ 43
IV.4.1.2 Transformation ..................................................................................................... 43
IV.4.3 Visualisation des données ............................................................................... 46
IV.4.3.1 Les graphes ......................................................................................................... 46
IV.5 Mesures d’influence...............................................................................................
IV.6 Conclusion ............................................................................................................. 52
Chapitre V : Modèle de détection des influenceurs dans LSBN
V.1 Introduction ............................................................................................................. 54
V.2 Notre problématique ...............................................................................................
V.3 Approche d’apprentissage supervisé ....................................................................... 54
V.3.1 Centralité dans les graphes ............................................................................... 55
V.3.1.1 Centralité de degré ................................................................................................ 56
V.3.1.2 Centralité de proximité (Closeness centrality) ...................................................... 58
V.3.1.3 Centralité d’intermédiarité (betweeness centrality)............................................... 59
V.3.1.4 Centralité du vecteur propre (Eigen-vector centrality) .......................................... 60
V.3.1.5 Centralité M-reach de degré ..................................................................................
V.3.1.6 Centralité M-reach de proximité ........................................................................... 63
V.4 Implémentation du modèle et Résultats .................................................................. 64
V.4.1 Le modèle de SVM (Séparateurs à Vastes Marges) ......................................... 64
V.4.1.1 Description du modèle SVM ................................................................................. 64
V.4.1.2 Principe de fonctionnement général ...................................................................... 65
V.4.2 Discussion des résultas ..................................................................................... 66
V.5 Conclusion .............................................................................................................. 67
Conclusion général ....................................................................................................
Bibliographie…………………………………………………………………..70
Webographie…………………………………………………………………..Côte titre : MAI/0247 En ligne : https://drive.google.com/file/d/1owO0tWBO9qstXrf5VSdvPv-vUZMpp-8K/view?usp=shari [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0247 MAI/0247 Mémoire Bibliothéque des sciences Français Disponible
Disponible