University Sétif 1 FERHAT ABBAS Faculty of Sciences
Détail de l'auteur
Auteur Stéphane Tuffery |
Documents disponibles écrits par cet auteur



Titre : Data mining et statistique décisionnelle : L'intelligence des données Type de document : texte imprimé Auteurs : Stéphane Tuffery Mention d'édition : 4e éd Editeur : Paris : Technip Année de publication : 2012 Importance : 1 vol. (826 p.) Format : 24cm ISBN/ISSN/EAN : 978-2-7108-1017-9 Note générale : 978-2-7108-1017-9 Langues : Français (fre) Langues originales : Français (fre) Catégories : Informatique Mots-clés : Informatique
Exploration de données
Systèmes d'aide à la décision
Prise de décision (statistique)Index. décimale : 004 - Informatique Résumé :
Le data mining et la statistique sont de plus en plus répandus dans les entreprises et les organisations soucieuses d'extraire l'information pertinente de leurs bases de données, qu'elles peuvent utiliser pour expliquer et prévoir les phénomènes qui les concernent (risques, consommation, fidélisation...). Cette quatrième édition, actualisée et augmentée de 120 pages, fait le point sur le data mining, ses fondements théoriques, ses méthodes, ses outils et ses applications, qui vont du scoring jusqu'au web mining et au text mining. Nombre de ses outils appartiennent à l'analyse des données et à la statistique "classique" (analyse factorielle, classification automatique, analyse discriminante, régression logistique, modèles linéaires généralisés, régression pénalisée...), mais certains sont plus spécifiques au data mining, comme les arbres de décision, les réseaux de neurones, les SVM, l'agrégation de modèles et la détection des règles d'associations.Ces outils sont disponibles dans des logiciels de plus en plus puissants et conviviaux, aptes à exécuter de nombreux algorithmes sur de grands volumes de données. Un chapitre de l'ouvrage aide le lecteur à se diriger dans cette offre logicielle et détaille les fonctionnalités des trois principaux logiciels : R, SAS et IBM SPSS. Ces logiciels sont aussi utilisés pour illustrer par des exemples de nombreuses explications théoriques. Une partie de 50 pages est consacrée à une étude de cas complète de credit scoring, qui va de l'exploration des données jusqu'à l'élaboration de la grille de score. Les aspects méthodologiques vont de la conduite des projets jusqu'aux facteurs de réussite et aux pièges à éviter, en passant par l'évaluation et la comparaison des modèles, leur intégration dans les processus opérationnels, sans oublier les contraintes juridiques dès que l'on traite des données à caractère personnel". [Source : 4e de couv.]
Note de contenu :
Sommaire
Panorama du data mining
Le déroulement d'une étude de data mining
L'exploration et la préparation des données
L'utilisation des données commerciales et géodémographiques
Les logiciels de statistique et de data mining
Panorama des méthodes de data mining
L'analyse factorielle
Les réseaux de neurones
Les techniques de classification automatique
La recherche des règles d'associations
Les techniques de classement et de prédiction
L'analyse discriminante linéaire et ses généralisations
Le modèle linéaire et ses généralisations
Le modèle logistique et ses généralisations
Les autres modèles prédictifs
L'agrégation de modèles
Une application du data mining : le scoring
Les facteurs de succès d'un projet de data mining
Le text mining
Le web mining
Annexe : rappels de statistique ; data mining, informatique et libertés
Côte titre : Fs/12513,Fs/11568-11571,Fs/13106-13107 Data mining et statistique décisionnelle : L'intelligence des données [texte imprimé] / Stéphane Tuffery . - 4e éd . - Paris : Technip, 2012 . - 1 vol. (826 p.) ; 24cm.
ISBN : 978-2-7108-1017-9
978-2-7108-1017-9
Langues : Français (fre) Langues originales : Français (fre)
Catégories : Informatique Mots-clés : Informatique
Exploration de données
Systèmes d'aide à la décision
Prise de décision (statistique)Index. décimale : 004 - Informatique Résumé :
Le data mining et la statistique sont de plus en plus répandus dans les entreprises et les organisations soucieuses d'extraire l'information pertinente de leurs bases de données, qu'elles peuvent utiliser pour expliquer et prévoir les phénomènes qui les concernent (risques, consommation, fidélisation...). Cette quatrième édition, actualisée et augmentée de 120 pages, fait le point sur le data mining, ses fondements théoriques, ses méthodes, ses outils et ses applications, qui vont du scoring jusqu'au web mining et au text mining. Nombre de ses outils appartiennent à l'analyse des données et à la statistique "classique" (analyse factorielle, classification automatique, analyse discriminante, régression logistique, modèles linéaires généralisés, régression pénalisée...), mais certains sont plus spécifiques au data mining, comme les arbres de décision, les réseaux de neurones, les SVM, l'agrégation de modèles et la détection des règles d'associations.Ces outils sont disponibles dans des logiciels de plus en plus puissants et conviviaux, aptes à exécuter de nombreux algorithmes sur de grands volumes de données. Un chapitre de l'ouvrage aide le lecteur à se diriger dans cette offre logicielle et détaille les fonctionnalités des trois principaux logiciels : R, SAS et IBM SPSS. Ces logiciels sont aussi utilisés pour illustrer par des exemples de nombreuses explications théoriques. Une partie de 50 pages est consacrée à une étude de cas complète de credit scoring, qui va de l'exploration des données jusqu'à l'élaboration de la grille de score. Les aspects méthodologiques vont de la conduite des projets jusqu'aux facteurs de réussite et aux pièges à éviter, en passant par l'évaluation et la comparaison des modèles, leur intégration dans les processus opérationnels, sans oublier les contraintes juridiques dès que l'on traite des données à caractère personnel". [Source : 4e de couv.]
Note de contenu :
Sommaire
Panorama du data mining
Le déroulement d'une étude de data mining
L'exploration et la préparation des données
L'utilisation des données commerciales et géodémographiques
Les logiciels de statistique et de data mining
Panorama des méthodes de data mining
L'analyse factorielle
Les réseaux de neurones
Les techniques de classification automatique
La recherche des règles d'associations
Les techniques de classement et de prédiction
L'analyse discriminante linéaire et ses généralisations
Le modèle linéaire et ses généralisations
Le modèle logistique et ses généralisations
Les autres modèles prédictifs
L'agrégation de modèles
Une application du data mining : le scoring
Les facteurs de succès d'un projet de data mining
Le text mining
Le web mining
Annexe : rappels de statistique ; data mining, informatique et libertés
Côte titre : Fs/12513,Fs/11568-11571,Fs/13106-13107 Exemplaires (7)
Code-barres Cote Support Localisation Section Disponibilité Fs/11568 Fs/11568-11571 livre Bibliothéque des sciences Français Disponible
DisponibleFs/11569 Fs/11568-11571 livre Bibliothéque des sciences Français Disponible
DisponibleFs/11570 Fs/11568-11571 livre Bibliothéque des sciences Français Disponible
DisponibleFs/11571 Fs/11568-11571 livre Bibliothéque des sciences Français Disponible
DisponibleFs/12513 Fs/12513 livre Bibliothéque des sciences Français Disponible
DisponibleFs/13106 Fs/13106-13107 livre Bibliothéque des sciences Français Disponible
DisponibleFs/13107 Fs/13106-13107 livre Bibliothéque des sciences Français Disponible
Disponible
Titre : Modélisation prédictive et apprentissage statistique avec R Type de document : texte imprimé Auteurs : Stéphane Tuffery, Auteur Editeur : Paris : Technip Année de publication : 2017 Importance : 1 vol. (405 p.) Présentation : ill. Format : 24 cm ISBN/ISSN/EAN : 978-2-7108-1178-7 Langues : Français (fre) Mots-clés : Statistique : Modèles mathématiques
Apprentissage automatique : Modèles mathématiquesIndex. décimale : 519 Mathématiques appliquées, probabilités (statistiques mathématiques) Résumé :
Issu de formations devant des publics variés, cet ouvrage présente les principales méthodes de modélisation de statistique et de machine learning, à travers le fil conducteur d'une étude de cas. Chaque méthode fait l'objet d'un rappel de cours et est accompagnée de références bibliographiques, puis est mise en oeuvre avec des explications détaillées sur les calculs effectués, les interprétations des résultats et jusqu'aux astuces de programmation permettant d'optimiser les temps de calcul. À ce sujet, une annexe est consacrée au traitement des données massives. L'ouvrage commence par les méthodes de classement classiques les plus éprouvées, mais aborde rapidement les méthodes plus récentes et avancées : régression ridge, lasso, elastic net, boosting, forêts aléatoires, Extra-Trees, réseaux de neurones, séparateurs à vaste marge. Chaque fois, le lien est fait entre la théorie et les résultats obtenus pour montrer qu'ils illustrent bien les principes sous-jacents à ces méthodes. Mais l'aspect pratique est aussi privilégié, avec l'objectif de permettre au lecteur une mise en oeuvre rapide et efficace dans son travail concret. L'exploration et la préparation préliminaire des données sont d'ailleurs décrites, ainsi que le processus de sélection des variables. Une synthèse finale est faite de toutes les méthodes présentées. La mise en oeuvre s'appuie sur le logiciel libre R et sur un jeu public de données. Ce dernier peut être téléchargé sur internet et présente l'intérêt d'être riche, complet et de permettre des comparaisons grâce aux nombreuses publications dans lesquelles il a servi. Le logiciel statistique utilisé est R, actuellement celui qui se développe le plus : devenu la lingua franca de la statistique et l'outil le plus répandu dans le monde académique, il prend également de plus en plus de place dans le monde de l'entreprise, à tel point que tous les logiciels commerciaux proposent désormais une interface avec R. Outre qu'il est disponible pour tous, dans de multiples environnements, il est aussi le plus riche statistiquement et c'est le seul logiciel permettant de mettre en oeuvre toutes les méthodes présentées dans cet ouvrage. Enfin, son langage de programmation particulièrement élégant et adapté au calcul mathématique permet de se concentrer dans le codage sur les aspects statistiques. R permet d'arriver directement à l'essentiel et de mieux comprendre les méthodes exposées dans l'ouvrage. [Source : 4e de couv.]
Côte titre : Fs/23016-23017 Modélisation prédictive et apprentissage statistique avec R [texte imprimé] / Stéphane Tuffery, Auteur . - Paris : Technip, 2017 . - 1 vol. (405 p.) : ill. ; 24 cm.
ISBN : 978-2-7108-1178-7
Langues : Français (fre)
Mots-clés : Statistique : Modèles mathématiques
Apprentissage automatique : Modèles mathématiquesIndex. décimale : 519 Mathématiques appliquées, probabilités (statistiques mathématiques) Résumé :
Issu de formations devant des publics variés, cet ouvrage présente les principales méthodes de modélisation de statistique et de machine learning, à travers le fil conducteur d'une étude de cas. Chaque méthode fait l'objet d'un rappel de cours et est accompagnée de références bibliographiques, puis est mise en oeuvre avec des explications détaillées sur les calculs effectués, les interprétations des résultats et jusqu'aux astuces de programmation permettant d'optimiser les temps de calcul. À ce sujet, une annexe est consacrée au traitement des données massives. L'ouvrage commence par les méthodes de classement classiques les plus éprouvées, mais aborde rapidement les méthodes plus récentes et avancées : régression ridge, lasso, elastic net, boosting, forêts aléatoires, Extra-Trees, réseaux de neurones, séparateurs à vaste marge. Chaque fois, le lien est fait entre la théorie et les résultats obtenus pour montrer qu'ils illustrent bien les principes sous-jacents à ces méthodes. Mais l'aspect pratique est aussi privilégié, avec l'objectif de permettre au lecteur une mise en oeuvre rapide et efficace dans son travail concret. L'exploration et la préparation préliminaire des données sont d'ailleurs décrites, ainsi que le processus de sélection des variables. Une synthèse finale est faite de toutes les méthodes présentées. La mise en oeuvre s'appuie sur le logiciel libre R et sur un jeu public de données. Ce dernier peut être téléchargé sur internet et présente l'intérêt d'être riche, complet et de permettre des comparaisons grâce aux nombreuses publications dans lesquelles il a servi. Le logiciel statistique utilisé est R, actuellement celui qui se développe le plus : devenu la lingua franca de la statistique et l'outil le plus répandu dans le monde académique, il prend également de plus en plus de place dans le monde de l'entreprise, à tel point que tous les logiciels commerciaux proposent désormais une interface avec R. Outre qu'il est disponible pour tous, dans de multiples environnements, il est aussi le plus riche statistiquement et c'est le seul logiciel permettant de mettre en oeuvre toutes les méthodes présentées dans cet ouvrage. Enfin, son langage de programmation particulièrement élégant et adapté au calcul mathématique permet de se concentrer dans le codage sur les aspects statistiques. R permet d'arriver directement à l'essentiel et de mieux comprendre les méthodes exposées dans l'ouvrage. [Source : 4e de couv.]
Côte titre : Fs/23016-23017 Exemplaires (2)
Code-barres Cote Support Localisation Section Disponibilité Fs/23016 Fs/23016-23017 livre Bibliothéque des sciences Français Disponible
DisponibleFs/23017 Fs/23016-23017 livre Bibliothéque des sciences Français Disponible
Disponible