Catalogue en ligne

University Sétif 1 FERHAT ABBAS Faculty of Sciences

Nouvelle recherche

Détail de l'auteur

Auteur Stéphane Tuffery

Documents disponibles écrits par cet auteur

Ajouter le résultat dans votre panier Affiner la recherche

Data mining et statistique décisionnelle / Stéphane Tuffery

Public

ISBD

Titre : Data mining et statistique décisionnelle : L'intelligence des données
Type de document : texte imprimé
Auteurs : Stéphane Tuffery
Mention d'édition : 4e éd
Editeur : Paris : Technip
Année de publication : 2012
Importance : 1 vol. (826 p.)
Format : 24cm
ISBN/ISSN/EAN : 978-2-7108-1017-9
Note générale : 978-2-7108-1017-9
Langues : Français (fre) Langues originales : Français (fre)
Catégories : Informatique

Mots-clés : Informatique
Exploration de données
Systèmes d'aide à la décision
Prise de décision (statistique)
Index. décimale : 004 - Informatique
Résumé :
Le data mining et la statistique sont de plus en plus répandus dans les entreprises et les organisations soucieuses d'extraire l'information pertinente de leurs bases de données, qu'elles peuvent utiliser pour expliquer et prévoir les phénomènes qui les concernent (risques, consommation, fidélisation...). Cette quatrième édition, actualisée et augmentée de 120 pages, fait le point sur le data mining, ses fondements théoriques, ses méthodes, ses outils et ses applications, qui vont du scoring jusqu'au web mining et au text mining. Nombre de ses outils appartiennent à l'analyse des données et à la statistique "classique" (analyse factorielle, classification automatique, analyse discriminante, régression logistique, modèles linéaires généralisés, régression pénalisée...), mais certains sont plus spécifiques au data mining, comme les arbres de décision, les réseaux de neurones, les SVM, l'agrégation de modèles et la détection des règles d'associations.Ces outils sont disponibles dans des logiciels de plus en plus puissants et conviviaux, aptes à exécuter de nombreux algorithmes sur de grands volumes de données. Un chapitre de l'ouvrage aide le lecteur à se diriger dans cette offre logicielle et détaille les fonctionnalités des trois principaux logiciels : R, SAS et IBM SPSS. Ces logiciels sont aussi utilisés pour illustrer par des exemples de nombreuses explications théoriques. Une partie de 50 pages est consacrée à une étude de cas complète de credit scoring, qui va de l'exploration des données jusqu'à l'élaboration de la grille de score. Les aspects méthodologiques vont de la conduite des projets jusqu'aux facteurs de réussite et aux pièges à éviter, en passant par l'évaluation et la comparaison des modèles, leur intégration dans les processus opérationnels, sans oublier les contraintes juridiques dès que l'on traite des données à caractère personnel". [Source : 4e de couv.]

Note de contenu :
Sommaire
Panorama du data mining
Le déroulement d'une étude de data mining
L'exploration et la préparation des données
L'utilisation des données commerciales et géodémographiques
Les logiciels de statistique et de data mining
Panorama des méthodes de data mining
L'analyse factorielle
Les réseaux de neurones
Les techniques de classification automatique
La recherche des règles d'associations
Les techniques de classement et de prédiction
L'analyse discriminante linéaire et ses généralisations
Le modèle linéaire et ses généralisations
Le modèle logistique et ses généralisations
Les autres modèles prédictifs
L'agrégation de modèles
Une application du data mining : le scoring
Les facteurs de succès d'un projet de data mining
Le text mining
Le web mining
Annexe : rappels de statistique ; data mining, informatique et libertés

Côte titre : Fs/12513,Fs/11568-11571,Fs/13106-13107

Data mining et statistique décisionnelle : L'intelligence des données [texte imprimé] / Stéphane Tuffery . - 4e éd . - Paris : Technip, 2012 . - 1 vol. (826 p.) ; 24cm.
ISBN : 978-2-7108-1017-9
978-2-7108-1017-9
Langues : Français (fre) Langues originales : Français (fre)
Catégories : Informatique

Mots-clés : Informatique
Exploration de données
Systèmes d'aide à la décision
Prise de décision (statistique)
Index. décimale : 004 - Informatique
Résumé :
Le data mining et la statistique sont de plus en plus répandus dans les entreprises et les organisations soucieuses d'extraire l'information pertinente de leurs bases de données, qu'elles peuvent utiliser pour expliquer et prévoir les phénomènes qui les concernent (risques, consommation, fidélisation...). Cette quatrième édition, actualisée et augmentée de 120 pages, fait le point sur le data mining, ses fondements théoriques, ses méthodes, ses outils et ses applications, qui vont du scoring jusqu'au web mining et au text mining. Nombre de ses outils appartiennent à l'analyse des données et à la statistique "classique" (analyse factorielle, classification automatique, analyse discriminante, régression logistique, modèles linéaires généralisés, régression pénalisée...), mais certains sont plus spécifiques au data mining, comme les arbres de décision, les réseaux de neurones, les SVM, l'agrégation de modèles et la détection des règles d'associations.Ces outils sont disponibles dans des logiciels de plus en plus puissants et conviviaux, aptes à exécuter de nombreux algorithmes sur de grands volumes de données. Un chapitre de l'ouvrage aide le lecteur à se diriger dans cette offre logicielle et détaille les fonctionnalités des trois principaux logiciels : R, SAS et IBM SPSS. Ces logiciels sont aussi utilisés pour illustrer par des exemples de nombreuses explications théoriques. Une partie de 50 pages est consacrée à une étude de cas complète de credit scoring, qui va de l'exploration des données jusqu'à l'élaboration de la grille de score. Les aspects méthodologiques vont de la conduite des projets jusqu'aux facteurs de réussite et aux pièges à éviter, en passant par l'évaluation et la comparaison des modèles, leur intégration dans les processus opérationnels, sans oublier les contraintes juridiques dès que l'on traite des données à caractère personnel". [Source : 4e de couv.]

Note de contenu :
Sommaire
Panorama du data mining
Le déroulement d'une étude de data mining
L'exploration et la préparation des données
L'utilisation des données commerciales et géodémographiques
Les logiciels de statistique et de data mining
Panorama des méthodes de data mining
L'analyse factorielle
Les réseaux de neurones
Les techniques de classification automatique
La recherche des règles d'associations
Les techniques de classement et de prédiction
L'analyse discriminante linéaire et ses généralisations
Le modèle linéaire et ses généralisations
Le modèle logistique et ses généralisations
Les autres modèles prédictifs
L'agrégation de modèles
Une application du data mining : le scoring
Les facteurs de succès d'un projet de data mining
Le text mining
Le web mining
Annexe : rappels de statistique ; data mining, informatique et libertés

Côte titre : Fs/12513,Fs/11568-11571,Fs/13106-13107

Exemplaires (7)

Code-barres Cote Support Localisation Section Disponibilité
Fs/11568 Fs/11568-11571 livre Bibliothèque des sciences Français Disponible
Disponible
Fs/11569 Fs/11568-11571 livre Bibliothèque des sciences Français Disponible
Disponible
Fs/11570 Fs/11568-11571 livre Bibliothèque des sciences Français Disponible
Disponible
Fs/11571 Fs/11568-11571 livre Bibliothèque des sciences Français Disponible
Disponible
Fs/12513 Fs/12513 livre Bibliothèque des sciences Français Disponible
Disponible
Fs/13106 Fs/13106-13107 livre Bibliothèque des sciences Français Disponible
Disponible
Fs/13107 Fs/13106-13107 livre Bibliothèque des sciences Français Disponible
Disponible

Modélisation prédictive et apprentissage statistique avec R / Stéphane Tuffery

Public

ISBD

Titre : Modélisation prédictive et apprentissage statistique avec R
Type de document : texte imprimé
Auteurs : Stéphane Tuffery, Auteur
Editeur : Paris : Technip
Année de publication : 2017
Importance : 1 vol. (405 p.)
Présentation : ill.
Format : 24 cm
ISBN/ISSN/EAN : 978-2-7108-1178-7
Langues : Français (fre)
Mots-clés : Statistique : Modèles mathématiques
Apprentissage automatique : Modèles mathématiques
Index. décimale : 519 Mathématiques appliquées, probabilités (statistiques mathématiques)
Résumé :
Issu de formations devant des publics variés, cet ouvrage présente les principales méthodes de modélisation de statistique et de machine learning, à travers le fil conducteur d'une étude de cas. Chaque méthode fait l'objet d'un rappel de cours et est accompagnée de références bibliographiques, puis est mise en oeuvre avec des explications détaillées sur les calculs effectués, les interprétations des résultats et jusqu'aux astuces de programmation permettant d'optimiser les temps de calcul. À ce sujet, une annexe est consacrée au traitement des données massives. L'ouvrage commence par les méthodes de classement classiques les plus éprouvées, mais aborde rapidement les méthodes plus récentes et avancées : régression ridge, lasso, elastic net, boosting, forêts aléatoires, Extra-Trees, réseaux de neurones, séparateurs à vaste marge. Chaque fois, le lien est fait entre la théorie et les résultats obtenus pour montrer qu'ils illustrent bien les principes sous-jacents à ces méthodes. Mais l'aspect pratique est aussi privilégié, avec l'objectif de permettre au lecteur une mise en oeuvre rapide et efficace dans son travail concret. L'exploration et la préparation préliminaire des données sont d'ailleurs décrites, ainsi que le processus de sélection des variables. Une synthèse finale est faite de toutes les méthodes présentées. La mise en oeuvre s'appuie sur le logiciel libre R et sur un jeu public de données. Ce dernier peut être téléchargé sur internet et présente l'intérêt d'être riche, complet et de permettre des comparaisons grâce aux nombreuses publications dans lesquelles il a servi. Le logiciel statistique utilisé est R, actuellement celui qui se développe le plus : devenu la lingua franca de la statistique et l'outil le plus répandu dans le monde académique, il prend également de plus en plus de place dans le monde de l'entreprise, à tel point que tous les logiciels commerciaux proposent désormais une interface avec R. Outre qu'il est disponible pour tous, dans de multiples environnements, il est aussi le plus riche statistiquement et c'est le seul logiciel permettant de mettre en oeuvre toutes les méthodes présentées dans cet ouvrage. Enfin, son langage de programmation particulièrement élégant et adapté au calcul mathématique permet de se concentrer dans le codage sur les aspects statistiques. R permet d'arriver directement à l'essentiel et de mieux comprendre les méthodes exposées dans l'ouvrage. [Source : 4e de couv.]

Côte titre : Fs/23016-23017

Modélisation prédictive et apprentissage statistique avec R [texte imprimé] / Stéphane Tuffery, Auteur . - Paris : Technip, 2017 . - 1 vol. (405 p.) : ill. ; 24 cm.
ISBN : 978-2-7108-1178-7
Langues : Français (fre)
Mots-clés : Statistique : Modèles mathématiques
Apprentissage automatique : Modèles mathématiques
Index. décimale : 519 Mathématiques appliquées, probabilités (statistiques mathématiques)
Résumé :
Issu de formations devant des publics variés, cet ouvrage présente les principales méthodes de modélisation de statistique et de machine learning, à travers le fil conducteur d'une étude de cas. Chaque méthode fait l'objet d'un rappel de cours et est accompagnée de références bibliographiques, puis est mise en oeuvre avec des explications détaillées sur les calculs effectués, les interprétations des résultats et jusqu'aux astuces de programmation permettant d'optimiser les temps de calcul. À ce sujet, une annexe est consacrée au traitement des données massives. L'ouvrage commence par les méthodes de classement classiques les plus éprouvées, mais aborde rapidement les méthodes plus récentes et avancées : régression ridge, lasso, elastic net, boosting, forêts aléatoires, Extra-Trees, réseaux de neurones, séparateurs à vaste marge. Chaque fois, le lien est fait entre la théorie et les résultats obtenus pour montrer qu'ils illustrent bien les principes sous-jacents à ces méthodes. Mais l'aspect pratique est aussi privilégié, avec l'objectif de permettre au lecteur une mise en oeuvre rapide et efficace dans son travail concret. L'exploration et la préparation préliminaire des données sont d'ailleurs décrites, ainsi que le processus de sélection des variables. Une synthèse finale est faite de toutes les méthodes présentées. La mise en oeuvre s'appuie sur le logiciel libre R et sur un jeu public de données. Ce dernier peut être téléchargé sur internet et présente l'intérêt d'être riche, complet et de permettre des comparaisons grâce aux nombreuses publications dans lesquelles il a servi. Le logiciel statistique utilisé est R, actuellement celui qui se développe le plus : devenu la lingua franca de la statistique et l'outil le plus répandu dans le monde académique, il prend également de plus en plus de place dans le monde de l'entreprise, à tel point que tous les logiciels commerciaux proposent désormais une interface avec R. Outre qu'il est disponible pour tous, dans de multiples environnements, il est aussi le plus riche statistiquement et c'est le seul logiciel permettant de mettre en oeuvre toutes les méthodes présentées dans cet ouvrage. Enfin, son langage de programmation particulièrement élégant et adapté au calcul mathématique permet de se concentrer dans le codage sur les aspects statistiques. R permet d'arriver directement à l'essentiel et de mieux comprendre les méthodes exposées dans l'ouvrage. [Source : 4e de couv.]

Côte titre : Fs/23016-23017

Exemplaires (2)

Code-barres Cote Support Localisation Section Disponibilité
Fs/23016 Fs/23016-23017 livre Bibliothèque des sciences Français Disponible
Disponible
Fs/23017 Fs/23016-23017 livre Bibliothèque des sciences Français Disponible
Disponible

University Sétif 1 FERHAT ABBAS Faculty of Sciences

Détail de l'auteur

Auteur Stéphane Tuffery

Documents disponibles écrits par cet auteur

Exemplaires (7)

Exemplaires (2)

Accueil

Sélection de la langue

Se connecter

Adresse

Horaires d'ouverture :

Code-barres	Cote	Support	Localisation	Section	Disponibilité
Fs/11568	Fs/11568-11571	livre	Bibliothèque des sciences	Français	Disponible Disponible
Fs/11569	Fs/11568-11571	livre	Bibliothèque des sciences	Français	Disponible Disponible
Fs/11570	Fs/11568-11571	livre	Bibliothèque des sciences	Français	Disponible Disponible
Fs/11571	Fs/11568-11571	livre	Bibliothèque des sciences	Français	Disponible Disponible
Fs/12513	Fs/12513	livre	Bibliothèque des sciences	Français	Disponible Disponible
Fs/13106	Fs/13106-13107	livre	Bibliothèque des sciences	Français	Disponible Disponible
Fs/13107	Fs/13106-13107	livre	Bibliothèque des sciences	Français	Disponible Disponible

Code-barres	Cote	Support	Localisation	Section	Disponibilité
Fs/23016	Fs/23016-23017	livre	Bibliothèque des sciences	Français	Disponible Disponible
Fs/23017	Fs/23016-23017	livre	Bibliothèque des sciences	Français	Disponible Disponible