University Sétif 1 FERHAT ABBAS Faculty of Sciences
Détail de l'indexation
025.04 : Systèmes de recherche et stockage de l'information![]() ![]() ![]() |
Ouvrages de la bibliothèque en indexation 025.04



Titre : Architecture de l'information : Méthodes, outils, enjeux Type de document : texte imprimé Auteurs : Salaþn, Jean-Michel, ; Beno?t Habert, Editeur : De Boeck Année de publication : 2015 Autre Editeur : [Paris] : ADBS Collection : Information & stratégie. Importance : 1 vol. (205 p.) Présentation : ill., graph., tabl., couv. ill. en coul. Format : 24 cm. ISBN/ISSN/EAN : 978-2-8041-9140-5 Langues : Français (fre) Catégories : Informatique Mots-clés : Architecture de l'information
Informatique documentaire
Gestion de l'information
Conception centrée sur l'utilisateur
Interfaces utilisateur (informatique)
Information électroniqueIndex. décimale : 025.04 Systèmes de recherche et stockage de l'information Résumé :
On compte aujourd'hui plus d'un milliard de sites web et applications mobiles. Dans un environnement aussi compétitif, la fidØlitØ de l'internaute ? une interface ou ? une ressource dépend en grande partie de l'expérience de sa visite. C'est pourquoi le role de l'architecte de l'information est primordial : organiser les espaces informationnels, en particulier numériques, afin de garantir ? l'utilisateur un accLs facile et intuitif au contenu recherché. Cela suppose une excellente connaissance du numérique, de l'organisation de l'information, du design de l'expérience utilisateur, mais aussi un dialogue avec des métiers variés et une attention constante ? l'innovation. Premier manuel francophone sur le sujet, cet ouvrage aborde ces différents aspects et prØsente les principales approches et méthodes de l'architecture de l'information, démontant les logiques des systLmes d'information contemporains. L'architecture de l'information fait également l'objet d'un Mooc international sur la plateforme France Université Numérique. Cet ouvrage en est le support.Note de contenu :
Sommaire
Chapitre 1, Les défis de l'architecture de l'information / Jean-Michel Salaün, Christine Dufour, Audrey Laplante
Chapitre 2, Construire un site – les niveaux de Garrett / Jean-Philippe Magué, Vincent Mabillot
Chapitre 3, Intégrer le transcanal – la matrice de Resmini et Rosati / Benoît Habert, Christine Michel
Chapitre 4, Développer un projet en architecture de l'information / Jean-Michel Salaün
Chapitre 5, Les mécanismes du web / Benoît Habert
Chapitre 6, Le grand Lego des données et des services/ Christine Michel, Audrey Serna, René Chalon
Chapitre 7, L'expérience utilisateur – UX / Aurélien Tabard, Alain Mille
Chapitre 8, Classer numérique / Stéphanie Pouchot, Benoît Epron
Chapitre 9, Un nouveau contrat de lecture-écriture / Jean-Michel SalaünCôte titre : Fs/16106-16110 En ligne : https://www.amazon.fr/Architecture-linformation-M%C3%A9thodes-outils-enjeux/dp/2 [...] Format de la ressource électronique : Architecture de l'information : Méthodes, outils, enjeux [texte imprimé] / Salaþn, Jean-Michel, ; Beno?t Habert, . - [S.l.] : De Boeck : [Paris] : ADBS, 2015 . - 1 vol. (205 p.) : ill., graph., tabl., couv. ill. en coul. ; 24 cm.. - (Information & stratégie.) .
ISBN : 978-2-8041-9140-5
Langues : Français (fre)
Catégories : Informatique Mots-clés : Architecture de l'information
Informatique documentaire
Gestion de l'information
Conception centrée sur l'utilisateur
Interfaces utilisateur (informatique)
Information électroniqueIndex. décimale : 025.04 Systèmes de recherche et stockage de l'information Résumé :
On compte aujourd'hui plus d'un milliard de sites web et applications mobiles. Dans un environnement aussi compétitif, la fidØlitØ de l'internaute ? une interface ou ? une ressource dépend en grande partie de l'expérience de sa visite. C'est pourquoi le role de l'architecte de l'information est primordial : organiser les espaces informationnels, en particulier numériques, afin de garantir ? l'utilisateur un accLs facile et intuitif au contenu recherché. Cela suppose une excellente connaissance du numérique, de l'organisation de l'information, du design de l'expérience utilisateur, mais aussi un dialogue avec des métiers variés et une attention constante ? l'innovation. Premier manuel francophone sur le sujet, cet ouvrage aborde ces différents aspects et prØsente les principales approches et méthodes de l'architecture de l'information, démontant les logiques des systLmes d'information contemporains. L'architecture de l'information fait également l'objet d'un Mooc international sur la plateforme France Université Numérique. Cet ouvrage en est le support.Note de contenu :
Sommaire
Chapitre 1, Les défis de l'architecture de l'information / Jean-Michel Salaün, Christine Dufour, Audrey Laplante
Chapitre 2, Construire un site – les niveaux de Garrett / Jean-Philippe Magué, Vincent Mabillot
Chapitre 3, Intégrer le transcanal – la matrice de Resmini et Rosati / Benoît Habert, Christine Michel
Chapitre 4, Développer un projet en architecture de l'information / Jean-Michel Salaün
Chapitre 5, Les mécanismes du web / Benoît Habert
Chapitre 6, Le grand Lego des données et des services/ Christine Michel, Audrey Serna, René Chalon
Chapitre 7, L'expérience utilisateur – UX / Aurélien Tabard, Alain Mille
Chapitre 8, Classer numérique / Stéphanie Pouchot, Benoît Epron
Chapitre 9, Un nouveau contrat de lecture-écriture / Jean-Michel SalaünCôte titre : Fs/16106-16110 En ligne : https://www.amazon.fr/Architecture-linformation-M%C3%A9thodes-outils-enjeux/dp/2 [...] Format de la ressource électronique : Exemplaires (5)
Code-barres Cote Support Localisation Section Disponibilité Fs/16106 Fs/16106-16110 livre Bibliothéque des sciences Français Disponible
DisponibleFs/16107 Fs/16106-16110 livre Bibliothéque des sciences Français Disponible
DisponibleFs/16108 Fs/16106-16110 livre Bibliothéque des sciences Français Disponible
DisponibleFs/16109 Fs/16106-16110 livre Bibliothéque des sciences Français Disponible
DisponibleFs/16110 Fs/16106-16110 livre Bibliothéque des sciences Français Disponible
Disponible
Titre : ERP et progiciels de gestion intégrés : De la décision d'implantation à l'utilisation opérationnelle: Les bases du SCM et du CRM Type de document : texte imprimé Auteurs : Jean-Louis Tomas Mention d'édition : 3e éd. Editeur : Paris : Dunod Année de publication : 2002 Importance : 1 vol (308 p.) Format : 24 cm ISBN/ISSN/EAN : 978-2-10-007907-7 Catégories : Informatique Mots-clés : Informatique
Systèmes d'information dans l'entrepriseIndex. décimale : 025.04 Systèmes de recherche et stockage de l'information Résumé :
Le traitement de l'information dans l'entreprise est en pleine mutation. Les changements fondamentaux (euro, compétitivité accrue, acquisitions, fusions, mondialisation, etc.) conduisent de plus en plus d'entreprises à migrer leurs applications informatiques internes vers les progiciels de gestion intégrés du marché, ou ERP (Enterprise Resource Planning), qui offrent des solutions transversales, homogènes, intégrées, efficaces et évolutives. Cet ouvrage analyse les contextes et les enjeux de cette nouvelle révolution informatique. S'inspirant de son expérience de déploiement d'Oracle Applications et de SAP, l'auteur explique, à l'aide d'exemples concrets, la démarche du " prêt à implanter " et analyse les facteurs clés de réussite du choix, du déploiement et de l'utilisation opérationnelle d'un ERP. Cette troisième édition fait le point sur les nouvelles solutions pour lesquelles l'ERP constitue un prérequis pour l'entreprise : le SCM (Supply Chain Management) et le CRM (Customer Relationship Management). Le mode ASP (Applications Service Provider) est également présenté. Enfin, la phase de post-implantation, encore appelée post-ERP, est analysée et décortiquée afin d'en comprendre la problématique spécifique. Cet ouvrage s'adresse aux directions informatiques, directions générales et opérationnelles, informaticiens, consultants informatiques, consultants en conduite du changement, prestataires de serviceNote de contenu :
Table des matières
LA TRANSITION VERS L'ERP
L'évolution de l'informatique de gestion
L'entreprise malade de son informatique
Du sur mesure au prêt-à -implanter
Prêt-à -implanter : mode d'emploi
LES DOUZE PHASES DE L'IMPLANTATION
Les fondations de l'implantation
La configuration de l'ERP
La connexion avec l'existant
LE POST-ERP OU LA PLEINE UTILISATION DE L'ERP
L'utilisation opérationnelle de l'ERP
L'évolution de l'ERPCôte titre : Fs/2881 ERP et progiciels de gestion intégrés : De la décision d'implantation à l'utilisation opérationnelle: Les bases du SCM et du CRM [texte imprimé] / Jean-Louis Tomas . - 3e éd. . - Paris : Dunod, 2002 . - 1 vol (308 p.) ; 24 cm.
ISSN : 978-2-10-007907-7
Catégories : Informatique Mots-clés : Informatique
Systèmes d'information dans l'entrepriseIndex. décimale : 025.04 Systèmes de recherche et stockage de l'information Résumé :
Le traitement de l'information dans l'entreprise est en pleine mutation. Les changements fondamentaux (euro, compétitivité accrue, acquisitions, fusions, mondialisation, etc.) conduisent de plus en plus d'entreprises à migrer leurs applications informatiques internes vers les progiciels de gestion intégrés du marché, ou ERP (Enterprise Resource Planning), qui offrent des solutions transversales, homogènes, intégrées, efficaces et évolutives. Cet ouvrage analyse les contextes et les enjeux de cette nouvelle révolution informatique. S'inspirant de son expérience de déploiement d'Oracle Applications et de SAP, l'auteur explique, à l'aide d'exemples concrets, la démarche du " prêt à implanter " et analyse les facteurs clés de réussite du choix, du déploiement et de l'utilisation opérationnelle d'un ERP. Cette troisième édition fait le point sur les nouvelles solutions pour lesquelles l'ERP constitue un prérequis pour l'entreprise : le SCM (Supply Chain Management) et le CRM (Customer Relationship Management). Le mode ASP (Applications Service Provider) est également présenté. Enfin, la phase de post-implantation, encore appelée post-ERP, est analysée et décortiquée afin d'en comprendre la problématique spécifique. Cet ouvrage s'adresse aux directions informatiques, directions générales et opérationnelles, informaticiens, consultants informatiques, consultants en conduite du changement, prestataires de serviceNote de contenu :
Table des matières
LA TRANSITION VERS L'ERP
L'évolution de l'informatique de gestion
L'entreprise malade de son informatique
Du sur mesure au prêt-à -implanter
Prêt-à -implanter : mode d'emploi
LES DOUZE PHASES DE L'IMPLANTATION
Les fondations de l'implantation
La configuration de l'ERP
La connexion avec l'existant
LE POST-ERP OU LA PLEINE UTILISATION DE L'ERP
L'utilisation opérationnelle de l'ERP
L'évolution de l'ERPCôte titre : Fs/2881 Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité Fs/2881 Fs/2881 Livre Bibliothéque des sciences Français Disponible
Disponible
Titre : Introduction to information retrieval Type de document : texte imprimé Auteurs : Christopher D. Manning, Auteur ; Prabhakar Raghavan, Auteur ; Hinrich Schütze, Auteur Editeur : Cambridge : Cambridge university press Année de publication : 2008 Importance : 1 vol. (482 p.) Présentation : ill. Format : 27 cm ISBN/ISSN/EAN : 978-0-521-86571-5 Note générale : Bibliogr. p. 441-468 Langues : Anglais (eng) Catégories : Informatique Mots-clés : Traitement de texte (Informatique)
Récupération de l'information
Clustering de documents
Web sémantique
Recherche de l'information
Web sémantique
Discours (linguistique)Index. décimale : 025.04 Systèmes de recherche et stockage de l'information Résumé : Testé en classe et cohérent, ce manuel enseigne la recherche d'informations classiques et sur le Web, y compris la recherche sur le Web et les domaines connexes de la classification des textes et de la classification des textes à partir des concepts de base. Il fournit un traitement à jour de tous les aspects de la conception et de la mise en Å“uvre de systèmes de collecte, d'indexation et de recherche de documents; méthodes d'évaluation des systèmes; et une introduction à l'utilisation des méthodes d'apprentissage automatique sur les collections de textes. Toutes les idées importantes sont expliquées à l'aide d'exemples et de chiffres, ce qui en fait un outil idéal pour les cours d'introduction à la recherche d'information pour les étudiants de premier cycle avancés et les étudiants diplômés en informatique. Basé sur les retours d'expérience de la salle de classe, le livre a été soigneusement structuré afin de rendre l'enseignement plus naturel et efficace. Des diapositives et des exercices supplémentaires (avec des solutions pour les conférenciers) sont également disponibles sur le site Web de soutien du livre pour aider les instructeurs de cours à préparer leurs conférences. Note de contenu :
Sommaire
Boolean retrieval
An example information retrieval problem
A first take at building an inverted index
Processing Boolean queries
The extended Boolean model versus ranked retrieval
References and further reading
The term vocabulary and postings lists
Document delineation and character sequence decoding
Obtaining the character sequence in a document
Choosing a document unit
Determining the vocabulary of terms
Tokenization
Dropping common terms: stop words
Normalization (equivalence classing of terms)
Stemming and lemmatization
Faster postings list intersection via skip pointers
Positional postings and phrase queries
Biword indexes
Positional indexes
Combination schemes
References and further reading
Dictionaries and tolerant retrieval
Search structures for dictionaries
Wildcard queries
General wildcard queries
Permuterm indexes
k-gram indexes for wildcard queries
Spelling correction
Implementing spelling correction
Forms of spelling correction
Edit distance
k-gram indexes for spelling correction
Context sensitive spelling correction
Phonetic correction
References and further reading
Index construction
Hardware basics
Blocked sort-based indexing
Single-pass in-memory indexing
Distributed indexing
Dynamic indexing
Other types of indexes
References and further reading
Index compression
Statistical properties of terms in information retrieval
Heaps' law: Estimating the number of terms
Zipf's law: Modeling the distribution of terms
Dictionary compression
Dictionary as a string
Blocked storage
Postings file compression
Variable byte codes
Gamma codes
References and further reading
Scoring, term weighting and the vector space model
Parametric and zone indexes
Weighted zone scoring
Learning weights
The optimal weight g
Term frequency and weighting
Inverse document frequency
Tf-idf weighting
The vector space model for scoring
Dot products
Queries as vectors
Computing vector scores
Variant tf-idf functions
Sublinear tf scaling
Maximum tf normalization
Document and query weighting schemes
Pivoted normalized document length
References and further reading
Computing scores in a complete search system
Efficient scoring and ranking
Inexact top K document retrieval
Index elimination
Champion lists
Static quality scores and ordering
Impact ordering
Cluster pruning
Components of an information retrieval system
Tiered indexes
Query-term proximity
Designing parsing and scoring functions
Putting it all together
Vector space scoring and query operator interaction
Boolean retrieval
Wildcard queries
Phrase queries
References and further reading
Evaluation in information retrieval
Information retrieval system evaluation
Standard test collections
Evaluation of unranked retrieval sets
Evaluation of ranked retrieval results
Assessing relevance
Critiques and justifications of the concept of relevance
A broader perspective: System quality and user utility
System issues
User utility
Refining a deployed system
Results snippets
References and further reading
Relevance feedback and query expansion
Relevance feedback and pseudo relevance feedback
The Rocchio algorithm for relevance feedback
Probabilistic relevance feedback
When does relevance feedback work?
Relevance feedback on the web
Evaluation of relevance feedback strategies
Pseudo relevance feedback
Indirect relevance feedback
Summary
Global methods for query reformulation
Vocabulary tools for query reformulation
Query expansion
Automatic thesaurus generation
References and further reading
XML retrieval
Basic XML concepts
Challenges in XML retrieval
A vector space model for XML retrieval
Evaluation of XML retrieval
Text-centric vs. data-centric XML retrieval
References and further reading
Exercises
Probabilistic information retrieval
Review of basic probability theory
The Probability Ranking Principle
The 1/0 loss case
The PRP with retrieval costs
The Binary Independence Model
Deriving a ranking function for query terms
Probability estimates in theory
Probability estimates in practice
Probabilistic approaches to relevance feedback
An appraisal and some extensions
An appraisal of probabilistic models
Tree-structured dependencies between terms
Okapi BM25: a non-binary model
Bayesian network approaches to IR
References and further reading
Language models for information retrieval
Language models
Finite automata and language models
Types of language models
Multinomial distributions over words
The query likelihood model
Using query likelihood language models in IR
Estimating the query generation probability
Ponte and Croft's Experiments
Language modeling versus other approaches in IR
Extended language modeling approaches
References and further reading
Text classification and Naive Bayes
The text classification problem
Naive Bayes text classification
Relation to multinomial unigram language model
The Bernoulli model
Properties of Naive Bayes
A variant of the multinomial model
Feature selection
Mutual information
$\chi ^2$ Feature selectionChi2 Feature selection
Assessing $\chi ^2$ as a feature selection methodAssessing chi-square as a feature selection method
Frequency-based feature selection
Feature selection for multiple classifiers
Comparison of feature selection methods
Evaluation of text classification
References and further reading
Vector space classification
Document representations and measures of relatedness in vector spaces
Rocchio classification
k nearest neighbor
Time complexity and optimality of kNN
Linear versus nonlinear classifiers
Classification with more than two classes
The bias-variance tradeoff
References and further reading
Exercises
Support vector machines and machine learning on documents
Support vector machines: The linearly separable case
Extensions to the SVM model
Soft margin classification
Multiclass SVMs
Nonlinear SVMs
Experimental results
Issues in the classification of text documents
Choosing what kind of classifier to use
Improving classifier performance
Large and difficult category taxonomies
Features for text
Document zones in text classification
Machine learning methods in ad hoc information retrieval
A simple example of machine-learned scoring
Result ranking by machine learning
References and further reading
Flat clustering
Clustering in information retrieval
Problem statement
Cardinality - the number of clusters
Evaluation of clustering
K-means
Cluster cardinality in K-means
Model-based clustering
References and further reading
Exercises
Hierarchical clustering
Hierarchical agglomerative clustering
Single-link and complete-link clustering
Time complexity of HAC
Group-average agglomerative clustering
Centroid clustering
Optimality of HAC
Divisive clustering
Cluster labeling
Implementation notes
References and further reading
Exercises
Matrix decompositions and latent semantic indexing
Linear algebra review
Matrix decompositions
Term-document matrices and singular value decompositions
Low-rank approximations
Latent semantic indexing
References and further reading
Web search basics
Background and history
Web characteristics
The web graph
Spam
Advertising as the economic model
The search user experience
User query needs
Index size and estimation
Near-duplicates and shingling
References and further reading
Web crawling and indexes
Overview
Features a crawler must provide
Features a crawler should provide
Crawling
Crawler architecture
Distributing the crawler
DNS resolution
The URL frontier
Distributing indexes
Connectivity servers
References and further reading
Link analysis
The Web as a graph
Anchor text and the web graph
PageRank
Markov chains
The PageRank computation
Topic-specific PageRank
Hubs and Authorities
Choosing the subset of the Web
References and further reading
Bibliography
IndexCôte titre : Fs/19776 Introduction to information retrieval [texte imprimé] / Christopher D. Manning, Auteur ; Prabhakar Raghavan, Auteur ; Hinrich Schütze, Auteur . - Cambridge : Cambridge university press, 2008 . - 1 vol. (482 p.) : ill. ; 27 cm.
ISBN : 978-0-521-86571-5
Bibliogr. p. 441-468
Langues : Anglais (eng)
Catégories : Informatique Mots-clés : Traitement de texte (Informatique)
Récupération de l'information
Clustering de documents
Web sémantique
Recherche de l'information
Web sémantique
Discours (linguistique)Index. décimale : 025.04 Systèmes de recherche et stockage de l'information Résumé : Testé en classe et cohérent, ce manuel enseigne la recherche d'informations classiques et sur le Web, y compris la recherche sur le Web et les domaines connexes de la classification des textes et de la classification des textes à partir des concepts de base. Il fournit un traitement à jour de tous les aspects de la conception et de la mise en Å“uvre de systèmes de collecte, d'indexation et de recherche de documents; méthodes d'évaluation des systèmes; et une introduction à l'utilisation des méthodes d'apprentissage automatique sur les collections de textes. Toutes les idées importantes sont expliquées à l'aide d'exemples et de chiffres, ce qui en fait un outil idéal pour les cours d'introduction à la recherche d'information pour les étudiants de premier cycle avancés et les étudiants diplômés en informatique. Basé sur les retours d'expérience de la salle de classe, le livre a été soigneusement structuré afin de rendre l'enseignement plus naturel et efficace. Des diapositives et des exercices supplémentaires (avec des solutions pour les conférenciers) sont également disponibles sur le site Web de soutien du livre pour aider les instructeurs de cours à préparer leurs conférences. Note de contenu :
Sommaire
Boolean retrieval
An example information retrieval problem
A first take at building an inverted index
Processing Boolean queries
The extended Boolean model versus ranked retrieval
References and further reading
The term vocabulary and postings lists
Document delineation and character sequence decoding
Obtaining the character sequence in a document
Choosing a document unit
Determining the vocabulary of terms
Tokenization
Dropping common terms: stop words
Normalization (equivalence classing of terms)
Stemming and lemmatization
Faster postings list intersection via skip pointers
Positional postings and phrase queries
Biword indexes
Positional indexes
Combination schemes
References and further reading
Dictionaries and tolerant retrieval
Search structures for dictionaries
Wildcard queries
General wildcard queries
Permuterm indexes
k-gram indexes for wildcard queries
Spelling correction
Implementing spelling correction
Forms of spelling correction
Edit distance
k-gram indexes for spelling correction
Context sensitive spelling correction
Phonetic correction
References and further reading
Index construction
Hardware basics
Blocked sort-based indexing
Single-pass in-memory indexing
Distributed indexing
Dynamic indexing
Other types of indexes
References and further reading
Index compression
Statistical properties of terms in information retrieval
Heaps' law: Estimating the number of terms
Zipf's law: Modeling the distribution of terms
Dictionary compression
Dictionary as a string
Blocked storage
Postings file compression
Variable byte codes
Gamma codes
References and further reading
Scoring, term weighting and the vector space model
Parametric and zone indexes
Weighted zone scoring
Learning weights
The optimal weight g
Term frequency and weighting
Inverse document frequency
Tf-idf weighting
The vector space model for scoring
Dot products
Queries as vectors
Computing vector scores
Variant tf-idf functions
Sublinear tf scaling
Maximum tf normalization
Document and query weighting schemes
Pivoted normalized document length
References and further reading
Computing scores in a complete search system
Efficient scoring and ranking
Inexact top K document retrieval
Index elimination
Champion lists
Static quality scores and ordering
Impact ordering
Cluster pruning
Components of an information retrieval system
Tiered indexes
Query-term proximity
Designing parsing and scoring functions
Putting it all together
Vector space scoring and query operator interaction
Boolean retrieval
Wildcard queries
Phrase queries
References and further reading
Evaluation in information retrieval
Information retrieval system evaluation
Standard test collections
Evaluation of unranked retrieval sets
Evaluation of ranked retrieval results
Assessing relevance
Critiques and justifications of the concept of relevance
A broader perspective: System quality and user utility
System issues
User utility
Refining a deployed system
Results snippets
References and further reading
Relevance feedback and query expansion
Relevance feedback and pseudo relevance feedback
The Rocchio algorithm for relevance feedback
Probabilistic relevance feedback
When does relevance feedback work?
Relevance feedback on the web
Evaluation of relevance feedback strategies
Pseudo relevance feedback
Indirect relevance feedback
Summary
Global methods for query reformulation
Vocabulary tools for query reformulation
Query expansion
Automatic thesaurus generation
References and further reading
XML retrieval
Basic XML concepts
Challenges in XML retrieval
A vector space model for XML retrieval
Evaluation of XML retrieval
Text-centric vs. data-centric XML retrieval
References and further reading
Exercises
Probabilistic information retrieval
Review of basic probability theory
The Probability Ranking Principle
The 1/0 loss case
The PRP with retrieval costs
The Binary Independence Model
Deriving a ranking function for query terms
Probability estimates in theory
Probability estimates in practice
Probabilistic approaches to relevance feedback
An appraisal and some extensions
An appraisal of probabilistic models
Tree-structured dependencies between terms
Okapi BM25: a non-binary model
Bayesian network approaches to IR
References and further reading
Language models for information retrieval
Language models
Finite automata and language models
Types of language models
Multinomial distributions over words
The query likelihood model
Using query likelihood language models in IR
Estimating the query generation probability
Ponte and Croft's Experiments
Language modeling versus other approaches in IR
Extended language modeling approaches
References and further reading
Text classification and Naive Bayes
The text classification problem
Naive Bayes text classification
Relation to multinomial unigram language model
The Bernoulli model
Properties of Naive Bayes
A variant of the multinomial model
Feature selection
Mutual information
$\chi ^2$ Feature selectionChi2 Feature selection
Assessing $\chi ^2$ as a feature selection methodAssessing chi-square as a feature selection method
Frequency-based feature selection
Feature selection for multiple classifiers
Comparison of feature selection methods
Evaluation of text classification
References and further reading
Vector space classification
Document representations and measures of relatedness in vector spaces
Rocchio classification
k nearest neighbor
Time complexity and optimality of kNN
Linear versus nonlinear classifiers
Classification with more than two classes
The bias-variance tradeoff
References and further reading
Exercises
Support vector machines and machine learning on documents
Support vector machines: The linearly separable case
Extensions to the SVM model
Soft margin classification
Multiclass SVMs
Nonlinear SVMs
Experimental results
Issues in the classification of text documents
Choosing what kind of classifier to use
Improving classifier performance
Large and difficult category taxonomies
Features for text
Document zones in text classification
Machine learning methods in ad hoc information retrieval
A simple example of machine-learned scoring
Result ranking by machine learning
References and further reading
Flat clustering
Clustering in information retrieval
Problem statement
Cardinality - the number of clusters
Evaluation of clustering
K-means
Cluster cardinality in K-means
Model-based clustering
References and further reading
Exercises
Hierarchical clustering
Hierarchical agglomerative clustering
Single-link and complete-link clustering
Time complexity of HAC
Group-average agglomerative clustering
Centroid clustering
Optimality of HAC
Divisive clustering
Cluster labeling
Implementation notes
References and further reading
Exercises
Matrix decompositions and latent semantic indexing
Linear algebra review
Matrix decompositions
Term-document matrices and singular value decompositions
Low-rank approximations
Latent semantic indexing
References and further reading
Web search basics
Background and history
Web characteristics
The web graph
Spam
Advertising as the economic model
The search user experience
User query needs
Index size and estimation
Near-duplicates and shingling
References and further reading
Web crawling and indexes
Overview
Features a crawler must provide
Features a crawler should provide
Crawling
Crawler architecture
Distributing the crawler
DNS resolution
The URL frontier
Distributing indexes
Connectivity servers
References and further reading
Link analysis
The Web as a graph
Anchor text and the web graph
PageRank
Markov chains
The PageRank computation
Topic-specific PageRank
Hubs and Authorities
Choosing the subset of the Web
References and further reading
Bibliography
IndexCôte titre : Fs/19776 Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité Fs/19776 Fs/19776 Livre Bibliothéque des sciences Français Disponible
Disponible
Titre : Modern information retrieval : The concepts and technology behind search Type de document : texte imprimé Auteurs : Ricardo Baeza-Yates ; Berthier Ribeiro-Neto Mention d'édition : 2e éd. Editeur : Addison Wesley Année de publication : 2011 Importance : 1 vol. (913 p.) Présentation : ill. Format : 24 cm ISBN/ISSN/EAN : 978-0-321-41691-9 Catégories : Informatique Mots-clés : Recherche de l'information
Recherche d'information multilingue
Recherche sur InternetIndex. décimale : 025.04 Systèmes de recherche et stockage de l'information Résumé :
Ceci est un manuel rigoureux et complet pour un premier cours sur la recherche d'information du point de vue de l'informatique. Il offre un étudiant traitement axé sur la mise à jour de la recherche d'information, y compris la couverture étendue de nouveaux sujets tels que la recherche web, exploration du Web, les moteurs de recherche open source et les interfaces utilisateur.
De l'analyse à l'indexation, la classification à la classification, la recherche de classement, et les commentaires des utilisateurs pour la récupération évaluation, sont soigneusement introduits et exemplifié tous les concepts les plus importants. Le contenu et la structure du livre ont été soigneusement conçus par les deux auteurs principaux, avec des contributions individuelles provenant de sommités internationales dans le domaine, y compris Yoelle Maarek, directeur principal de Yahoo! Recherche Israël; Dulce Poncele'on IBM Research; et Malcolm Slaney, Yahoo Research USA.
Ce complètement réorganisé, révisé et deuxième édition élargie de l'information moderne de récupération contient de nombreux nouveaux chapitres et doubler le nombre de pages et les références bibliographiques de la première édition, et un site Web compagnon www.mir2ed.org avec du matériel pédagogique. Il se révélera inestimable pour les étudiants, les professeurs, les chercheurs, les praticiens et les chercheurs de ce domaine fascinant de la recherche d'information.Note de contenu :
Sommaire
1 Introduction
2 User Interfaces for Search by Marti Hearst
3 Modeling
4 Retrieval Evaluation
5 Relevance Feedback and Query Expansion
6 Documents: Languages & Properties with Gonzalo Navarro and Nivio Ziviani
7 Queries: Languages & Properties with Gonzalo Navarro
8 Text Classification with Marcos Gon¸calves
9 Indexing and Searching with Gonzalo Navarro
10 Parallel and Distributed IR with Eric Brown
11 Web Retrieval with Yoelle Maarek
12 Web Crawling with Carlos Castillo
13 Structured Text Retrieval with Mounia Lalmas
14 Multimedia Information Retrieval by Dulce Poncele´on and Malcolm Slaney
15 Enterprise Search by David Hawking
16 Library Systems by Edie Rasmussen
17 Digital Libraries by Marcos Gon¸calves
A Open Source Search Engines with Christian Middleton
B Biographies
Bibliography
IndexCôte titre : Fs/19800 Modern information retrieval : The concepts and technology behind search [texte imprimé] / Ricardo Baeza-Yates ; Berthier Ribeiro-Neto . - 2e éd. . - [S.l.] : Addison Wesley, 2011 . - 1 vol. (913 p.) : ill. ; 24 cm.
ISBN : 978-0-321-41691-9
Catégories : Informatique Mots-clés : Recherche de l'information
Recherche d'information multilingue
Recherche sur InternetIndex. décimale : 025.04 Systèmes de recherche et stockage de l'information Résumé :
Ceci est un manuel rigoureux et complet pour un premier cours sur la recherche d'information du point de vue de l'informatique. Il offre un étudiant traitement axé sur la mise à jour de la recherche d'information, y compris la couverture étendue de nouveaux sujets tels que la recherche web, exploration du Web, les moteurs de recherche open source et les interfaces utilisateur.
De l'analyse à l'indexation, la classification à la classification, la recherche de classement, et les commentaires des utilisateurs pour la récupération évaluation, sont soigneusement introduits et exemplifié tous les concepts les plus importants. Le contenu et la structure du livre ont été soigneusement conçus par les deux auteurs principaux, avec des contributions individuelles provenant de sommités internationales dans le domaine, y compris Yoelle Maarek, directeur principal de Yahoo! Recherche Israël; Dulce Poncele'on IBM Research; et Malcolm Slaney, Yahoo Research USA.
Ce complètement réorganisé, révisé et deuxième édition élargie de l'information moderne de récupération contient de nombreux nouveaux chapitres et doubler le nombre de pages et les références bibliographiques de la première édition, et un site Web compagnon www.mir2ed.org avec du matériel pédagogique. Il se révélera inestimable pour les étudiants, les professeurs, les chercheurs, les praticiens et les chercheurs de ce domaine fascinant de la recherche d'information.Note de contenu :
Sommaire
1 Introduction
2 User Interfaces for Search by Marti Hearst
3 Modeling
4 Retrieval Evaluation
5 Relevance Feedback and Query Expansion
6 Documents: Languages & Properties with Gonzalo Navarro and Nivio Ziviani
7 Queries: Languages & Properties with Gonzalo Navarro
8 Text Classification with Marcos Gon¸calves
9 Indexing and Searching with Gonzalo Navarro
10 Parallel and Distributed IR with Eric Brown
11 Web Retrieval with Yoelle Maarek
12 Web Crawling with Carlos Castillo
13 Structured Text Retrieval with Mounia Lalmas
14 Multimedia Information Retrieval by Dulce Poncele´on and Malcolm Slaney
15 Enterprise Search by David Hawking
16 Library Systems by Edie Rasmussen
17 Digital Libraries by Marcos Gon¸calves
A Open Source Search Engines with Christian Middleton
B Biographies
Bibliography
IndexCôte titre : Fs/19800 Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité Fs/19800 Fs/19800 Livre Bibliothéque des sciences Français Disponible
Disponible
Titre : Net recherche 2010 : le guide pratique pour mieux trouver l'information utile et surveiller le web Type de document : texte imprimé Auteurs : Véronique Mesguich, Auteur ; Armelle Thomas (1960-....), Auteur Mention d'édition : 4e éd. mise à jour Editeur : Paris : ADBS éd. Année de publication : 2010 Collection : Sciences et techniques de l'information, ISSN 1762-8288 Importance : 1 vol. (341 p.) Présentation : ill., couv. ill. Format : 24 cm ISBN/ISSN/EAN : 978-2-84365-124-3 Note générale : ADBS = Association des professionnels de l'information et de la documentation
Webliogr. p. 309-310. IndexLangues : Français (fre) Catégories : Informatique Mots-clés : Recherche sur Internet : Guides pratiques et mémentos
Recherche de l'information : Guides pratiques et mémentosIndex. décimale : 025.04 Systèmes de recherche et stockage de l'information Résumé : Net recherche 2010 : le guide pratique pour mieux trouver l'information utile et surveiller le web
Pourquoi un livre sur un thème aussi mouvant que la recherche d'informations sur Internet ? Parce que ce sujet en constante évolution reste finalement assez peu étudié dans son ensemble. Or il est indispensable de proposer aux internautes une vision globale qui leur donne le recul nécessaire face à la prolifération d'informations en ligne et leur permette d'identifier des contenus de qualité répondant précisément à leurs besoins. Sous l'apparente facilité d'utilisation des moteurs de recherche se cache en effet une réalité complexe, et le secret de la réussite d'une recherche ou d'une veille passe autant par la maîtrise des aspects techniques que par la capacité à évaluer et sélectionner les sources pertinentes.
Mise à jour de l'édition 2009, cette quatrième parution de Net recherche vise à offrir à toute personne amenée à effectuer des recherches sur Internet un panorama des outils et méthodes existant à ce jour, en intégrant les dispositifs qui permettent de surveiller le web à moindre coût. Cet ouvrage s'adresse notamment aux professionnels de l'information (documentalistes, bibliothécaires, veilleurs), aux enseignants, chercheurs et étudiants, et à tous les autres «travailleurs du savoir» confrontés à la complexité croissante et à l'inflation de l'information en ligne. Ils y découvriront des conseils méthodologiques mais aussi nombre de «trucs et astuces» destinés à optimiser le processus de recherche ou de veille, des informations précises sur les évolutions en cours, ainsi que des présentations d'outils et des listes d'adresses utiles.
Après avoir fondé et codirigé pendant six ans un cabinet spécialisé en veille technologique, VÉRONIQUE MESGUICH a pris en 1994 la responsabilité des activités Entreprises de l'Infothèque du Pôle universitaire Léonard de Vinci, puis en 2006 la direction de cette Infothèque. Elle enseigne également la maîtrise de l'information stratégique dans plusieurs établissements d'enseignement supérieur, dont l'École européenne d'intelligence économique, et anime régulièrement des sessions de formation continue autour de la méthodologie de recherche avancée et de veille sur Internet.
Après plusieurs années passées en entreprise dans le domaine du marketing et de la communication, ARMELLE THOMAS est depuis 1998 consultante en veille documentaire et stratégique. Professionnelle de la recherche d'information et de la veille, notamment sur Internet, elle intervient en conseil pour des entreprises et des collectivités territoriales. Elle s'investit dans de nombreuses formations sur ces sujets et anime fréquemment des séminaires pour documentalistes, veilleurs et décideurs.Note de contenu :
Table des matières
DIVERSITE DES BESOINS, DIVERSITE DES CONTENUS
LA RECHERCHE PAR MOTS-CLES : LES MOTEURS SACRES ROIS DES OUTILS
POUR UNE RECHERCHE THEMATIQUE : DES ANNUAIRES GENERALISTES AUX PORTAILS SPECIALISES
L'APPORT DU WEB SOCIAL A LA RECHERCHE D'INFORMATIONS
NET VEILLE, LA RECHERCHE AUTOMATISEE
COMMENTAIRES DE LA METHODE : DES EXEMPLES DE RECHERCHENet recherche 2010 : le guide pratique pour mieux trouver l'information utile et surveiller le web [texte imprimé] / Véronique Mesguich, Auteur ; Armelle Thomas (1960-....), Auteur . - 4e éd. mise à jour . - Paris : ADBS éd., 2010 . - 1 vol. (341 p.) : ill., couv. ill. ; 24 cm. - (Sciences et techniques de l'information, ISSN 1762-8288) .
ISBN : 978-2-84365-124-3
ADBS = Association des professionnels de l'information et de la documentation
Webliogr. p. 309-310. Index
Langues : Français (fre)
Catégories : Informatique Mots-clés : Recherche sur Internet : Guides pratiques et mémentos
Recherche de l'information : Guides pratiques et mémentosIndex. décimale : 025.04 Systèmes de recherche et stockage de l'information Résumé : Net recherche 2010 : le guide pratique pour mieux trouver l'information utile et surveiller le web
Pourquoi un livre sur un thème aussi mouvant que la recherche d'informations sur Internet ? Parce que ce sujet en constante évolution reste finalement assez peu étudié dans son ensemble. Or il est indispensable de proposer aux internautes une vision globale qui leur donne le recul nécessaire face à la prolifération d'informations en ligne et leur permette d'identifier des contenus de qualité répondant précisément à leurs besoins. Sous l'apparente facilité d'utilisation des moteurs de recherche se cache en effet une réalité complexe, et le secret de la réussite d'une recherche ou d'une veille passe autant par la maîtrise des aspects techniques que par la capacité à évaluer et sélectionner les sources pertinentes.
Mise à jour de l'édition 2009, cette quatrième parution de Net recherche vise à offrir à toute personne amenée à effectuer des recherches sur Internet un panorama des outils et méthodes existant à ce jour, en intégrant les dispositifs qui permettent de surveiller le web à moindre coût. Cet ouvrage s'adresse notamment aux professionnels de l'information (documentalistes, bibliothécaires, veilleurs), aux enseignants, chercheurs et étudiants, et à tous les autres «travailleurs du savoir» confrontés à la complexité croissante et à l'inflation de l'information en ligne. Ils y découvriront des conseils méthodologiques mais aussi nombre de «trucs et astuces» destinés à optimiser le processus de recherche ou de veille, des informations précises sur les évolutions en cours, ainsi que des présentations d'outils et des listes d'adresses utiles.
Après avoir fondé et codirigé pendant six ans un cabinet spécialisé en veille technologique, VÉRONIQUE MESGUICH a pris en 1994 la responsabilité des activités Entreprises de l'Infothèque du Pôle universitaire Léonard de Vinci, puis en 2006 la direction de cette Infothèque. Elle enseigne également la maîtrise de l'information stratégique dans plusieurs établissements d'enseignement supérieur, dont l'École européenne d'intelligence économique, et anime régulièrement des sessions de formation continue autour de la méthodologie de recherche avancée et de veille sur Internet.
Après plusieurs années passées en entreprise dans le domaine du marketing et de la communication, ARMELLE THOMAS est depuis 1998 consultante en veille documentaire et stratégique. Professionnelle de la recherche d'information et de la veille, notamment sur Internet, elle intervient en conseil pour des entreprises et des collectivités territoriales. Elle s'investit dans de nombreuses formations sur ces sujets et anime fréquemment des séminaires pour documentalistes, veilleurs et décideurs.Note de contenu :
Table des matières
DIVERSITE DES BESOINS, DIVERSITE DES CONTENUS
LA RECHERCHE PAR MOTS-CLES : LES MOTEURS SACRES ROIS DES OUTILS
POUR UNE RECHERCHE THEMATIQUE : DES ANNUAIRES GENERALISTES AUX PORTAILS SPECIALISES
L'APPORT DU WEB SOCIAL A LA RECHERCHE D'INFORMATIONS
NET VEILLE, LA RECHERCHE AUTOMATISEE
COMMENTAIRES DE LA METHODE : DES EXEMPLES DE RECHERCHEExemplaires (2)
Code-barres Cote Support Localisation Section Disponibilité Fs/4799 Fs/4799-4800 livre Bibliothéque des sciences Français Disponible
DisponibleFs/4800 Fs/4799-4800 livre Bibliothéque des sciences Français Disponible
DisponiblePermalinkPermalink