Cours2 IRI.pdf


Aperçu du fichier PDF cours2-iri.pdf

Page 1 2 3 45634




Aperçu texte


Introduction

Segmentation

Normalisation

Indexation

Pondération des index

Exemple : Google’98

Représentation du contenu des documents
• Possibilité de représenter la distribution des index dans les

documents dans une matrice (termes x documents) :

• La matrice peut être extrêmement creuse : on ne représente que

les valeurs non nulles
• Les fichiers inverses associent aux termes les documents qui

les contiennent
• Utilisation de listes chaînées pour représenter les listes de
documents (allocation dynamique, insertion facile) :

Master 2 Professionnel Informatique et MIAGE Université Paris-Sud 11