Indexation et interrogation de pages Web décomposées en blocs visuels

Indexation et interrogation de pages Web décomposées en blocs visuels

BlockWeb : un modèle d'indexation et d'interrogation de pages Web

Presses Académiques Francophones ( 11.08.2014 )

€ 95,90

Acheter à la boutique MoreBooks!

Cet ouvrage porte sur l'indexation et l'interrogation de pages Web. Nous présentons le modèle BlockWeb, qui s'appuie sur une décomposition de pages Web en une hiérarchie de blocs visuels et prend en compte l'importance visuelle de chaque bloc et la perméabilité des blocs au contenu de leurs blocs voisins dans la page. Cette décomposition permet notamment d'effectuer une interrogation à une granularité plus fine que la page : les blocs les plus similaires à une requête sont être renvoyés à la place de la page complète. Une page est représentée sous forme d'un graphe acyclique orienté dont chaque nœud est associé à un bloc et étiqueté par son importance et chaque arc est étiqueté par la perméabilité du bloc cible au bloc source. Afin de construire ce graphe à partir de la représentation en arbre de blocs d'une page, nous proposons un nouveau langage : XIML (XML Indexing Management Language), qui est un langage de règles. Ce modèle a été expérimenté sur deux applications distinctes : la recherche du meilleur point d'entrée sur un corpus d'articles de journaux électroniques et l'indexation et la recherche d'images sur un corpus de la campagne d'ImagEval 2006.

Détails du livre:

ISBN-13:

978-3-8381-4402-3

ISBN-10:

3838144023

EAN:

9783838144023

Langue du Livre:

Français

By (author) :

Nicolas Faessel

Nombre de pages:

200

Publié le:

11.08.2014

Catégorie:

Informatics, IT