Using Ancillary Text to Index Web-based Multimedia Objects


Autoria(s): Da Sylva, Lyne; Turner, James M.
Data(s)

28/05/2013

28/05/2013

01/06/2006

Resumo

PériCulture est le nom d'un projet de recherche à l'Université de Montréal qui fait partie d'un projet plus vaste basé à l'Université de Sherbrooke. Ce dernier visait à former un réseau de recherche pour la gestion du contenu culturel numérique canadien. L'objectif général de la recherche de PériCulture était d'étudier les méthodes d'indexation de contenus culturels non textuels sur le Web, plus spécifiquement des images. Les résultats de la recherche présentés ici s'appuient sur des travaux précédents en indexation d'images et en indexation automatique (de texte), par l'étude des propriétés du texte associé à des images dans un environnement réseau. Le but était de comprendre la façon dont le texte associé à des images sur des pages Web (appelé péritexte) peut être exploité pour indexer les images correspondantes. Nous avons étudié cette question dans le contexte de pages Web sélectionnées, c'est à dire : des pages de contenu culturel canadien contenant des objets multimédia auxquels était associé du texte (plus que simplement les noms de fichiers et les légendes) et qui étaient bilingues (anglais et français). Nous avons identifié les mots-clés utiles à l'indexation situés à proximité de l'objet décrit. Les termes d'indexation potentiels ont été identifiés dans diverses balises HTML et dans le texte intégral (chacun étant considéré comme une source différente de péritexte). Notre étude a révélé qu'un grand nombre de termes d'indexation utiles sont disponibles dans le péritexte de nombreux sites Web ayant un contenu culturel, et ce péritexte de différentes sources a une utilité variable dans la recherche d’information. Nos résultats suggèrent que ces termes peuvent être exploités de différentes manières dans les systèmes de recherche d’information pour améliorer les résultats de recherche.

Réseau de recherche pour la gestion du contenu culturel numérique. (Responsable du réseau: Djemel Ziou, Université de Sherbrooke) (CoRIMedia). Subvention du Fonds des réseaux de recherche sur les nouveaux médias (Ministère du Patrimoine canadien)

Identificador

Da Sylva, Lyne et James M. Turner. 2006. Using ancillary text to index web-based multimedia objects. Literary and Linguistic Computing, (Special Issue of the best papers of the ACH-ALLC 2005 conference), 21, no 2 : 219-228.

http://hdl.handle.net/1866/9618

Idioma(s)

en

Palavras-Chave #indexation automatique #contenu culturel canadien sur le Web #péritexte #indexation automatique d'éléments non textuels
Tipo

Article