Semanttisen webin ontologisen tekstiilikäsitteistön kehittäminen ja liittäminen museoiden luettelointitietoihin


Autoria(s): Kettula, Suvi-Päivikki
Contribuinte(s)

Helsingin yliopisto, käyttäytymistieteellinen tiedekunta, kotitalous- ja käsityötieteiden laitos

Helsingfors universitet, beteendevetenskapliga fakulteten, institutionen för hushålls- och slöjdvetenskap

University of Helsinki, Faculty of Behavioural Sciences, Department of Home Economics and Craft Science

Data(s)

27/11/2009

Resumo

DEVELOPING A TEXTILE ONTOLOGY FOR THE SEMANTIC WEB AND CONNECTING IT TO MUSEUM CATALOGING DATA The goal of the Semantic Web is to share concept-based information in a versatile way on the Internet. This is achievable using formal data structures called ontologies. The goal of this re-search is to increase the usability of museum cataloging data in information retrieval. The work is interdisciplinary, involving craft science, terminology science, computer science, and museology. In the first part of the dissertation an ontology of concepts of textiles, garments, and accessories is developed for museum cataloging work. The ontology work was done with the help of thesauri, vocabularies, research reports, and standards. The basis of the ontology development was the Museoalan asiasanasto MASA, a thesaurus for museum cataloging work which has been enriched by other vocabularies. Concepts and terms concerning the research object, as well as the material names of textiles, costumes, and accessories, were focused on. The research method was terminological concept analysis complemented by an ontological view of the Semantic Web. The concept structure was based on the hierarchical generic relation. Attention was also paid to other relations between terms and concepts, and between concepts themselves. Altogether 977 concept classes were created. Issues including how to choose and name concepts for the ontology hierarchy and how deep and broad the hierarchy could be are discussed from the viewpoint of the ontology developer and museum cataloger. The second part of the dissertation analyzes why some of the cataloged terms did not match with the developed textile ontology. This problem is significant because it prevents automatic ontological content integration of the cataloged data on the Semantic Web. The research datasets, i.e. the cataloged museum data on textile collections, came from three museums: Espoo City Museum, Lahti City Museum and The National Museum of Finland. The data included 1803 textile, costume, and accessory objects. Unmatched object and textile material names were analyzed. In the case of the object names six categories (475 cases), and of the material names eight categories (423 cases), were found where automatic annotation was not possible. The most common explanation was that the cataloged field was filled with a long sentence comprised of many terms. Sometimes in the compound term, the object name and material, or the name and the way of usage, were combined. As well, numeric values in the material name cataloging field prevented annotation and so did the absence of a corresponding concept in the ontology. Ready-made drop-down lists of materials used in one cataloging system facilitated the annotation. In the case of naming objects and materials, one should use terms in basic form without attributes. The developed textile ontology has been applied in two cultural portals, MuseumFinland and Culturesampo, where one can search for and browse information based on cataloged data using integrated ontologies in an interoperable way. The textile ontology is also part of the national FinnONTO ontology infrastructure. Keywords: annotation, concept, concept analysis, cataloging, museum collection, ontology, Semantic Web, textile collection, textile material

Semanttisen webin tavoitteena on käsitteiden merkitykseen perustuvan tiedon yhdistäminen ja jakaminen verkossa sekä monipuolinen käytettävyys tiedonvälityksessä. Tämä saavutetaan käyttämällä ontologioita, jotka ovat formaaleja tietorakenteita. Tutkimuksen tavoitteena on lisätä museoissa olevien tiedonhallintajärjestelmien luettelointitietojen hyödynnettävyyttä semanttisen webin tiedon yhdistämisessä ja tiedonhaussa. Työ on luonteeltaan tieteidenvälinen ja siinä liikutaan käsityötieteen, terminologian, tietojenkäsittelytieteen, ja museologian leikkausalueella. Tutkimuksen ensimmäisessä vaiheessa kehitettiin ontologinen museokontekstiin sovellettu tekstiili- ja pukinealan käsitteistö. Käsitteiden muokkaamiseksi käytettiin tekstiilejä ja pukineita kuvaavia museo- ja kulttuurialan sanastoja, standardeja ja tutkimuksia. Käsitteistön perusrunkona oli Museoalan asiasanasto MASA, jota rikastettiin muulla aineistolla. Aineistossa keskityttiin esineen nimeä ja materiaaleja kuvaaviin käsitteisiin. Tutkimusmenetelmänä käytettiin terminologista käsiteanalyysiä, johon lisättiin semanttisen webin ontologinen näkökulma. Käsitteistö muokattiin geneerisen hierarkiasuhteen mukaisesti. Huomioon otettiin myös muita käsitteiden välisiä sekä käsitteen ja termin välisiä suhteita. Käsiteluokkia oli yhteensä 977 kappaletta. Työssä tuodaan esille ontologian kehittäjän ja luetteloijan näkökulma hierarkian käsitteiden valintaan, nimeämiseen, hierarkian syvyyteen ja laajuuteen. Tutkimuksen toisessa vaiheessa selvitettiin, miksi osa museoiden tekstiileihin ja pukeneisiin liittyvistä luettelointitiedoista jäivät annotoitumatta kehitettyyn ontologiseen tekstiilikäsitteistöön. Ongelma on keskeinen, koska se estää kokoelmatietojen automaattisen ontologiaperustaisen julkaisemisen semanttisessa webissä. Aineistona käytettiin MuseoSuomi-portaalissa olevien kolmen kulttuurihistoriallisen museon: Espoon kaupunginmuseon, Lahden kaupunginmuseon ja Suomen kansallismuseon tekstiili- ja pukinekokoelmien luettelointitietoja. Aineistossa oli tekstiilejä ja pukineita yhteensä 1803 kappaletta. Tiedoista analysoitiin esineiden annotoitumattomat nimi- ja materiaalikenttien sisällöt. Lähinnä erityisnimien luettelointitermien nimikentän annotoitumisen esteeksi analyysissä löytyi kuusi syykategoriaa (475 tapausta) ja materiaalikenttien analyysissä kahdeksan kategoriaa (423 tapausta). Yleisimpänä annotoitumattomuuden syynä oli molemmissa tapauksissa luettelointikenttien täyttäminen pitkällä, useiden termien lausekkeella. Lisäksi yhdyssanatermiin oli usein yhdistetty esimerkiksi materiaali ja esineen nimi tai käyttötapa ja esineen nimi. Myös luettelointikenttään kirjoitetut numeeriset ilmaisut tai luettelointitermiä vastaavan käsitteen puuttuminen ontologiasta estivät annotoitumisen. Valmiiden valikoiden käyttö materiaalikenttien arvojen kirjaamisessa helpotti tiedon annotoitumista. Luetteloinnissa tulisi esineen nimi ja materiaalikenttien arvot kirjata termin perusmuodossa ilman lisämääreitä. Tutkimustuloksia on hyödynnetty MuseoSuomi- ja Kulttuurisampo-järjestelmissä, joissa museoesineisiin yhteismitallisesti liitettyä tietoa voidaan hakea yhdestä portaalista. Käsitteistö on liitetty osaksi kansallista FinnONTO-ontologiajärjestelmää. Avainsanat: annotointi, käsite, käsiteanalyysi, luettelointi, museokokoelma, ontologia, semanttinen web, tekstiilikokoelma, tekstiilimateriaali

Identificador

URN:ISBN:978-952-10-5845-5

http://hdl.handle.net/10138/20007

Idioma(s)

fi

Publicador

Helsingin yliopisto

Helsingfors universitet

University of Helsinki

Relação

URN:ISBN:978-952-195844-8

Espoo: Helsingin yliopisto, 2009, Kotitalous- ja käsityötieteiden laitoksen julkaisuja. 1456-4912

Direitos

Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.

This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.

Publikationen är skyddad av upphovsrätten. Den får läsas och skrivas ut för personligt bruk. Användning i kommersiellt syfte är förbjuden.

Palavras-Chave #käsityötiede
Tipo

Väitöskirja (monografia)

Doctoral dissertation (monograph)

Doktorsavhandling (monografi)

Text