Puhutun kielen segmentointi lausemaisiksi yksiköiksi


Autoria(s): Dannenberg, Anna
Contribuinte(s)

Helsingin yliopisto, Humanistinen tiedekunta, yleisen kielitieteen laitos

University of Helsinki, Faculty of Arts, Department of General Linguistics

Helsingfors universitet, Humanistiska fakulteten, institutionen för allmän språkvetenskap

Data(s)

2004

Resumo

Puhutun kielen segmentointiin ei ole olemassa kaikkiin tarkoituksiin sopivaa, yleisesti hyväksyttyä ja toimivaa menetelmää - kirjoitettu kieli segmentoituu lauseiksi ja virkkeiksi, mutta puhetta segmentoidaan monin eri tavoin tilanteesta ja tarkoituksesta riippuen. Tähän on vaikuttanut kirjoitetun kielen keskeinen asema kielitieteellisessä tutkimuksessa: kirjoitusta on tutkittu enemmän ja kauemmin kuin puhetta, ja lisäksi kirjoitettu kieli vaikuttaa ihmisten kielikäsityksiin myös tiedostamattomalla tasolla, joten puhetta on vasta viime aikoina alettu tarkastella sen omista lähtökohdista käsin. Pro gradu -tutkielmassani vertaan keskenään kolmea puhutun kielen segmentointitapaa, jotka perustuvat erilaisiin teorioihin puheen luonteesta. Ensimmäinen on pohjoismaiseen Talsyntax-projektiin perustuva puhtaasti syntaktinen analyysimalli, jonka mukaiset segmentit ovat syntaktisesti itsenäisiä makrosyntagmoja. Toinen on Wallace Chafen ajattelua mukaileva kognitiivisperustainen segmentointitapa, jossa puheen katsotaan koostuvan ihmisen kognition toimintaa heijastavista ajatusyksiköistä. Kolmas malli perustuu David Brazilin teoriaan, jossa intonaatio ja kommunikaatio liittyvät olennaisesti toisiinsa, ja tämän mallin mukaan puhe segmentoituu kommunikaation kannalta merkityksellisiksi intonaatiojaksoiksi. Mallien vertailupohjana toimii erilaisista puhetilanteista koostuva 15 minuutin puhekorpus, jonka olen segmentoinut kaikkien kolmen mallin mukaisesti ja verrannut segmentointituloksia toisiinsa. Tutkimukseni osoittaa, että intonaatioon, kognitioon ja syntaksiin pohjautuvat segmentointitavat tuottavat hyvin samantapaisia tuloksia: segmenttien rajakohdista suurin osa on kaikkien kolmen segmentointitavan mukaisia. Erityisesti intonaatioon ja syntaksiin perustuvien analyysien tulokset ovat hyvin samankaltaisia, kun taas kognitiivispohjaisen segmentointitavan mukaiset tulokset eroavat muista enemmän ja se on myös tulkinnanvaraisempi. Kun puhuttu teksti segmentoidaan sekä intonaatiojaksoiksi että makrosyntagmoiksi, syntyvistä segmenteistä on molempien segmentointitapojen suhteen yhteneviä noin 85 % ja niihin kuuluu kaikista tekstin sanoista lähes 60 %. Eri segmentointitapojen suhteen yhteneviä segmenttejä ovat tyypillisesti minimipalautteet ja muut lyhyet puheenvuorot, ja lisäksi yhtenevyys on tyypillistä kysymyksille sekä puhujan ja puheenaiheen vaihtumiskohdille. Epäyhtenevyyttä puolestaan esiintyy lähinnä tilanteissa, joissa sama henkilö on pitkään yhtäjaksoisesti äänessä: mitä pidempi yhtenäinen puhejakso, sitä vaikeampi puhujan on hahmottaa sitä kokonaisuutena, joten sellaisiin muodostuu helpommin intonationaalisia tai syntaktisia epäjohdonmukaisuuksia. Tuloksista voidaan päätellä, että intonaatio ja syntaksi sekä jossain määrin myös kognitio liittyvät olennaisesti toisiinsa puhutussa kielessä. Jos tarkoituksena on löytää yleisesti hyväksyttävä ja toimiva puhutun kielen segmentointitapa, intonationaalis-syntaktinen segmentointi vaikuttaisi olevan hyvä lähtökohta. Avainsanat: puhuttu kieli, puhe, segmentointi, lause, intonaatio, kognitio, syntaksi

Identificador

URN:NBN:fi-fe20041953

http://hdl.handle.net/10138/19335

Idioma(s)

fi

Publicador

Helsingfors universitet

University of Helsinki

Helsingin yliopisto

Direitos

Publikationen är skyddad av upphovsrätten. Den får läsas och skrivas ut för personligt bruk. Användning i kommersiellt syfte är förbjuden.

This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.

Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.

Tipo

pro gradu-avhandlingar

pro gradu -tutkielmat

master's thesis