Aamiaiskahvilasta ötökkätarjontaan. Suomen kirjoitetun yleiskielen morfosyntaktisten yhdyssanarakenteiden produktiivisuus

Autoria(s): Tyysteri, Laura





Tämän tutkimuksen kohde on suomen kirjoitetun yleiskielen morfosyntaktisten yhdyssanarakenteiden produktiivisuus. Tutkimuksen tärkein päämäärä on selvittää, kuinka ahkerasti erilaisia suomen kielen suomia mahdollisuuksia käytetään uusien yhdyssanojen muodostuksessa. Käytännöllistä produktiivisuutta kartoittava tutkimus täydentää kielioppien ja sanastonkuvausten antamaa kuvaa kielestä. Tutkimuksen kohteena oleva kielimuoto on kaikille kielenkäyttäjille yhteinen kirjoitettu yleiskieli. Tutkimusaineisto koostuu 28 091 uudesta yhdyssanasta, jotka on kerätty painetun median kielestä vuosina 2000–2009. Aineiston pohjana on Kotimaisten kielten keskuksen Nykysuomen sanastotietokanta, johon poimitaan uusia ja uudella tavalla käytettyjä sanoja ensisijaisesti sanakirjatyön ja kielenhuollon tarpeisiin. Tutkimusaihetta lähestytään useiden yhdyssanan osien muotoa, sanaluokkaa, määrää ja pituutta koskevien alakysymysten kautta. Tutkimus etenee yksittäisten muut-tujien käsittelystä muuttujien keskinäisiä suhteita tarkasteleviin malleihin. Tutkimuksessa käytetään kaksivaiheista metodia: Metodin ensimmäinen askel on uudessa sanastossa havaittujen rakenteiden tyyppifrekvenssin tilastollinen analyysi. Toinen askel on varsinkin matalafrekvenssisten tai tilastollisessa analyysissa muuten poikkeavaksi osoittautuneiden rakenteiden kvalitatiivinen tarkastelu. Metodi on kehitetty tätä tutkimusta varten, sillä aiemmin produktiivisuuden mittaamisessa käytetyt menetelmät eivät sellaisenaan sovi suomen kielen yhdyssanarakenteiden tutkimukseen. Tutkimusmetodien kehittäminen on tutkimuksen keskeinen tavoite. Tutkimus osoittaa, että suomen kielen uudet yhdyssanat ovat rakenteeltaan homogeenisempiä, kuin aiempia kielenkuvauksia lukemalla voisi olettaa. Uusi suomen kielen yhdyssana on todennäköisimmin kahdesta substantiivista yhdistämällä muodostettu substantiivi, jonka alkuosa on nominatiivissa eikä kongruoi jälkiosan kanssa. Ennakko-oletusta huomattavasti yleisempiä ovat myös prefiksinkaltaisella alkuosalla alkavat yhdyssanat. Genetiivialkuiset yhdyssanat puolestaan ovat ennakko-oletusta harvinaisempia. Kaikki kieliopillisesti mahdolliset yhdyssanarakenteet eivät ole lainkaan produktiivisia kielenkäytön tasolla. Tutkimus on luonteeltaan kielen rakennetta kartoittavaa perustutkimusta. Tutkimustulosten tärkeimmät sovellusalat ovat kieliteknologia ja sananmuodostuksen opetus. Tutkimus avaa useita näkökulmia jatkotutkimukselle.

Productivity of morphosyntactic compound structures in written Finnish standard language The subject of this study is the productivity of morphosyntactic compound structures in standard written Finnish. The main goal of the study is to examine the frequency of use of the range of possibilities by which new compound structures can be formed in the Finnish language. The study, which surveys practical productivity, complements the picture that grammar and lexicon descriptions give about the language. The study focuses on a language form that is common to all Finnish language users, the standard written language. The research material consists of 28 091 new compound words, which were extracted from print media during the years 2000–2009. The material is based on the Lexical Database of Contemporary Finnish compiled by The Institute for the Languages of Finland. This neologism database is continuously updated mainly for the purposes of lexicography and language planning. The study uses a series of sub-questions concerning the form, word class, number and length of the components of a compound. It proceeds from individual variables to models that examine mutual relations between the variables. The study employs a two-phase method. First, a statistical analysis is conducted of the type frequency of structures that have been perceived among neologisms. Second, a qualitative examination is made in particular of structures that have proved to be infrequent or otherwise atypical in the statistical analysis. The method was developed for this study, as previous methods for measuring productivity are not, as such, suitable for studying Finnish compound structures. Developing new study methods was a central objective of the study. The study shows that new compound words in the Finnish language are more homogenous in structure than might be assumed based on earlier language descriptions. A new compound in the Finnish language is typically formed by combining two nouns, the first of which is in the nominative case and does not agree with the second noun. Compounds with a prefix- like first component also occur considerably more frequently than hypothesised. In turn, compounds in which the first component is in the genitive case occur more infrequently than hypothesised. Some of the grammatically possible compound structures proved to be entirely unproductive in practice.







Annales Universitatis Turkuensis C 408


Väitöskirja (monografia)