2 resultados para välimerkit


Relevância:

10.00% 10.00%

Publicador:

Resumo:

The trees in the Penn Treebank have a standard representation that involves complete balanced bracketing. In this article, an alternative for this standard representation of the tree bank is proposed. The proposed representation for the trees is loss-less, but it reduces the total number of brackets by 28%. This is possible by omitting the redundant pairs of special brackets that encode initial and final embedding, using a technique proposed by Krauwer and des Tombe (1981). In terms of the paired brackets, the maximum nesting depth in sentences decreases by 78%. The 99.9% coverage is achieved with only five non-top levels of paired brackets. The observed shallowness of the reduced bracketing suggests that finite-state based methods for parsing and searching could be a feasible option for tree bank processing.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Viimeaikaisten tutkimusten perusteella peruskoululaisten kirjoitustaidot ovat heikentyneet. Yhdeksäsluokkalaisten tyttöjen ja poikien kielentuntemuksen ja kirjoittamisen erot ovat huomattavan suuret Koulutuksen arviointikeskuksen vuonna 2014 teettämän arvioinnin perusteella. Parhaiten oppilaat hallitsevat yleiskielen normit. Tämän tutkimuksen lähtökohtana ovat olleet viimeisimmät peruskoululaisten arviointiraportit. Tässä tutkimuksessa selvitetään seitsemäs- ja kahdeksasluokkalaisten oikeinkirjoitusnormien ja kielen rakenteen normien hallintaa. Tarkastelussa ovat alkukirjaimet, puheen ja kirjoituksen erot, välimerkit, yhdyssanat, numeroilmaukset, omistusliite ja kongruenssi. Yleisen normin hallinnan lisäksi tutkimuksessa luodaan katsaus sukupuolten ja luokka-asteiden välisiin eroihin. Tuloksia verrataan aiempiin yhdeksäsluokkalaisten arviointiraportteihin. Aineisto koostuu 32 kirjoitelmasta, joita on analysoitu sisällönanalyysin periaatteiden mukaisesti. Oikeinkirjoitusnormeja on tarkasteltu eri kielenoppaiden ja oppilaiden oppikirjojen jaottelua mukaillen. Tutkimuksessa on kiinnitetty virheiden lisäksi erityistä huomiota normeihin, jotka hallitaan. Normien hallinnan tarkastelussa on otettu huomioon Ivaničin (2004) kirjoittamisen diskursseista muoto-, prosessi- ja genrediskurssit sekä Makkonen-Craigin (2011) kirjoittajan kompetensseista kieliopillinen kompetenssi. Kirjoittamisen diskurssit ja kieliopillinen kompetenssi liittyvät vahvasti kirjoittamisen opettamiseen ja arviointiin. Tulosten perusteella seitsemäs- ja kahdeksasluokkalaisten oikeinkirjoitustaidot ovat hyvät.. Välimerkeistä pilkut ovat aineiston oikeinkirjoitusnormeista selkeästi heikoiten hallittu ryhmä. Ison ja pienen alkukirjaimen käytössä sukupuolilla on suuri ero. Puhekielen muotoja molemmat sukupuolet käyttävät lähes yhtä paljon. Vaikka yleiskielten normien hallinta on pääosin hyvää, tämän tutkimuksen tulokset osoittavat, että erityisesti alistuskonjunktioiden ja relatiivipronomien pilkutus tulisi asettaa laajemman tarkastelun kohteeksi.