778 resultados para Sentences arbitrales
Resumo:
This dissertation considers the segmental durations of speech from the viewpoint of speech technology, especially speech synthesis. The idea is that better models of segmental durations lead to higher naturalness and better intelligibility. These features are the key factors for better usability and generality of synthesized speech technology. Even though the studies are based on a Finnish corpus the approaches apply to all other languages as well. This is possibly due to the fact that most of the studies included in this dissertation are about universal effects taking place on utterance boundaries. Also the methods invented and used here are suitable for any other study of another language. This study is based on two corpora of news reading speech and sentences read aloud. The other corpus is read aloud by a 39-year-old male, whilst the other consists of several speakers in various situations. The use of two corpora is twofold: it involves a comparison of the corpora and a broader view on the matters of interest. The dissertation begins with an overview to the phonemes and the quantity system in the Finnish language. Especially, we are covering the intrinsic durations of phonemes and phoneme categories, as well as the difference of duration between short and long phonemes. The phoneme categories are presented to facilitate the problem of variability of speech segments. In this dissertation we cover the boundary-adjacent effects on segmental durations. In initial positions of utterances we find that there seems to be initial shortening in Finnish, but the result depends on the level of detail and on the individual phoneme. On the phoneme level we find that the shortening or lengthening only affects the very first ones at the beginning of an utterance. However, on average, the effect seems to shorten the whole first word on the word level. We establish the effect of final lengthening in Finnish. The effect in Finnish has been an open question for a long time, whilst Finnish has been the last missing piece for it to be a universal phenomenon. Final lengthening is studied from various angles and it is also shown that it is not a mere effect of prominence or an effect of speech corpus with high inter- and intra-speaker variation. The effect of final lengthening seems to extend from the final to the penultimate word. On a phoneme level it reaches a much wider area than the initial effect. We also present a normalization method suitable for corpus studies on segmental durations. The method uses an utterance-level normalization approach to capture the pattern of segmental durations within each utterance. This prevents the impact of various problematic variations within the corpora. The normalization is used in a study on final lengthening to show that the results on the effect are not caused by variation in the material. The dissertation shows an implementation and prowess of speech synthesis on a mobile platform. We find that the rule-based method of speech synthesis is a real-time software solution, but the signal generation process slows down the system beyond real time. Future aspects of speech synthesis on limited platforms are discussed. The dissertation considers ethical issues on the development of speech technology. The main focus is on the development of speech synthesis with high naturalness, but the problems and solutions are applicable to any other speech technology approaches.
Resumo:
Any inconsistent theory whose underlying logic is classical encompasses all the sentences of its own language. As it denies everything it asserts, it is useless for explaining or predicting anything. Nevertheless, paraconsistent logic has shown that it is possible to live with contradictions and still avoid the collapse of the theory. The main point of this paper is to show that even if it is formally possible to isolate the contradictions and to live with them, this cohabitation is neither desired by working scientists not desirable for the progress of science. Several cases from the recent history of physics and cosmology are analyzed.
Resumo:
The flow of information within modern information society has increased rapidly over the last decade. The major part of this information flow relies on the individual’s abilities to handle text or speech input. For the majority of us it presents no problems, but there are some individuals who would benefit from other means of conveying information, e.g. signed information flow. During the last decades the new results from various disciplines have all suggested towards the common background and processing for sign and speech and this was one of the key issues that I wanted to investigate further in this thesis. The basis of this thesis is firmly within speech research and that is why I wanted to design analogous test batteries for widely used speech perception tests for signers – to find out whether the results for signers would be the same as in speakers’ perception tests. One of the key findings within biology – and more precisely its effects on speech and communication research – is the mirror neuron system. That finding has enabled us to form new theories about evolution of communication, and it all seems to converge on the hypothesis that all communication has a common core within humans. In this thesis speech and sign are discussed as equal and analogical counterparts of communication and all research methods used in speech are modified for sign. Both speech and sign are thus investigated using similar test batteries. Furthermore, both production and perception of speech and sign are studied separately. An additional framework for studying production is given by gesture research using cry sounds. Results of cry sound research are then compared to results from children acquiring sign language. These results show that individuality manifests itself from very early on in human development. Articulation in adults, both in speech and sign, is studied from two perspectives: normal production and re-learning production when the apparatus has been changed. Normal production is studied both in speech and sign and the effects of changed articulation are studied with regards to speech. Both these studies are done by using carrier sentences. Furthermore, sign production is studied giving the informants possibility for spontaneous speech. The production data from the signing informants is also used as the basis for input in the sign synthesis stimuli used in sign perception test battery. Speech and sign perception were studied using the informants’ answers to questions using forced choice in identification and discrimination tasks. These answers were then compared across language modalities. Three different informant groups participated in the sign perception tests: native signers, sign language interpreters and Finnish adults with no knowledge of any signed language. This gave a chance to investigate which of the characteristics found in the results were due to the language per se and which were due to the changes in modality itself. As the analogous test batteries yielded similar results over different informant groups, some common threads of results could be observed. Starting from very early on in acquiring speech and sign the results were highly individual. However, the results were the same within one individual when the same test was repeated. This individuality of results represented along same patterns across different language modalities and - in some occasions - across language groups. As both modalities yield similar answers to analogous study questions, this has lead us to providing methods for basic input for sign language applications, i.e. signing avatars. This has also given us answers to questions on precision of the animation and intelligibility for the users – what are the parameters that govern intelligibility of synthesised speech or sign and how precise must the animation or synthetic speech be in order for it to be intelligible. The results also give additional support to the well-known fact that intelligibility in fact is not the same as naturalness. In some cases, as shown within the sign perception test battery design, naturalness decreases intelligibility. This also has to be taken into consideration when designing applications. All in all, results from each of the test batteries, be they for signers or speakers, yield strikingly similar patterns, which would indicate yet further support for the common core for all human communication. Thus, we can modify and deepen the phonetic framework models for human communication based on the knowledge obtained from the results of the test batteries within this thesis.
Resumo:
Tutkimus oli kasvatustieteellinen varhaiskasvatuksen alan tutkimus, jossa hyödynnettiin kielitieteellistä käsitteistöä. Tutkimuksen kohteena olivat esiopetuskirjojen kielellisen tietoisuuden harjoitukset. Aineistona oli 12 esiopetuksen harjoituskirjaa ja opettajan opasta. Kirjoissa oli yhteensä yli 2000 sivua ja yli 1300 harjoitusta. Tarkemmassa analyysissä olleiden harjoitusten määrä oli noin 460. Analyysimenetelmänä käytettiin sisällönanalyysiä, jonka avulla tutkittiin, millaisia kielellisen tietoisuuden harjoituksia esiopetuskirjoissa oli ja miten harjoitukset etenivät. Kielellisen tietoisuuden harjoitukset luokiteltiin fonologisen, morfologisen ja syntaktisen tietoisuuden harjoituksiin. Fonologinen tietoisuus käsitettiin lapsen kyvyksi havaita ja käsitellä kielen äännerakennetta. Morfologisella tietoisuudella tarkoitettiin kykyä havaita ja käsitellä kielen morfeemeja eli pienimpiä merkityksellisiä osia. Syntaktisella tietoisuudella tarkoitettiin lapsen tietoisuutta siitä, miten lauseet rakentuvat. Olennaisiksi piirteiksi fonologisen tietoisuuden harjoituksissa identifioituivat harjoitusten edellyttämä tai harjoittama tietoisuuden taso, harjoitusten kohteena olevien lingvististen yksiköiden taso ja harjoitustyyppi sekä morfologisen ja syntaktisen tietoisuuden harjoituksissa tietoisuuden taso ja harjoitustyyppi. Tutkimuksessa luotiin aikaisempien tutkimusten pohjalta mallit siitä, miten eri harjoitukset etenisivät optimaalisesti lapsen kielellisen tietoisuuden kehittymisen kannalta. Eri harjoituskirjojen harjoitusten etenemistä verrattiin näihin malleihin. Fonologisen tietoisuuden harjoituksista voitiin tunnistaa viisi päätyyppiä, joista useat jakautuivat vielä alatyypeiksi. Harjoitusten alatyypit ilmaisivat yleensä harjoituksissa käytettävän kognitiivisen operaation – käytettiinkö harjoituksessa tunnistamista, yhdistämistä vai osiin jakamista. Tämä samoin kuin harjoituksessa käytetty lingvistinen yksikkö (sana, loppusointu, tavu tai äänne) ja tietoisuuden taso olivat yhteydessä harjoituksen vaikeuteen. Tutkimuksissa ja interventioissa esiopetusikäisilläkin käytettyjä muunteluharjoituksia, joissa sanasta tai tavusta poistetaan osa, siihen lisätään osa tai osaa siirretään, harjoituskirjoissa ei ollut. Morfologisen tietoisuuden harjoitukset kohdistuivat yhdyssanoihin, taivutuspäätteisiin tai johdoksiin. Syntaktisen tietoisuuden harjoituksista identifioitui yhdentoista harjoituslajin alatyypin kautta kuusi päätyyppiä. Tutkimusta voidaan hyödyntää esiopetuskirjojen arvioinnissa ja laatimisessa sekä varhaiskasvatus- ja esiopetuspedagogiikassa.
Resumo:
Tausta Suomessa lainsäätäjä reagoi helposti yhteiskunnalliseen häiriötekijään rikosoikeuden keinoin. Tästä on osoituksena se, että syksyllä 2010 varsinaisen rikoslain lisäksi rikoksesta oli säädetty 256 eri laissa. Suomalainen, lähtökohdiltaan maltillinen kontrolli- ja kriminaalipolitiikka on 1970-luvulla linjatun vastaisesti johtanut 2000-luvulle tultaessa rikosoikeudellisen kontrollin lisääntymiseen ja jopa kiristymiseen. Raja rikosten ja rikkomusten välillä on liudentunut ja paikoitellen kadonnut ja erityisesti turvallisuudesta on kehittynyt – käsitteeseen liittyvistä oikeudellisista jännitteistä huolimatta – keskeinen rikosoikeudellisen sääntelyn oikeutusperuste. Rikosoikeuden käyttäminen vähäisten rikosten kontrollointiin on aiheuttanut Suomeen viivästymisen ongelman. Yleisessä tiedossa on se, että Euroopan ihmisoikeustuomioistuin on antanut 2000-luvulla Suomelle kymmeniä tuomioita siksi, että rikosjuttuja on käsitelty viranomaisissa ja tuomioistuimissa liian kauan. Vähemmän on sen sijaan keskusteltu siitä, että myös vähäiset rikokset viivästyvät rikosoikeuden alan laajetessa ja viranomaisten voimavarojen ehtyessä. Suomessa ongelmaa on pyritty hoitamaan rikosoikeudellista toimivaltaa hallintoviranomaisille delegoimalla tilanteen ollessa nyt se, että uuden sakkomenettelylain voimaan tullessa noin 90 % rikosoikeudellisesta kompetenssista on poliisilla ja muilla hallintoviranomaisilla. Se taasen on ongelmallista perustuslain 3 §:ssä säädetyn vallanjakoperiaatteen kannalta. Välttämätöntä on korostaa myös sitä, että pääosin rikosoikeudelliseen kontrolliin perustuva systeemi aiheuttaa rikosoikeuden inflaatiota: rikosoikeuden arvostuksen vähenemisestä aiheutuvia ei-mittavissa olevia kuluja. Rikosoikeuden laajenemista vastaan esitetään kuitenkin harvoin kritiikkiä. Rikosoikeustieteen piirissäkään sille ei ole esitetty vakavasti otettavaa vaihtoehtoa. Esimerkiksi hallinnollisia sanktioita ei ole Suomessa – ei tosin muissa Pohjoismaissakaan – koettu rikosoikeuden vaihtoehtona, vaan usein rikosoikeutta täydentävänä järjestelmänä. Hallinnollisten sanktioiden käyttäminen rikosoikeuden ohessa ei ole ollut yksiselitteistä ja jäsenneltyä, yleisiin oppeihin perustuvaa. Kontrollin erityisille alueille, esimerkiksi sotilaskontrolliin, on lisäksi kehittynyt rikos- ja hallinto-oikeuden sekajärjestelmiä. Tutkimuskysymykset Käsillä olevassa artikkelimuotoisessa väitöskirjatutkimuksessa pyritään hahmottelemaan rikos- ja hallinto-oikeudellisten rangaistusjärjestelmien välisiä eroavaisuuksia Suomessa. Tutkimuksen keskeisin tehtävä on sen pohtiminen, millä tavalla 2010-luvulle tultaessa olisi tutkimuksen empiiriset ja teoreettiset lähtökohdat huomioon ottaen järkevää ja tarkoituksenmukaista rangaista. Tällä perusteella kehitetään yksikertaista hallintosanktiointiteoreettista mallia, että sitä hyväksikäyttäen lainvalmisteluprosessin sanktiointitilanteessa, sanktiosta päätettäessä, olisi mahdollista asettaa oikeusturvan vähimmäistakeet täyttävällä tavalla oikeus- ja muilta vaikutuksiltaan rationaalinen seuraamus sekä säätää sen määräämiseksi yhteiskunnallisilta vaikutuksiltaan tehokas ja riittävän oikeusturvallinen menettely. Tutkimustehtävä on tiivistetysti 1) hallinnollisten sanktioiden ja rikosoikeudellisten rangaistusten ja niiden alan määrittäminen, 2) hallinnollisten sanktioiden sääntelymallien valintaperusteluiden selvittäminen, 3) hallintosanktioteoreettisen mallin kehittäminen lainvalmisteluprosessia varten sekä 4) de lege ferenda -suositusten tekeminen rangaistavuuden hyväksyttävyyden ja joutuisuuden parantamiseksi. Menetelmä ja aineistot Tutkimus kytkeytyy teoreettisen rikosoikeustieteen, hallinto-oikeustieteen ja prosessioikeustieteen alalle ja se on luonteeltaan ongelmakeskeinen. Tieteenalojen väliset painotukset ja niiden vaikutus vaihtelevat tutkimuksessa. Vaikka tutkimus on monella tavalla luonteeltaan teoreettinen, siinä rakennetaan nimenomaan lainsäädäntötyötä ja lainvalmistelua tukevaa tutkimusta ja teoriaa. Tältä osin näkökulma liittyy kriminalisointiteoreettisessa tutkimuksessa hahmotettuun lainsäätäjän oikeuslähdeoppia koskevaan uuteen näkökulmaan, jolla on yhteyksiä lainsäädäntötutkimukseen ja oikeusteoriassa hahmotettuun legisprudence-tutkimusuuntaukseen, näkökulman suuntautuessa lainsäädäntötasolle. Tutkimuksen lähteistä suurin osa on oikeustieteellistä kirjallisuutta, jonka pääosa muotoutuu suomalaisesta oikeustieteellisestä kirjallisuudesta. Myös pohjoismaalaista, saksalaista ja hieman myös anglosaksista kirjallisuutta on käytetty. Kansainvälisten kirjallisuuslähteiden merkitys ei ole ollut merkittävä, koska kattava eurooppalainen näkemys aihepiiristä on pyritty saamaan Euroopan ihmisoikeustuomioistuimen ratkaisukäytäntöä hyödyntäen. Tutkimuksen lähteinä on käytetty laajasti myös kansallista lainvalmisteluaineistoa, erityisesti hallituksen esityksiä ja perustuslakivaliokunnan lausuntokäytäntöä. Johtopäätökset Kriminaali- ja/tai kontrollipolitiikassa on juuri nyt tärkeää pohtia, millä tavalla 2010-luvulle tultaessa on järkevää ja tarkoituksenmukaista rangaista. Tähän voisi olla mahdollista vastata tutkimuksessa kehitettävällä hallintosanktiointiteoreettisella mallilla. Mallin kehittäminen on edellyttänyt yhteiskunnallisten sanktiokäytäntöjen oikeusvaltioopillista tarkastelua, jolloin sanktioiden yhteiskunnalliseen merkitykseen pureutuminen kuvailee myös sitä, millainen modernin oikeusvaltion tila tällä hetkellä on. Perinteisten oikeusvaltioiden paradigmojen käyttäminen ei välttämättä edistä relevantin oikeusvaltiollisen sanktiointiteoreettisen mallin kehittämistä. Voi olla niinkin, että klassinen oikeusvaltio-oppi ja oletetunlaiset rikosoikeuden erityiset elementit eivät enää vastaa yhteiskuntatodellisuutta. Näin rankaisemisen yleiset opit voivat nousta kehittämisen kohteeksi oikeusvaltiollisuuden elementtien toteuttamiseksi valtavasta kasvaneessa hallintoyhteiskunnassa – hallinto-johtoisessa yhteiskunnallisessa todellisuudessa. Suomen rikoslaki sisältää laajassa merkityksessä sadoittain erilaatuisia kriminalisointeja, joiden merkitys on usein hallinnon toimintaa subventoiva, symbolinen tai jonkin toisen kriminalisoinnin vaikutusta tehostamaan pyrkivä. Tällainen rikoslaki on tehtävänsä, vaikuttavuutensa ja hyväksyttävyytensä kannalta ongelmallinen. Suomalainen hallinnollisten sanktioiden järjestelmä ei sekään ole järkevä ja tarkoituksenmukainen, yleisiin oppeihin perustuva systeemi. Myös yleiseurooppalainen kehitys näyttäisi viittaavan siihen, että Suomessa on tarve kehittää sekä rikosoikeutta että sille vaihtoehtoista hallintosanktioiden järjestelmää, sanktio-oikeutta. Tämä edellyttää lainsäädäntöuudistuksia.
Resumo:
The present study focuses on the zero person constructions both in Finnish and Estonian. In the zero person construction, there is no overt subject and the verb is in the 3rd person singular form: Fin. Tammikuussa voi hiihtää Etelä-Suomessakin. Est. Jaanuaris saab suusatada ka Lõuna-Soomes ‘In January one can ski even in South-Finland’. The meaning of the zero construction is usually considered generic and open. However, the zero may be interpreted as indexically open so that the reference can be construed from the context. This study demonstrates how the zero may be interpreted as referring to the speaker, the addressee, or anybody. The zero person construction in Finnish has been contrasted to the generic pronoun constructions in Indo-European languages. For example, the zero person is translated in English as you or one; in Swedish and German as man. The grammar and semantics of the Finnish zero person construction have been studied earlier to some extent. However, the differences and similarities between Finnish and Estonian, two closely related languages, have not been thoroughly studied before. The present doctoral thesis sheds light on the zero person construction, its use, functions, and interpretation both in Finnish and Estonian. The approach taken is contrastive. The data comes from magazine articles published in Finnish and translated into Estonian. The data consists of Finnish sentences with the zero person and their Estonian translations. In addition, the data includes literary fiction, and non-translated Estonian corpora texts as well. Estonian and Finnish are closely related and in principle the personal system of the two languages is almost identical, nevertheless, there are interesting differences. The present study shows that the zero person construction is not as common in Estonian as it is in Finnish. In my data, a typical sentence with the zero person in both languages is a generic statement which tells us what can or cannot be done. When making generic statements the two languages are relatively similar, especially when the zero person is used together with a modal verb. The modal verbs (eg. Fin. voida ‘can’, saada ‘may’, täytyä ‘must’; Est. võima ‘may’, saama ‘can’, tulema ’must’) are the most common verbs in both Finnish and Estonian zero person constructions. Significant differences appear when a non-modal verb is used. Overall, non-modal verbs are used less frequently in both languages. Verbs with relatively low agentivity or intentionality, such as perception verb nähdä in Finnish and nägema in Estonian, are used in the zero person clauses in both languages to certain extent. Verbs with more agentive and intentional properties are not used in the Estonian zero person clauses; in Finnish their use is restricted to specific context. The if–then-frame provides a suitable context for the zero person in Finnish, and the Finnish zero person may occur together with any kind of verb in conditional if-clause. Estonian if-clauses are not suitable contexts for zero person. There is usually a da-infinitive, a generic 2nd person singular or a passive form instead of the zero person in Estonian counterparts for Finnish if-clauses with zero person. The aim of this study was to analyze motivations for choosing the zero person in certain contexts. In Estonian, the use of the zero person constructions is more limited than in Finnish, and some of the constraints are grammatical. On the other hand, some of the constraints are motivated by the differences in actual language use. Contrasting the two languages reveals interesting differences and similarities between these two languages and shows how these languages may use similar means differently.
Resumo:
Brazilian researchers and health professionals often face the challenge of having to use tests developed in foreign languages and standardized for populations of other countries, especially in the fields of Neuropsychology and Neurolinguistics. This fact promotes a feeling that some scoring systems may be inadequate for our sociocultural reality. In the present study, we describe the performance of a Brazilian population sample submitted to a translated and adapted version of the Boston Diagnostic Aphasia Examination (BDAE). Sixty normal volunteers (21 men and 39 women), all Portuguese native speakers, ranging in age from 15 to 78 years (average 43.7) and with an educational level of 2 to 16 years (average 9.9), were tested using a translated and adapted Portuguese version of the BDAE. Cut-off scores are suggested for our population and the performance of the Brazilian sample is compared to that of American and Colombian samples, with the results being closely similar in all tasks. We also performed a correlation analysis between age, gender and educational level and the influence of these variables on the performance of the subjects. We found no statistically significant differences between genders. Educational level correlated positively with performance, especially in the subtests involving reading and writing. There was a negative correlation between age and performance in two subtests (Visual Confrontation Naming and Sentences to Dictation), but a coexisting effect of educational level could not be ruled out.
Resumo:
In Neurolinguistics, the use of diagnostic tests developed in other countries can create difficulties in the interpretation of results due to cultural, demographic and linguistic differences. In a country such as Brazil, with great social contrasts, schooling exerts a powerful influence on the abilities of normal individuals. The objective of the present study was to identify the influence of schooling on the performance of normal Brazilian individuals in the Boston Diagnostic Aphasia Examination (BDAE), in order to obtain reference values for the Brazilian population. We studied 107 normal subjects ranging in age from 15 to 84 years (mean ± SD = 47.2 ± 17.6 years), with educational level ranging from 1 to 24 years (9.9 ± 4.8 years). Subjects were compared for scores obtained in the 28 subtests of the BDAE after being divided into groups according to age (15 to 30, N = 24, 31 to 50, N = 33 and 51 years or more, N = 50) and education (1 to 4, N = 26, 5 to 8, N = 17 and 9 years or more, N = 61). Subjects with 4 years or less of education performed poorer in Word Discrimination, Visual Confrontation Naming, Reading of Sentences and Paragraphs, and Primer-Level Dictation (P < 0.05). When breakdown by schooling was 8 years or less, subjects performed poorer in all subtests (P < 0.05), except Responsive Naming, Word Recognition and Word-Picture Matching. The elderly performed poorer (P < 0.05) in Complex Ideational Material, Visual Confrontation Naming, Comprehension of Oral Spelling, Written Confrontation Naming, and Sentences to Dictation. We present the reference values for the cut-off scores according to educational level.
Resumo:
An interesting fact about language cognition is that stimulation involving incongruence in the merge operation between verb and complement has often been related to a negative event-related potential (ERP) of augmented amplitude and latency of ca. 400 ms - the N400. Using an automatic ERP latency and amplitude estimator to facilitate the recognition of waves with a low signal-to-noise ratio, the objective of the present study was to study the N400 statistically in 24 volunteers. Stimulation consisted of 80 experimental sentences (40 congruous and 40 incongruous), generated in Brazilian Portuguese, involving two distinct local verb-argument combinations (nominal object and pronominal object series). For each volunteer, the EEG was simultaneously acquired at 20 derivations, topographically localized according to the 10-20 International System. A computerized routine for automatic N400-peak marking (based on the ascendant zero-cross of the first waveform derivative) was applied to the estimated individual ERP waveform for congruous and incongruous sentences in both series for all ERP topographic derivations. Peak-to-peak N400 amplitude was significantly augmented (P < 0.05; one-sided Wilcoxon signed-rank test) due to incongruence in derivations F3, T3, C3, Cz, T5, P3, Pz, and P4 for nominal object series and in P3, Pz and P4 for pronominal object series. The results also indicated high inter-individual variability in ERP waveforms, suggesting that the usual procedure of grand averaging might not be considered a generally adequate approach. Hence, signal processing statistical techniques should be applied in neurolinguistic ERP studies allowing waveform analysis with low signal-to-noise ratio.
Resumo:
The topic of the present doctoral dissertation is the analysis of the phonological and tonal structures of a previously largely undescribed language, namely Samue. It is a Gur language belonging to the Niger-Congo language phulym, which is spoken in Burkina Faso. The data were collected during the fieldwork period in a Sama village; the data include 1800 lexical items, thousands of elicited sentences and 30 oral texts. The data were first transcribed phonetically and then the phonological and tonal analyses were conducted. The results show that the phonological system of Samue with the phoneme inventory and phonological processes has the same characteristics as other related Gur languages, although some particularities were found, such as the voicing and lenition of stop consonants in medial positions. Tonal analysis revealed three level tones, which have both lexical and grammatical functions. A particularity of the tonal system is the regressive Mid tone spreading in the verb phrase. The theoretical framework used in the study is Optimality theory. Optimality theory is rarely used in the analysis of an entire language system, and thus an objective was to see whether the theory was applicable to this type of work. Within the tonal analysis especially, some language specific constraints had to be created, although the basic Optimality Theory principle is the universal nature of the constraints. These constraints define the well-formedness of the language structures and they are differently ranked in different languages. This study gives new insights about typological phenomena in Gur languages. It is also a fundamental starting point for the Samue language in relation to the establishment of an orthography. From the theoretical point of view, the study proves that Optimality theory is largely applicable in the analysis of an entire sound system.
Resumo:
The subject of the thesis is automatic sentence compression with machine learning, so that the compressed sentences remain both grammatical and retain their essential meaning. There are multiple possible uses for the compression of natural language sentences. In this thesis the focus is generation of television program subtitles, which often are compressed version of the original script of the program. The main part of the thesis consists of machine learning experiments for automatic sentence compression using different approaches to the problem. The machine learning methods used for this work are linear-chain conditional random fields and support vector machines. Also we take a look which automatic text analysis methods provide useful features for the task. The data used for machine learning is supplied by Lingsoft Inc. and consists of subtitles in both compressed an uncompressed form. The models are compared to a baseline system and comparisons are made both automatically and also using human evaluation, because of the potentially subjective nature of the output. The best result is achieved using a CRF - sequence classification using a rich feature set. All text analysis methods help classification and most useful method is morphological analysis. Tutkielman aihe on suomenkielisten lauseiden automaattinen tiivistäminen koneellisesti, niin että lyhennetyt lauseet säilyttävät olennaisen informaationsa ja pysyvät kieliopillisina. Luonnollisen kielen lauseiden tiivistämiselle on monta käyttötarkoitusta, mutta tässä tutkielmassa aihetta lähestytään television ohjelmien tekstittämisen kautta, johon käytännössä kuuluu alkuperäisen tekstin lyhentäminen televisioruudulle paremmin sopivaksi. Tutkielmassa kokeillaan erilaisia koneoppimismenetelmiä tekstin automaatiseen lyhentämiseen ja tarkastellaan miten hyvin erilaiset luonnollisen kielen analyysimenetelmät tuottavat informaatiota, joka auttaa näitä menetelmiä lyhentämään lauseita. Lisäksi tarkastellaan minkälainen lähestymistapa tuottaa parhaan lopputuloksen. Käytetyt koneoppimismenetelmät ovat tukivektorikone ja lineaarisen sekvenssin mallinen CRF. Koneoppimisen tukena käytetään tekstityksiä niiden eri käsittelyvaiheissa, jotka on saatu Lingsoft OY:ltä. Luotuja malleja vertaillaan Lopulta mallien lopputuloksia evaluoidaan automaattisesti ja koska teksti lopputuksena on jossain määrin subjektiivinen myös ihmisarviointiin perustuen. Vertailukohtana toimii kirjallisuudesta poimittu menetelmä. Tutkielman tuloksena paras lopputulos saadaan aikaan käyttäen CRF sekvenssi-luokittelijaa laajalla piirrejoukolla. Kaikki kokeillut teksin analyysimenetelmät auttavat luokittelussa, joista tärkeimmän panoksen antaa morfologinen analyysi.
Resumo:
Suomen sisällissotaan osallistui vuonna 1918 naisia molemmin puolin rintamaa erilaisissa tehtävissä. Taisteluiden jälkeen yli 5500 punaista naista joutui valtiorikosoikeuteen syytettynä valtiopetoksellisesta toiminnasta. Ne noin 2000 naista, jotka palvelivat punakaartissa aseistettuina, ovat pitkään hallinneet sitä kuvaa, joka suomalaisilla on ollut punaisista naisista. Sen sijaan on tiedetty hyvin vähän niistä naisista, joiden valkoiset katsoivat edistäneen valtiopetosta muilla keinoilla. Tässä tutkimuksessa tarkastellaan, millaisia olivat Porin seudulla ne kapinasta syytetyt naiset, jotka eivät olleet tarttuneet aseisiin ja mikä oli heidän myöhempi kohtalonsa. Työn ensimmäisessä osassa tutkitaan valtiorikosoikeuteen joutuneiden naisten taustaa, toimintaa sota-aikana ja tästä aiheutuneita välittömiä seuraamuksia. Millaisia henkilöitä päätyi valtiorikosoikeuden eteen tuomittavaksi? Millaisissa tehtävissä he olivat sota-aikana toimineet ja miksi? Mitkä seikat olivat oikeudessa raskauttavia, kun valtiorikostuomioita jaettiin? Työn jälkimmäisessä osassa tutkitaan, mitä punaisille naisille tapahtui sodan jälkeen ja miksi näin kävi. Sisällissodan jälkeistä maailmaa hahmotetaan etsimällä vastauksia seuraaviin kysymyksiin: Millainen oli se yhteiskunnassa vallinnut ajan henki, jonka vaikutuspiiriin naiset valtiorikosoikeudesta ja vankilasta palasivat? Miten yhteisö otti heidät vastaan? Miten heihin suhtauduttiin työmarkkinoilla? Miten käsiteltiin punaisia leskiä ja orpoja? Mitä punaisilta odotettiin kansalaisina ja miten heistä pyrittiin muokkaamaan yhteiskuntakelpoisia? Miten poliittisen elämän uudelleenvirittely onnistui ja kiinnostiko se enää näitä naisia? Miten suomalaisen yhteiskunnan muuttuessa myös sen suhtautuminen punaisiin muuttui? Millaisilla toimilla valtiovalta pyrki eri vaiheissa yhtenäistämään rikkirevennyttä kansaa ja miten se näkyi yksittäisten ihmisten elämässä? Ajan kuluessa asenteet muuttuivat ja naiset vanhenivat. Miten naiset kuvasivat kokemaansa myöhemmin omaisilleen? Kysymyksiä pohditaan paikallisesta, Porin seudun näkökulmasta, mutta niitä peilataan kuitenkin jatkuvasti valtakunnalliseen tilanteeseen. Kontekstualisoi- malla paikalliskokemukset laajempaan kokonaisuuteen on voitu paremmin selittää tapahtunutta, ja paikallistutkimuksen kautta on nähty myös koko maassa vallinneita yleisiä olosuhteita. Tutkimuksen kohteena on 267 Porista, Porin maalaiskunnasta ja Ulvilasta kotoisin olevaa naista, jotka joutuivat valtiorikosoikeuden tutkittaviksi. Keskeisimpänä lähdeaineistona ovat seurakuntien rippikirjat ja maistraattien henkikirjat sekä Kansallisarkiston, Kansan arkiston ja Työväen arkistojen sisällissotaa ja sen jälkeistä poliittista elämää valottavat kokoelmat. Tutkimuksen naisista enemmistö oli 18−37-vuotiaita työläisnaisia. Aiemmin rikoksista tuomittuja heidän joukossaan oli hyvin vähän. Suurin osa (n. 71 %) työskenteli punakaartin huollossa keittiö-, siivous- ja vaatetusosastoilla. Noin 21 % työskenteli sairaanhoidossa, ja loput kahdeksan prosenttia olivat punakaartin hallintoa avustavissa muissa tehtävissä. Naiset saivat pääosin lieviä, 2−3 vuoden ehdollisia tuomioita. Vain joka kymmenes nainen tuomittiin ehdottomaan rangaistukseen. Punakaartiin vasta pakomatkalla liittyneet ja kaartissa vähäisissä tehtävissä lyhytaikaisesti toimineet henkilöt vapautettiin syytteistä. Tutkimuksessani olen osoittanut, millaisia vaikeuksia paluu sodanjälkeiseen arkeen tuotti naisille. Varsinkin yksin lastensa kanssa jääneillä oli monenlaisia ongelmia. Sodan aikana levitetty propaganda oli osaltaan lisäämässä vaikeuksia. Toisaalta työtilanne parantui monen naisen osalta jo vuoden 1918 aikana, ja oman punaisen yhteisön tarjoama tuki helpotti arjesta selviytymistä. Elämä tasaantui, naiset perustivat perheitä ja osa palasi työelämään ja politiikkaan. Säilyneiden lähteiden valossa sisällissota näyttäisi radikalisoineen vain pienen osan naisista, kun taas enemmistö kannatti maltillisia sosialidemokraatteja tai jäi kokonaan pois politiikasta. Punaiseksi leimautuminen valtiorikosoikeudessa ei pakottanut naisia muuttamaan uudelle paikkakunnalle; Porin seudulla ja yleensä vielä omassa suvussakin oli riittävästi entisiä punaisia luomassa kollektiivista tukea. Myös valtiovalta pyrki rauhoittamaan poliittista tilannetta ja sopeuttamaan punaisia yhteiskuntaan monin uudistuksin. Naisten kannalta merkittävin myönnytys tapahtui jatkosodan aikana, kun punalesket lopulta oikeutettiin valtiollisen eläkkeen piiriin. Tämä tutkimus on ensimmäinen punaisista naisista laadittu eräänlainen kollektiivinen elämäkerta, jossa on tarkasteltu heidän sodanjälkeistä elämäänsä. Yhteenvetona voidaan todeta, että Porin seudulta valtiorikosoikeuteen joutuneet naiset olivat tavallisia työläisnaisia. Sota ja osallisuus siihen ei tätä asiaa muuttanut. Naiset sopeutuivat yhteiskuntaan nopeasti ja elivät pääosin tavallista työläisperheen arkea sodan jälkeenkin.
Resumo:
Contient : Collection de sentences ; Libri Senece de IIII virtutibus, et de moribus