934 resultados para Italic languages and dialects.
Resumo:
We present two discriminative language modelling techniques for Lempel-Ziv-Welch (LZW) based LID system. The previous approach to LID using LZW algorithm was to directly use the LZW pattern tables forlanguage modelling. But, since the patterns in a language pattern table are shared by other language pattern tables, confusability prevailed in the LID task. For overcoming this, we present two pruning techniques (i) Language Specific (LS-LZW)-in which patterns common to more than one pattern table are removed. (ii) Length-Frequency product based (LF-LZW)-in which patterns having their length-frequency product below a threshold are removed. These approaches reduce the classification score (Compression Ratio [LZW-CR] or the weighted discriminant score [LZW-WDS]) for non native languages and increases the LID performance considerably. Also the memory and computational requirements of these techniques are much less compared to basic LZW techniques.
Resumo:
A production experiment investigated the tonal shape of Finnish finite verbs in transitive sentences without narrow focus. Traditional descriptions of Finnish stating that non- focused finite verbs do not receive accents were only partly supported. Verbs were found to have a consistently smaller pitch range than words in other word classes, but their pitch contours were neither flat nor explainable by pure interpolation.
Resumo:
Abstract: Research on translation universals has its roots in the need to make generalizations about the features that distinguish translations from non-translations. They go back to the old tradition of negative comments about the failings of typical translations. These comments concern the relations between translations and the target language, and between translations and their source texts. With the rise of descriptive studies, and the use of corpus research methods borrowed from linguistics, the search for the typical features of translations became more systematic. A number of hypotheses about potential universals have been proposed, and tested on different languages and language pairs. Some of them are evidently false; on others, the jury is still out. If some hypotheses continue to be supported by empirical evidence, the question then arises of how they might best be explained. There has been fierce criticism of some of the assumptions underlying the search for universals, including the use of the term 'universal'itself, but the approach has also brought clear methodological benefits.
Resumo:
Recent evidence from adult pronoun comprehension suggests that semantic factors such as verb transitivity affect referent salience and thereby anap- hora resolution. We tested whether the same semantic factors influence pronoun comprehension in young children. In a visual world study, 3-year- olds heard stories that began with a sentence containing either a high or a low transitivity verb. Looking behaviour to pictures depicting the subject and object of this sentence was recorded as children listened to a subsequent sentence containing a pronoun. Children showed a stronger preference to look to the subject as opposed to the object antecedent in the low transitivity condition. In addition there were general preferences (1) to look to the subject in both conditions and (2) to look more at both potential antecedents in the high transitivity condition. This suggests that children, like adults, are affected by semantic factors, specifically semantic prominence, when interpreting anaphoric pronouns.
Resumo:
In this study we explore the concurrent, combined use of three research methods, statistical corpus analysis and two psycholinguistic experiments (a forced-choice and an acceptability rating task), using verbal synonymy in Finnish as a case in point. In addition to supporting conclusions from earlier studies concerning the relationships between corpus-based and ex- perimental data (e. g., Featherston 2005), we show that each method adds to our understanding of the studied phenomenon, in a way which could not be achieved through any single method by itself. Most importantly, whereas relative rareness in a corpus is associated with dispreference in selection, such infrequency does not categorically always entail substantially lower acceptability. Furthermore, we show that forced-choice and acceptability rating tasks pertain to distinct linguistic processes, with category-wise in- commensurable scales of measurement, and should therefore be merged with caution, if at all.
Resumo:
Koskenniemen Äärellistilaisen leikkauskieliopin (FSIG) lauseopilliset rajoitteet ovat loogisesti vähemmän kompleksisia kuin mihin niissä käytetty formalismi vittaisi. Osoittautuukin että vaikka Voutilaisen (1994) englannin kielelle laatima FSIG-kuvaus käyttää useita säännöllisten lausekkeiden laajennuksia, kieliopin kuvaus kokonaisuutenaan palautuu äärelliseen yhdistelmään unionia, komplementtia ja peräkkäinasettelua. Tämä on oleellinen parannus ENGFSIG:n descriptiiviseen kompleksisuuteen. Tulos avaa ovia FSIG-kuvauksen loogisten ominaisuuksien syvemmälle analyysille ja FSIG kuvausten mahdolliselle optimoinnillle. Todistus sisältää uuden kaavan, joka kääntää Koskenniemien rajoiteoperaation ilman markkerimerkkejä.
Resumo:
The trees in the Penn Treebank have a standard representation that involves complete balanced bracketing. In this article, an alternative for this standard representation of the tree bank is proposed. The proposed representation for the trees is loss-less, but it reduces the total number of brackets by 28%. This is possible by omitting the redundant pairs of special brackets that encode initial and final embedding, using a technique proposed by Krauwer and des Tombe (1981). In terms of the paired brackets, the maximum nesting depth in sentences decreases by 78%. The 99.9% coverage is achieved with only five non-top levels of paired brackets. The observed shallowness of the reduced bracketing suggests that finite-state based methods for parsing and searching could be a feasible option for tree bank processing.
Resumo:
We have presented an overview of the FSIG approach and related FSIG gram- mars to issues of very low complexity and parsing strategy. We ended up with serious optimism according to which most FSIG grammars could be decom- posed in a reasonable way and then processed efficiently.
Resumo:
The trees in the Penn Treebank have a standard representation that involves complete balanced bracketing. In this article, an alternative for this standard representation of the tree bank is proposed. The proposed representation for the trees is loss-less, but it reduces the total number of brackets by 28%. This is possible by omitting the redundant pairs of special brackets that encode initial and final embedding, using a technique proposed by Krauwer and des Tombe (1981). In terms of the paired brackets, the maximum nesting depth in sentences decreases by 78%. The 99.9% coverage is achieved with only five non-top levels of paired brackets. The observed shallowness of the reduced bracketing suggests that finite-state based methods for parsing and searching could be a feasible option for tree bank processing.
Resumo:
Reklam sägs använda ett modernt, gärna ett nyskapande språk. Detta är ett påstående som inte så lätt kan verifieras. Tidningsannonsen är troligen den skriftspråksgenre som har fått minst uppmärksamhet av språkforskare. De som skriver texten i en tidningsannons är personer som representerar det samtida språkbruket. Annonser som representerar olika tidsepoker skiljer sig därför från varandra inte bara genom att annonsen förändras i fråga om stil och form. Annonsens språk avspeglar också den språkliga förändringsprocess som kontinuerligt pågår i varje språksamhälle. Annonser, och marknadsföringsmaterial över huvud taget, läses också av många människor som i övrigt läser mycket litet eller kanske inte alls. Marknadsföraren, reklamskribenten (copywriter) och AD:n producerar m.a.o. texter som på ett omedvetet sätt kommer att vara språkmodeller för sina läsare. Förändringar i språket kreeras inte och drivs inte på av språkforskare, utan av vanliga språkbrukare i interaktion med andra språkbrukare. Sett ur ett sociolingvistiskt perspektiv har det vitt spridda reklamspråket därför inflytande på språket i samhället. Syftet med det reklamspråksprojekt som presenteras i föreliggande rapport är att analysera hur och när förändringar i svenskan som uppträder i Sverige dyker upp i annonser som skrivs på svenska i Finland. Reklam på svenska Finland under 1900-talet står i fokus, och tidningsannonser för Stockmanns varuhus i Helsingfors utgör primärmaterialet. Tidningsannonser för varuhuset Nordiska Kompaniet (NK) i Stockholm under motsvarande tid tjänar som jämförelsematerial. I denna rapport presenteras projektets syfte, de uppställda forskningsfrågorna, och resonemanget illustreras med exempel ur projektmaterialet. Rapporten innehåller också en beskrivning av projektets reklamdatabas och basfakta om material och metoder. -
Resumo:
An der Schwedischen Wirtschaftsuniversität in Finnland wurde in einem mehrjährigen Projekt das gesamte deutsche Sprachcurriculum einer grundlegenden Revision unterzogen mit dem Ziel, unter Berücksichtigung der neuesten Forschungsergebnisse der angewandten Sprachwissenschaft ein zeitgemäßes und konsistentes Deutschcurriculum für Studierende der Wirtschaftswissenschaften zu schaffen. Durch das Projekt wurde für die deutsche Sprachausbildung ein deutliches Profil geschaffen, dessen Fokus auf fachkommunikativer Kompetenz und interkultureller Geschäftskommunikation liegt. Die von der Deutschabteilung entwickelten Lehr- und Lernmaterialien sind weitgehend auf der Basis eigener Forschungsergebnisse konzipiert und evaluiert worden und wurden gleichzeitig an den Gemeinsamen europäischen Referenzrahmens für Sprachen (CEFR) angepasst.
Resumo:
In dem vorliegenden Aufsatz wird eine vergleichende Untersuchung eines Deutschkurses (Tyska V: Interkulturelle Themen) an der Schwedischen Wirtschaftsuniversität Helsinki (Hanken) präsentiert, der im Jahr 2002 vollständig virtuell und im Jahr 2003 mit virtuellen Lernphasen und Kontaktunterricht im Wechsel realisiert wurde, wobei sich das virtuelle Kursmaterial jeweils in der Lernumgebung WebCT befand. In der Untersuchung werden die Leistungen, die Kursevaluationen und die Arbeitsstrategien der Studierenden in den beiden Kurskonzepten analysiert und miteinander verglichen. In Bezug auf die Leistungen der Studierenden hat sich gezeigt, dass die guten Studierenden in beiden Kurskonzepten gleich gute Ergebnisse erzielen. Die Untersuchung zeigt jedoch, dass der Kontaktunterricht des teils-virtuellen Kurskonzeptes gerade für die schwächeren Studierenden eine wichtige Funktion erfüllt – die schwächeren Studierenden erzielen im Kurskonzept mit Kontaktunterricht deutlich bessere Ergebnisse als die schwächeren Studierenden im ganz virtuellen Kurskonzept. Ein Vergleich der Arbeitsstrategien zeigt, dass die schwächeren Studierenden im Unterschied zu den guten Studierenden deutliche Schwierigkeiten mit dem Zeit- und Materialmanagement haben. Für die Weiterentwicklung des Kurskonzeptes sind zum einen die technischen Rahmenbedingungen zu verbessern, und zum anderen muss der Kontaktunterricht neu überdacht werden, da die Einführung des Themas Arbeitsstrategien in der virtuellen Lernumgebung als eigenständiger Themenbereich dringend notwendig erscheint.
Resumo:
Föreliggande arbete är resultatet av ett experiment med en materialinsamlingsmetod. Vad händer om man lägger ut en enkät med frågor om språk på webben och låter den som vill leverera svar? Vilka är det som svarar och vad har respondentgruppens sammansättning för betydelse för resultatet, dvs. kan man lita på det och i vilken utsträckning i så fall? Kan en kvantitativ vinst, då många svarar, täcka en eventuell kvalitativ förlust, då man inte har kontroll över vilka de många är? Man anar att svarsmönstret med nödvändighet måste vara brokigt och strävar att täcka in så mycket av det som möjligt och då är webbalternativet värt att pröva på. Tanken att ta reda på vad språkbrukarna själva har för syn på sitt språk, och vad de har för synpunkter bl.a. på språkvården, var egentligen inte ny, men den hade fått ny aktualitet i samband med arbetet med Svenska språknämndens handlingsprogram för svenskan i Finland (Tänk om ... 2003). Webbenkäten är uppgjord så att den matchar en liknande undersökning som genomfördes som en traditionell postenkät 30 år tidigare. Webbenkäten gav många svar och respondenterna representerade många olika språkmiljöer. Det fanns fler likheter än olikheter mellan svaren i webbenkäten 2002 och i enkätundersökningen 1972. En skillnad som dock märktes var att respondenterna i dag inte uppfattar svenskan i Finland som ålderdomlig, utan snarare karaktäriserar den som finskpåverkad. En påfallande likhet var känslan för det mest finlandssvenska, nämligen de specifikt finlandssvenska orden och uttrycken samt inslagen av finlandssvensk dialekt.