13 resultados para semantic textual similarity
em Doria (National Library of Finland DSpace Services) - National Library of Finland, Finland
Resumo:
Luokittelujärjestelmää suunniteltaessa tarkoituksena on rakentaa systeemi, joka pystyy ratkaisemaan mahdollisimman tarkasti tutkittavan ongelma-alueen. Hahmontunnistuksessa tunnistusjärjestelmän ydin on luokitin. Luokittelun sovellusaluekenttä on varsin laaja. Luokitinta tarvitaan mm. hahmontunnistusjärjestelmissä, joista kuvankäsittely toimii hyvänä esimerkkinä. Myös lääketieteen parissa tarkkaa luokittelua tarvitaan paljon. Esimerkiksi potilaan oireiden diagnosointiin tarvitaan luokitin, joka pystyy mittaustuloksista päättelemään mahdollisimman tarkasti, onko potilaalla kyseinen oire vai ei. Väitöskirjassa on tehty similaarisuusmittoihin perustuva luokitin ja sen toimintaa on tarkasteltu mm. lääketieteen paristatulevilla data-aineistoilla, joissa luokittelutehtävänä on tunnistaa potilaan oireen laatu. Väitöskirjassa esitetyn luokittimen etuna on sen yksinkertainen rakenne, josta johtuen se on helppo tehdä sekä ymmärtää. Toinen etu on luokittimentarkkuus. Luokitin saadaan luokittelemaan useita eri ongelmia hyvin tarkasti. Tämä on tärkeää varsinkin lääketieteen parissa, missä jo pieni tarkkuuden parannus luokittelutuloksessa on erittäin tärkeää. Väitöskirjassa ontutkittu useita eri mittoja, joilla voidaan mitata samankaltaisuutta. Mitoille löytyy myös useita parametreja, joille voidaan etsiä juuri kyseiseen luokitteluongelmaan sopivat arvot. Tämä parametrien optimointi ongelma-alueeseen sopivaksi voidaan suorittaa mm. evoluutionääri- algoritmeja käyttäen. Kyseisessä työssä tähän on käytetty geneettistä algoritmia ja differentiaali-evoluutioalgoritmia. Luokittimen etuna on sen joustavuus. Ongelma-alueelle on helppo vaihtaa similaarisuusmitta, jos kyseinen mitta ei ole sopiva tutkittavaan ongelma-alueeseen. Myös eri mittojen parametrien optimointi voi parantaa tuloksia huomattavasti. Kun käytetään eri esikäsittelymenetelmiä ennen luokittelua, tuloksia pystytään parantamaan.
Resumo:
Kulttuuriset ja tekstuaaliset tekijät alluusioiden kääntämisessä ja tulkinnassa. Alluusiot Dorothy L. Sayersin 1940- ja 1980-luvuilla suomennetuissa salapoliisiromaaneissa Väitöskirja käsittelee alluusioiden kääntämistä ja tulkintaa. Alluusio on intertekstuaalinen viittaus, jonka tulkitsemiseen tarvitaan implisiittistä tietoa tutuksi oletetusta viittauskohteesta. Käännösongelma alluusiosta tulee, mikäli kohdekulttuurin lukijat eivät tunne viittauskohdetta eivätkä voi päätellä alluusion merkitystä. Tutkimus pyrkii kuitenkin uuden analyysimenetelmän avulla osoittamaan, että vieraat alluusiot eivät välttämättä johda tulkintaongelmiin. Väitöskirja jakautuu kahteen osaan: analyysimenetelmän kehittämiseen (luvut 1-5) sekä tapaustutkimukseen (luvut 6-7). Kehitetyn menetelmän avulla pystytään analysoimaan aikaisempaa tarkemmin, millaisia tulkintamahdollisuuksia alluusiot tarjoavat eri lukijakunnille ja miten lähdetekstin alluusioiden kulttuuriset ja tekstuaaliset piirteet korreloivat käännösstrategioiden kanssa. Tapaustutkimus selvittää, millaisia tulkintamahdollisuuksia Dorothy L. Sayersin 1940- ja 1980-luvuilla suomennettujen salapoliisiromaanien alluusiot tarjosivat aikansa suomalaisille lukijoille. Tavoitteena on myös hahmottaa, miten suomentajien käännösratkaisut ja alluusioiden tulkintamahdollisuudet liittyvät toisaalta lähdetekstin alluusioiden piirteisiin ja toisaalta kohdekulttuurin kontekstiin. Tapaustutkimus tarjoaa näin uutta tietoa suomennoskirjallisuuden ja salapoliisiromaanien historiasta. Analyysimenetelmä määrittelee aikaisempaa alluusioita ja intertekstuaalisuutta käsitelleen tutkimuksen pohjalta ne kulttuuriset ja tekstuaaliset piirteet, jotka vaikuttavat alluusioiden kääntämiseen ja tulkintaan. Kulttuurisessa mielessä alluusio voi olla tietylle lukijakunnalle tuttu tai tuntematon. Tekstuaalisia tekijöitä ovat alluusion muodon ja tyylin tunnusmerkillisyys sekä alluusion pintamerkityksen koherenttius uudessa tekstikontekstissa, ilman tietoa viittauskohteesta. Alluusioiden tulkinnassa on perinteisesti erotettu toisaalta allusiivinen tulkintamahdollisuus, jossa alluusio on lukijoille tuttu ja yhdistettävissä viittauskohteeseensa, toisaalta kulttuuritöyssy, jonka muodostaa lukijoille tuntematon ja pintamerkitykseltään inkoherentti alluusio. Tutkimuksessa määritellään kulttuuristen ja tekstuaalisten tekijöiden perusteella lisäksi kaksi muuta mahdollisuutta. Pseudo-allusiivisessa tulkinnassa tuntematon alluusio erottuu ympäröivästä tekstikontekstista tyyliltään ja on koherentti ainakin kuvaannollisessa mielessä ilman viittauskohdettaan. Ei-allusiivisessa tulkinnassa taas vieras alluusio sulautuu kontekstiin sekä muodoltaan että merkitykseltään niin, ettei lukija edes huomaa mahdollista alluusiota. Tulkintamahdollisuuksien jakauma antaa yleiskuvan siitä, miten tietty lukijakunta pystyi tulkitsemaan tekstin alluusioita. Lisäksi analyysi tarkastelee lähdetekstin ja käännöksen välillä tulkintamahdollisuuksissa tapahtuneita muutoksia sekä niiden vaikutusta tulkinnan vaatimaan vaivannäköön (effort) ja alluusion funktioihin. Tapaustutkimus perehtyy Sayers-suomennosten kulttuurikonteksteihin tarkastelemalla salapoliisiromaanien asemaa suomalaisessa kirjallisuusjärjestelmässä, suomennoksilta odotettuja piirteitä sekä suomentajien ammattikuvaa, taustoja ja työoloja. Tulosten perusteella alluusioiden kääntäminen oli vaativa tehtävä sekä 1940- että 1980-luvun suomentajille. Lähdetekstien alluusioista 60–70 prosenttia oli todennäköisesti kohdelukijoille vieraita. Molempina aikakausina suomennoksilta odotettiin silti sekä kielellistä sujuvuutta että lähdetekstin merkitysten välittämistä. 1940-luvun suomentajien tehtävää vaikeutti lisäksi mm. se, että suomentaminen oli enimmäkseen sivutoimista ja englanti oli harvoin parhaiten hallittu vieras kieli. Nämä olosuhteet lienevät vaikuttaneet etenkin vähäarvoisena pidetyn salapoliisikirjallisuuden suomennoksiin. 1980-luvulla suomentajien aikataulut olivat realistisempia, englannin taidot parempia ja päätoiminen suomentaminen mahdollista. Myös salapoliisiromaanien arvostus oli lisääntynyt. Sekä 1940- että 1980-luvun suomennoksissa kohdelukijoille vieraitakin alluusioita oli usein säilytetty, mikäli ne olivat koherentteja ilman viittauskohdettaan. Sen sijaan vieraita ja pintamerkitykseltään epäselviä alluusioita oli muokattu tai poistettu. Kuitenkin 1980-luvun suomentajat säilyttivät lähdetekstin alluusioita useammin ja tarkemmin kuin 1940-luvun suomentajat. Varsinkin poisjättämistä esiintyi 1940-luvun suomennoksissa enemmän. Alluusioiden tulkintamahdollisuudet olivat kaikissa käännöksissä muuttuneet sikäli, että melko harvat suomennetut alluusiot olivat enää kohdelukijoiden tunnistettavissa. Toisaalta myös kulttuuritöyssyt olivat harvinaisia. Erot 1940- ja 1980-luvun suomennosten välillä näkyivätkin pseudo-allusiivisissa ja ei-allusiivisissa tulkintamahdollisuuksissa. 1980-luvun suomennoksissa vieraat alluusiot oli johdonmukaisesti säilytetty niin, että käännetyt alluusiot voitiin tulkita pseudo-alluusioiksi. Sen sijaan 1940-luvun suomennoksissa vieraita alluusioita oli usein muokattu tai jätetty pois tavalla, joka johti ei-allusiiviseen tulkintaan. Kohdelukijoiden kannalta 1980-luvun suomennettujen alluusioiden tulkitseminen lienee vaatinut jonkin verran enemmän vaivaa. Toisaalta pseudo-allusiivisten käännösten pohjalta oli useimmiten mahdollista rakentaa koherentti tulkinta, ja monesti ne jopa välittivät samankaltaisia funktioita kuin lähdetekstin alluusiot. 1940-luvun suomennosten muokkaukset ja poistot periaatteessa helpottivat tulkintaa, mutta mahdollisia kulttuuritöyssyjä esiintyi edelleen, jopa kääntäjän tekemien muutosten seurauksena. 1940-luvun suomennoksissa myös käännettyjen alluusioiden funktiot olivat muuttuneet enemmän lähdetekstin alluusioihin nähden. Kaiken kaikkiaan 1980-luvun suomennokset olivat lähempänä oman aikansa hyvän käännöksen piirteitä. Toisaalta alluusioiden muokkaaminen sai 1940-luvun suomennokset muistuttamaan enemmän perinteistä arvoituksen ratkaisuun keskittyvää salapoliisiromaania, joten tältä osin ne lienevät vastanneet kohdelukijoiden odotuksia. Kulttuurikontekstin vaikutus siis näkyi sekä käännösstrategioissa että käännettyjen alluusioiden tulkintamahdollisuuksissa. Tutkimustuloksissa korostui kuitenkin myös se, että lähdetekstin alluusion pintamerkitys saattaa vaikuttaa käännösratkaisuihin. Lisäksi käännetyt pseudo-alluusiot saattavat välittää samankaltaisia funktioita kuin lähdetekstin alluusiot. Toisin kuin yleensä on esitetty, kohdelukijoille vieraiden alluusioiden säilyttäminen saattaakin siis olla toimiva ratkaisu.
Resumo:
"Helmiä sioille", pärlor för svin, säger man på finska om någonting bra och fint som tas emot av en mottagare som inte vill eller har ingen förmåga att förstå, uppskatta eller utnyttja hela den potential som finns hos det mottagna föremålet, är ointresserad av den eller gillar den inte. För sådana relativt stabila flerordiga uttryck, som är lagrade i språkbrukarnas minnen och som demonstrerar olika slags oregelbundna drag i sin struktur använder man inom lingvistiken bl.a. termerna "idiom" eller "fraseologiska enheter". Som en oregelbundenhet kan man t.ex. beskriva det faktum att betydelsen hos uttrycket inte är densamma som man skulle komma till ifall man betraktade det som en vanlig regelbunden fras. En annan oregelbundenhet, som idiomforskare har observerat, ligger i den begränsade förmågan att varieras i form och betydelse, som många idiom har jämfört med regelbundna fraser. Därför talas det ofta om "grundform" och "grundbetydelse" hos idiom och variationen avses som avvikelse från dessa. Men när man tittar på ett stort antal förekomstexempel av idiom i språkbruk, märker man att många av dem tillåter variation, t.o.m. i sådan utsträckning att gränserna mellan en variant och en "grundform" suddas ut, och istället för ett idiom råkar vi plötsligt på en "familj" av flera besläktade uttryck. Allt detta väcker frågan om hur dessa uttryck egentligen ska vara representerade i språket. I avhandlingen utförs en kritisk granskning av olika tidigare tillvägagångssätt att beskriva fraseologiska enheter i syfte att klargöra vilka svårigheter deras struktur och variation erbjuder för den lingvistiska teorin. Samtidigt presenteras ett alternativt sätt att beskriva dessa uttryck. En systematisk och formell modell som utvecklas i denna avhandling integrerar en beskrivning av idiom på många olika språkliga nivåer och skildrar deras variation i form av ett nätverk och som ett resultat av samspel mellan idiomets struktur och kontexter där det förekommer, samt av interaktion med andra fasta uttryck. Modellen bygger på en fördjupande, språkbrukbaserad analys av det finska idiomet "X HEITTÄÄ HELMIÄ SIOILLE" (X kastar pärlor för svin).
Resumo:
In this study, feature selection in classification based problems is highlighted. The role of feature selection methods is to select important features by discarding redundant and irrelevant features in the data set, we investigated this case by using fuzzy entropy measures. We developed fuzzy entropy based feature selection method using Yu's similarity and test this using similarity classifier. As the similarity classifier we used Yu's similarity, we tested our similarity on the real world data set which is dermatological data set. By performing feature selection based on fuzzy entropy measures before classification on our data set the empirical results were very promising, the highest classification accuracy of 98.83% was achieved when testing our similarity measure to the data set. The achieved results were then compared with some other results previously obtained using different similarity classifiers, the obtained results show better accuracy than the one achieved before. The used methods helped to reduce the dimensionality of the used data set, to speed up the computation time of a learning algorithm and therefore have simplified the classification task
Resumo:
Human activity recognition in everyday environments is a critical, but challenging task in Ambient Intelligence applications to achieve proper Ambient Assisted Living, and key challenges still remain to be dealt with to realize robust methods. One of the major limitations of the Ambient Intelligence systems today is the lack of semantic models of those activities on the environment, so that the system can recognize the speci c activity being performed by the user(s) and act accordingly. In this context, this thesis addresses the general problem of knowledge representation in Smart Spaces. The main objective is to develop knowledge-based models, equipped with semantics to learn, infer and monitor human behaviours in Smart Spaces. Moreover, it is easy to recognize that some aspects of this problem have a high degree of uncertainty, and therefore, the developed models must be equipped with mechanisms to manage this type of information. A fuzzy ontology and a semantic hybrid system are presented to allow modelling and recognition of a set of complex real-life scenarios where vagueness and uncertainty are inherent to the human nature of the users that perform it. The handling of uncertain, incomplete and vague data (i.e., missing sensor readings and activity execution variations, since human behaviour is non-deterministic) is approached for the rst time through a fuzzy ontology validated on real-time settings within a hybrid data-driven and knowledgebased architecture. The semantics of activities, sub-activities and real-time object interaction are taken into consideration. The proposed framework consists of two main modules: the low-level sub-activity recognizer and the high-level activity recognizer. The rst module detects sub-activities (i.e., actions or basic activities) that take input data directly from a depth sensor (Kinect). The main contribution of this thesis tackles the second component of the hybrid system, which lays on top of the previous one, in a superior level of abstraction, and acquires the input data from the rst module's output, and executes ontological inference to provide users, activities and their in uence in the environment, with semantics. This component is thus knowledge-based, and a fuzzy ontology was designed to model the high-level activities. Since activity recognition requires context-awareness and the ability to discriminate among activities in di erent environments, the semantic framework allows for modelling common-sense knowledge in the form of a rule-based system that supports expressions close to natural language in the form of fuzzy linguistic labels. The framework advantages have been evaluated with a challenging and new public dataset, CAD-120, achieving an accuracy of 90.1% and 91.1% respectively for low and high-level activities. This entails an improvement over both, entirely data-driven approaches, and merely ontology-based approaches. As an added value, for the system to be su ciently simple and exible to be managed by non-expert users, and thus, facilitate the transfer of research to industry, a development framework composed by a programming toolbox, a hybrid crisp and fuzzy architecture, and graphical models to represent and con gure human behaviour in Smart Spaces, were developed in order to provide the framework with more usability in the nal application. As a result, human behaviour recognition can help assisting people with special needs such as in healthcare, independent elderly living, in remote rehabilitation monitoring, industrial process guideline control, and many other cases. This thesis shows use cases in these areas.
Resumo:
Tutkimuksessa tarkastellaan lauseen aspektin ilmaisemista suomen kielessä. Aspektia käsitellään merkityskategoriana, joka osoittaa lauseen kuvaaman asiaintilan ajallisen keston, ja perustavanlaatuisena aspektuaalisena erontekona pidetään rajattuuden ja rajaamattomuuden vastakohtaisuutta. Tutkimuksessa selvitetään, millä perusteella lauseet saavat joko rajatun tai rajaamattoman aspektitulkinnan ja miten konteksti vaikuttaa tähän tulkintaan. Lauseen kontekstina käsitellään kielellistä kontekstia eli tekstiä. Työ on aineistopohjainen tutkimus kirjoitetusta nykysuomesta, ja tarkastelun kohteena on sanomalehtiteksteistä koottu lauseaineisto. Lauseiden pääverbit ovat olla, tehdä ja tulla. Aineistosta on mahdollista esittää sekä kvalitatiivisia että kvantitatiivisia huomioita. Tutkimuksen teoreettisen ja metodologisen taustan muodostavat eräiden kognitiivisen kielitieteen suuntausten kuvauskäsitteet ja -metodit sekä fennistinen aspektin kuvaamisen perinne. Tutkimuksessa tarkastellaan kahta fennistiikassa esitettyä tapaa määritellä lauseen aspektimerkitys ja osoitetaan, että ne ovat toisiaan täydentäviä. Molemmat lähestymistavat huomioon ottamalla on siis mahdollista kuvata lauseen aspektimerkityksen määräytyminen täsmällisemmin kuin vain yhteen kuvaustapaan keskittymällä. Lisäksi osoitetaan, että keskeisinä aspektin ilmaisemisen keinoina pidetyt keston ja toistuvuuden adverbiaalit jäävät aineistossa marginaalisiksi. Ajankohdan adverbiaaleja puolestaan käsitellään aiemmasta tutkimuksesta poiketen rajattuina tarkastelunäkökulmina kuvattuun asiaintilaan, ja ne toimivat tässä tehtävässä liittyessään aspektiltaan rajaamattomiin lauseisiin. Lisäksi tutkimus osoittaa, että aspektin ilmaisemisen kerroksellisuutta voidaan aspektin ilmaisemiseen osallistuvien lauseenjäsenten kerrostumisen ohella tarkastella lausekokonaisuuden eri semanttisten tasojen kerrostumisena. Lausetta laajemman kontekstin vaikutusta aspektitulkintaan ei ole aiemmin tutkittu suomen kielessä. Tutkimus osoittaa, että aspektiltaan monitulkintaisten lauseiden konteksti voi selventää tulkinnan tai mahdollistaa samanaikaisesti vaihtoehtoiset tulkinnat. Lisäksi erilaisten lauseenulkoisten rajan ilmausten avulla on mahdollista osoittaa lauseen aspektin rajattuutta siinä tapauksessa, että lause muutoin ymmärrettäisiin aspektiltaan rajaamattomaksi.
Resumo:
Konferenssiraportti