7 resultados para textual similarity

em Doria (National Library of Finland DSpace Services) - National Library of Finland, Finland


Relevância:

20.00% 20.00%

Publicador:

Resumo:

Luokittelujärjestelmää suunniteltaessa tarkoituksena on rakentaa systeemi, joka pystyy ratkaisemaan mahdollisimman tarkasti tutkittavan ongelma-alueen. Hahmontunnistuksessa tunnistusjärjestelmän ydin on luokitin. Luokittelun sovellusaluekenttä on varsin laaja. Luokitinta tarvitaan mm. hahmontunnistusjärjestelmissä, joista kuvankäsittely toimii hyvänä esimerkkinä. Myös lääketieteen parissa tarkkaa luokittelua tarvitaan paljon. Esimerkiksi potilaan oireiden diagnosointiin tarvitaan luokitin, joka pystyy mittaustuloksista päättelemään mahdollisimman tarkasti, onko potilaalla kyseinen oire vai ei. Väitöskirjassa on tehty similaarisuusmittoihin perustuva luokitin ja sen toimintaa on tarkasteltu mm. lääketieteen paristatulevilla data-aineistoilla, joissa luokittelutehtävänä on tunnistaa potilaan oireen laatu. Väitöskirjassa esitetyn luokittimen etuna on sen yksinkertainen rakenne, josta johtuen se on helppo tehdä sekä ymmärtää. Toinen etu on luokittimentarkkuus. Luokitin saadaan luokittelemaan useita eri ongelmia hyvin tarkasti. Tämä on tärkeää varsinkin lääketieteen parissa, missä jo pieni tarkkuuden parannus luokittelutuloksessa on erittäin tärkeää. Väitöskirjassa ontutkittu useita eri mittoja, joilla voidaan mitata samankaltaisuutta. Mitoille löytyy myös useita parametreja, joille voidaan etsiä juuri kyseiseen luokitteluongelmaan sopivat arvot. Tämä parametrien optimointi ongelma-alueeseen sopivaksi voidaan suorittaa mm. evoluutionääri- algoritmeja käyttäen. Kyseisessä työssä tähän on käytetty geneettistä algoritmia ja differentiaali-evoluutioalgoritmia. Luokittimen etuna on sen joustavuus. Ongelma-alueelle on helppo vaihtaa similaarisuusmitta, jos kyseinen mitta ei ole sopiva tutkittavaan ongelma-alueeseen. Myös eri mittojen parametrien optimointi voi parantaa tuloksia huomattavasti. Kun käytetään eri esikäsittelymenetelmiä ennen luokittelua, tuloksia pystytään parantamaan.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Kulttuuriset ja tekstuaaliset tekijät alluusioiden kääntämisessä ja tulkinnassa. Alluusiot Dorothy L. Sayersin 1940- ja 1980-luvuilla suomennetuissa salapoliisiromaaneissa Väitöskirja käsittelee alluusioiden kääntämistä ja tulkintaa. Alluusio on intertekstuaalinen viittaus, jonka tulkitsemiseen tarvitaan implisiittistä tietoa tutuksi oletetusta viittauskohteesta. Käännösongelma alluusiosta tulee, mikäli kohdekulttuurin lukijat eivät tunne viittauskohdetta eivätkä voi päätellä alluusion merkitystä. Tutkimus pyrkii kuitenkin uuden analyysimenetelmän avulla osoittamaan, että vieraat alluusiot eivät välttämättä johda tulkintaongelmiin. Väitöskirja jakautuu kahteen osaan: analyysimenetelmän kehittämiseen (luvut 1-5) sekä tapaustutkimukseen (luvut 6-7). Kehitetyn menetelmän avulla pystytään analysoimaan aikaisempaa tarkemmin, millaisia tulkintamahdollisuuksia alluusiot tarjoavat eri lukijakunnille ja miten lähdetekstin alluusioiden kulttuuriset ja tekstuaaliset piirteet korreloivat käännösstrategioiden kanssa. Tapaustutkimus selvittää, millaisia tulkintamahdollisuuksia Dorothy L. Sayersin 1940- ja 1980-luvuilla suomennettujen salapoliisiromaanien alluusiot tarjosivat aikansa suomalaisille lukijoille. Tavoitteena on myös hahmottaa, miten suomentajien käännösratkaisut ja alluusioiden tulkintamahdollisuudet liittyvät toisaalta lähdetekstin alluusioiden piirteisiin ja toisaalta kohdekulttuurin kontekstiin. Tapaustutkimus tarjoaa näin uutta tietoa suomennoskirjallisuuden ja salapoliisiromaanien historiasta. Analyysimenetelmä määrittelee aikaisempaa alluusioita ja intertekstuaalisuutta käsitelleen tutkimuksen pohjalta ne kulttuuriset ja tekstuaaliset piirteet, jotka vaikuttavat alluusioiden kääntämiseen ja tulkintaan. Kulttuurisessa mielessä alluusio voi olla tietylle lukijakunnalle tuttu tai tuntematon. Tekstuaalisia tekijöitä ovat alluusion muodon ja tyylin tunnusmerkillisyys sekä alluusion pintamerkityksen koherenttius uudessa tekstikontekstissa, ilman tietoa viittauskohteesta. Alluusioiden tulkinnassa on perinteisesti erotettu toisaalta allusiivinen tulkintamahdollisuus, jossa alluusio on lukijoille tuttu ja yhdistettävissä viittauskohteeseensa, toisaalta kulttuuritöyssy, jonka muodostaa lukijoille tuntematon ja pintamerkitykseltään inkoherentti alluusio. Tutkimuksessa määritellään kulttuuristen ja tekstuaalisten tekijöiden perusteella lisäksi kaksi muuta mahdollisuutta. Pseudo-allusiivisessa tulkinnassa tuntematon alluusio erottuu ympäröivästä tekstikontekstista tyyliltään ja on koherentti ainakin kuvaannollisessa mielessä ilman viittauskohdettaan. Ei-allusiivisessa tulkinnassa taas vieras alluusio sulautuu kontekstiin sekä muodoltaan että merkitykseltään niin, ettei lukija edes huomaa mahdollista alluusiota. Tulkintamahdollisuuksien jakauma antaa yleiskuvan siitä, miten tietty lukijakunta pystyi tulkitsemaan tekstin alluusioita. Lisäksi analyysi tarkastelee lähdetekstin ja käännöksen välillä tulkintamahdollisuuksissa tapahtuneita muutoksia sekä niiden vaikutusta tulkinnan vaatimaan vaivannäköön (effort) ja alluusion funktioihin. Tapaustutkimus perehtyy Sayers-suomennosten kulttuurikonteksteihin tarkastelemalla salapoliisiromaanien asemaa suomalaisessa kirjallisuusjärjestelmässä, suomennoksilta odotettuja piirteitä sekä suomentajien ammattikuvaa, taustoja ja työoloja. Tulosten perusteella alluusioiden kääntäminen oli vaativa tehtävä sekä 1940- että 1980-luvun suomentajille. Lähdetekstien alluusioista 60–70 prosenttia oli todennäköisesti kohdelukijoille vieraita. Molempina aikakausina suomennoksilta odotettiin silti sekä kielellistä sujuvuutta että lähdetekstin merkitysten välittämistä. 1940-luvun suomentajien tehtävää vaikeutti lisäksi mm. se, että suomentaminen oli enimmäkseen sivutoimista ja englanti oli harvoin parhaiten hallittu vieras kieli. Nämä olosuhteet lienevät vaikuttaneet etenkin vähäarvoisena pidetyn salapoliisikirjallisuuden suomennoksiin. 1980-luvulla suomentajien aikataulut olivat realistisempia, englannin taidot parempia ja päätoiminen suomentaminen mahdollista. Myös salapoliisiromaanien arvostus oli lisääntynyt. Sekä 1940- että 1980-luvun suomennoksissa kohdelukijoille vieraitakin alluusioita oli usein säilytetty, mikäli ne olivat koherentteja ilman viittauskohdettaan. Sen sijaan vieraita ja pintamerkitykseltään epäselviä alluusioita oli muokattu tai poistettu. Kuitenkin 1980-luvun suomentajat säilyttivät lähdetekstin alluusioita useammin ja tarkemmin kuin 1940-luvun suomentajat. Varsinkin poisjättämistä esiintyi 1940-luvun suomennoksissa enemmän. Alluusioiden tulkintamahdollisuudet olivat kaikissa käännöksissä muuttuneet sikäli, että melko harvat suomennetut alluusiot olivat enää kohdelukijoiden tunnistettavissa. Toisaalta myös kulttuuritöyssyt olivat harvinaisia. Erot 1940- ja 1980-luvun suomennosten välillä näkyivätkin pseudo-allusiivisissa ja ei-allusiivisissa tulkintamahdollisuuksissa. 1980-luvun suomennoksissa vieraat alluusiot oli johdonmukaisesti säilytetty niin, että käännetyt alluusiot voitiin tulkita pseudo-alluusioiksi. Sen sijaan 1940-luvun suomennoksissa vieraita alluusioita oli usein muokattu tai jätetty pois tavalla, joka johti ei-allusiiviseen tulkintaan. Kohdelukijoiden kannalta 1980-luvun suomennettujen alluusioiden tulkitseminen lienee vaatinut jonkin verran enemmän vaivaa. Toisaalta pseudo-allusiivisten käännösten pohjalta oli useimmiten mahdollista rakentaa koherentti tulkinta, ja monesti ne jopa välittivät samankaltaisia funktioita kuin lähdetekstin alluusiot. 1940-luvun suomennosten muokkaukset ja poistot periaatteessa helpottivat tulkintaa, mutta mahdollisia kulttuuritöyssyjä esiintyi edelleen, jopa kääntäjän tekemien muutosten seurauksena. 1940-luvun suomennoksissa myös käännettyjen alluusioiden funktiot olivat muuttuneet enemmän lähdetekstin alluusioihin nähden. Kaiken kaikkiaan 1980-luvun suomennokset olivat lähempänä oman aikansa hyvän käännöksen piirteitä. Toisaalta alluusioiden muokkaaminen sai 1940-luvun suomennokset muistuttamaan enemmän perinteistä arvoituksen ratkaisuun keskittyvää salapoliisiromaania, joten tältä osin ne lienevät vastanneet kohdelukijoiden odotuksia. Kulttuurikontekstin vaikutus siis näkyi sekä käännösstrategioissa että käännettyjen alluusioiden tulkintamahdollisuuksissa. Tutkimustuloksissa korostui kuitenkin myös se, että lähdetekstin alluusion pintamerkitys saattaa vaikuttaa käännösratkaisuihin. Lisäksi käännetyt pseudo-alluusiot saattavat välittää samankaltaisia funktioita kuin lähdetekstin alluusiot. Toisin kuin yleensä on esitetty, kohdelukijoille vieraiden alluusioiden säilyttäminen saattaakin siis olla toimiva ratkaisu.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

In this study, feature selection in classification based problems is highlighted. The role of feature selection methods is to select important features by discarding redundant and irrelevant features in the data set, we investigated this case by using fuzzy entropy measures. We developed fuzzy entropy based feature selection method using Yu's similarity and test this using similarity classifier. As the similarity classifier we used Yu's similarity, we tested our similarity on the real world data set which is dermatological data set. By performing feature selection based on fuzzy entropy measures before classification on our data set the empirical results were very promising, the highest classification accuracy of 98.83% was achieved when testing our similarity measure to the data set. The achieved results were then compared with some other results previously obtained using different similarity classifiers, the obtained results show better accuracy than the one achieved before. The used methods helped to reduce the dimensionality of the used data set, to speed up the computation time of a learning algorithm and therefore have simplified the classification task