251 resultados para luonnollisen kielen filosofia

em Doria (National Library of Finland DSpace Services) - National Library of Finland, Finland


Relevância:

90.00% 90.00%

Publicador:

Resumo:

Tämän diplomityön tarkoituksena on käydä läpi XML:n tarjoamia mahdollisuuksia heterogeenisen palveluverkon integroinnissa. Työssä kuvataan XML-kielen yleistä teoriaa ja perehdytään etenkin sovellusten välisen kommunikoinnin kannalta tärkeisiin ominaisuuksiin. Samalla käydään läpi sovelluskehitysympäristöjen muuttumista heterogeenisemmiksi ja siitä seurannutta palveluarkkitehtuurien kehittymistä ja kuinka nämä muutokset vaikuttavat XML:n hyväksikäyttöön. Työssä suunniteltiin ja toteutettiin luonnollisen kielen palvelukehitykseen Fuse-palvelualusta. Työssä kuvataan palvelualustan arkkitehtuuri ja siinä tarkastellaan XML:n hyödyntämistä luonnollisen kielen tulkin ja palvelun integroinnissa. Samalla arvioidaan muita XML:n käyttömahdollisuuksia Fuse-palvelualustan parantamiseksi.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Työn tavoitteena on etsiä asiakasyritykselle sähköteknisen dokumentoinnin hallintaan sopiva järjestelmäratkaisu vertailemalla insinööritoimistojen käyttämien suunnittelujärjestelmien ja yleisten dokumenttien hallintajärjestelmien soveltuvuutta asiakasympäristöön. Työssä tutkitaan sopivien metatietojen kuvaustapojen käyttökelpoisuutta sähköteknisen dokumentoinnin hallintaan esimerkkiprojektien avulla. Työn sisältö koostuu neljästä pääkohdasta. Ensimmäisessä jaksossa tarkastellaan dokumentin ominaisuuksia ja elinkaarta luonnista aktiivikäyttöön, arkistointiin ja hävitykseen. Samassa yhteydessä kerrotaan dokumenttienhallinnan perustehtävistä. Toisessa jaksossa käsitellään dokumenttien kuvailun tavoitteita, kuvailusuosituksia ja -standardeja sekä luonnollisen kielen käyttöä sisällönkuvailussa. Tarkastelukohteina suosituksista ovat W3C:n julkaisemat suositukset, Dublin Core, JHS 143 ja SFS-EN 82045. Kolmannessa jaksossa tarkastellaan teollisuuden dokumentoinnin ominaispiirteitä ja käyttötarkoitusta. Teollisuudessa on monia erilaisia järjestelmäympäristöjä tehtaan sisällä ja työssä kuvataan dokumenttienhallinnan integrointitarpeita muihin järjestelmiin. Viimeisessä jaksossa kuvaillaan erilaisia dokumentoinnin hallintaympäristöjä alkaen järeimmästä päästä tuotetiedon hallintajärjestelmistä siirtyen pienempiinsuunnittelujärjestelmiin ja lopuksi yleisiin dokumenttien hallintajärjestelmiin. Tässä osassa on myös luettelo ohjelmistotoimittajista. Työn tuloksena on laadittu valituista dokumenttityypeistä metatietokuvaukset kahden eri kuvaustavan (JHS 143 ja SFS-EN 82045) avulla ja on todettu molemmat kuvaustavat käyttökelpoisiksi sähköteknisen dokumentoinnin käsittelyyn.Nämä kuvaukset palvelevat asiakasta dokumenttienhallintaprojektin määrittelytyössä. Asiakkaalle on tehty myös vertailu sopivista järjestelmävaihtoehdoista hankintaa varten.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

The subject of the thesis is automatic sentence compression with machine learning, so that the compressed sentences remain both grammatical and retain their essential meaning. There are multiple possible uses for the compression of natural language sentences. In this thesis the focus is generation of television program subtitles, which often are compressed version of the original script of the program. The main part of the thesis consists of machine learning experiments for automatic sentence compression using different approaches to the problem. The machine learning methods used for this work are linear-chain conditional random fields and support vector machines. Also we take a look which automatic text analysis methods provide useful features for the task. The data used for machine learning is supplied by Lingsoft Inc. and consists of subtitles in both compressed an uncompressed form. The models are compared to a baseline system and comparisons are made both automatically and also using human evaluation, because of the potentially subjective nature of the output. The best result is achieved using a CRF - sequence classification using a rich feature set. All text analysis methods help classification and most useful method is morphological analysis. Tutkielman aihe on suomenkielisten lauseiden automaattinen tiivistäminen koneellisesti, niin että lyhennetyt lauseet säilyttävät olennaisen informaationsa ja pysyvät kieliopillisina. Luonnollisen kielen lauseiden tiivistämiselle on monta käyttötarkoitusta, mutta tässä tutkielmassa aihetta lähestytään television ohjelmien tekstittämisen kautta, johon käytännössä kuuluu alkuperäisen tekstin lyhentäminen televisioruudulle paremmin sopivaksi. Tutkielmassa kokeillaan erilaisia koneoppimismenetelmiä tekstin automaatiseen lyhentämiseen ja tarkastellaan miten hyvin erilaiset luonnollisen kielen analyysimenetelmät tuottavat informaatiota, joka auttaa näitä menetelmiä lyhentämään lauseita. Lisäksi tarkastellaan minkälainen lähestymistapa tuottaa parhaan lopputuloksen. Käytetyt koneoppimismenetelmät ovat tukivektorikone ja lineaarisen sekvenssin mallinen CRF. Koneoppimisen tukena käytetään tekstityksiä niiden eri käsittelyvaiheissa, jotka on saatu Lingsoft OY:ltä. Luotuja malleja vertaillaan Lopulta mallien lopputuloksia evaluoidaan automaattisesti ja koska teksti lopputuksena on jossain määrin subjektiivinen myös ihmisarviointiin perustuen. Vertailukohtana toimii kirjallisuudesta poimittu menetelmä. Tutkielman tuloksena paras lopputulos saadaan aikaan käyttäen CRF sekvenssi-luokittelijaa laajalla piirrejoukolla. Kaikki kokeillut teksin analyysimenetelmät auttavat luokittelussa, joista tärkeimmän panoksen antaa morfologinen analyysi.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Dialogiagentit ovat järjestelmiä, joiden avulla ihminen pystyy keskustelemaan tietokoneen kanssa puheen välityksellä. Puheen avulla ihminen voi antaa järjestelmälle käskyjä, kysyä tietoa tai yksinkertaisesti keskustella luonnollisella tavalla lähes asiasta kuin asiasta. Toimiakseen oikein dialogiagentin on ensin purettava käyttäjän puhe tietokoneelle käytettävään muotoon. Sanat on tunnistettava oikein ja niille on määritettävä merkitys. Vasta tämän jälkeen voidaan hakea haluttu tieto tai suorittaa käsky. Jos tehtävä vaatii vastauksen käyttäjälle, se tuotetaan käyttämällä luonnollisen kielen käsittelyn tekniikoita. Tämä vastaus voidaan joko esittää tekstimuodossa tai syntetisoida puheeksi. Tapoja toteuttaa tällainen järjestelmä on monia. Perinteisemmät järjestelmät rakennetaan tyypillisesti yhtä käyttötarkoitusta varten, mutta uusimmat järjestelmät pyrkivät geneerisyyteen. Monet uusimmista menetelmistä nojautuvat koneoppimiseen. Panostamalla uudelleenkäytettävyyteen ja skaalautuvuuteen järjestelmiä ei tarvitse luoda uudelleen, jos käyttötarkoitusta halutaan vaihtaa. Agentteja on luotu runsaasti englannin kielelle, mutta suomen kielen ominaisuudet luovat erityisiä haasteita järjestelmän kehittämiselle. Suomen kielen lukuisat sijamuodot estävät kaikenkattavien sanastojen käyttämisen ja lähes vapaa sanajärjestys tekee viestien tulkitsemisesta hankalaa. Suomen kieliteknologian resurssit ovat viime vuosina kehittyneet tehokkaasti tästä huolimatta. Tutkielmassa tarkastellaan, missä dialogiagentteja käytetään ja millaisista komponenteista järjestelmät koostuvat. Käydään läpi myös, millaisia haasteita järjestelmän kehittämisessä on. Lopuksi tehdään katsaus suomen kielen tilaan kieliteknologian saralla ja millaisia resursseja suomenkielisen agentin kehittämiseen on.

Relevância:

20.00% 20.00%

Publicador:

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Osasto sisältää filosofian klassisia lähdeteoksia (Aristoteles, Duns Scotus, Ockham) sekä laajan kokoelman filosofisen teologian historiaa ja modernia uskonnonfilosofiaa käsitteleviä tutkimuksia. Kirjastoon hankitaan aineistoja laajasti kaikilta uskonnonfilosofian osa-alueilta, erityisesti niiltä tutkimusalueilta, joita tiedekunnassa tutkitaan (keskiajan ja modernin uskonnon filosofia).

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Abstract

Relevância:

20.00% 20.00%

Publicador: