Dialekter och röstigenkänning : Ett röstigenkännings-API:s förmåga att uppfatta svenska dialekters kännetecken och röstkombinationer


Autoria(s): Nilsson, Jonas; Larsson, Daniel
Data(s)

2015

Resumo

Allt eftersom utvecklingen går framåt inom applikationer och system så förändras också sättet på vilket vi interagerar med systemet på. Hittills har navigering och användning av applikationer och system mestadels skett med händerna och då genom mus och tangentbord. På senare tid så har navigering via touch-skärmar och rösten blivit allt mer vanligt. Då man ska styra en applikation med hjälp av rösten är det viktigt att vem som helst kan styra applikationen, oavsett vilken dialekt man har. För att kunna se hur korrekt ett röstigenkännings-API (Application Programming Interface) uppfattar svenska dialekter så initierades denna studie med dokumentstudier om dialekters kännetecken och ljudkombinationer. Dessa kännetecken och ljudkombinationer låg till grund för de ord vi valt ut till att testa API:et med. Varje dialekt fick alltså ett ord uppbyggt för att vara extra svårt för API:et att uppfatta när det uttalades av just den aktuella dialekten. Därefter utvecklades en prototyp, närmare bestämt en android-applikation som fungerade som ett verktyg i datainsamlingen. Då arbetet innehåller en prototyp och en undersökning så valdes Design and Creation Research som forskningsstrategi med datainsamlingsmetoderna dokumentstudier och observationer för att få önskat resultat. Data samlades in via observationer med prototypen som hjälpmedel och med hjälp av dokumentstudier. Det empiriska data som registrerats via observationerna och med hjälp av applikationen påvisade att vissa dialekter var lättare för API:et att uppfatta korrekt. I vissa fall var resultaten väntade då vissa ord uppbyggda av ljudkombinationer i enlighet med teorin skulle uttalas väldigt speciellt av en viss dialekt. Ibland blev det väldigt låga resultat på just dessa ord men i andra fall förvånansvärt höga. Slutsatsen vi drog av detta var att de ord vi valt ut med en baktanke om att de skulle få låga resultat för den speciella dialekten endast visade sig stämma vid två tillfällen. Det var istället det ord innehållande sje- och tje-ljud som enligt teorin var gemensamma kännetecken för alla dialekter som fick lägst resultat överlag.

As the development of applications and systems progress so does the ways in which we interact with the application or system. So far, the navigation and usage of applications and systems have been made by hand, through keyboard and a mouse. Recently navigation through touch-screens and voice has been more common. When you are going to navigate the application with your voice, it´s crucial that anyone can navigate the application despite their dialect. To be able to see how a voice recognition API (Application Programming Interface) understands Swedish dialects a study on the characteristics on Swedish dialects were made. These characteristics and combinations of sound were the foundation to the words used for testing the API. Each dialect got a specific word that were supposed to be difficult for the API to understand when the word was pronounced by the actual dialect. A prototype of an android application was developed as a tool for data generation. This thesis contains a prototype and a research and therefore the strategy used for this thesis is Design & Creation Research, with document studies and observation as data generation methods to achieve the desired result. The data were collected through observations with the prototype as a tool and also through studies of documents. Our empirical data that has been registered through the observations and with the help of the application proved that some dialects were easier to understand correctly by the API. In some cases the results were expected because some words were made of combinations of sounds according to the theory that were going to be pronounced in a special way from a certain dialect. Some of the results were low on these certain words but in some other cases the results were surprisingly high. The conclusion we drew from this was that the words we chose with the intention of making it hard for the API to understand only proved to be working on two separate occasions. It was the word containing the combination of the sounds "sje" and "tje" that had common characteristics to all dialects, according to the theory, that got the lowest result.

Formato

application/pdf

Identificador

http://urn.kb.se/resolve?urn=urn:nbn:se:du-18701

Idioma(s)

swe

Publicador

Högskolan Dalarna, Informatik

Högskolan Dalarna, Informatik

Direitos

info:eu-repo/semantics/openAccess

Palavras-Chave #Röstigenkänning #Röststyrning #Dialekter #Svenska Dialekter #Röstigenkännings-API #Språkområde #Ljudkombinationer. #Information Systems #Systemvetenskap, informationssystem och informatik
Tipo

Student thesis

info:eu-repo/semantics/bachelorThesis

text