528 resultados para Entonació (Fonètica)
Resumo:
Anàlisi de les característiques pròpies del català col•loquial, tant pel que fa a la fonètica, al lèxic, a la sintaxi i a la morfologia, que es donen en el llenguatge radiofònic informal utilitzat pels locutors del programa On vols anar a parar? de Catalunya Ràdio.
Resumo:
Aquest treball s'ubica dins el camp de la traductologia i el seu objectiu és fer una anàlisi lingüística de l'oralitat, centrada sobretot en el registre col·loquial, de la pel·lícula doblada al català Reservoir Dogs.
Resumo:
Esta tese resume os trabalhos desenvolvidos na área de processamento automático de fala com o objetivo de incrementar a quantidade de recursos linguísticos disponíveis para o português europeu. O estágio de desenvolvimento e a aplicação das tecnologias de fala para uma língua estão relacionados com a quantidade e a qualidade de recursos disponíveis para esta língua. Poucas línguas apresentam, no domínio público e livre, todos os recursos necessários para desenvolver as tecnologias de fala. A língua portuguesa, como muitas outras, tem escassez de recursos públicos e livres, o que pode dificultar o desenvolvimento e a aplicação de tecnologias de fala que incorporam esta língua. Os trabalhos descritos nesta tese apresentam uma abordagem para criar bases de dados de fala, recorrendo apenas aos recursos do domínio público e livres, partindo de sinais multimédia sem transcrições ortográficas ou fonéticas. É apresentada uma solução para aproveitar a grande disponibilidade de material multimédia existente no domínio público (podcasts por exemplo) e selecionar segmentos de fala adequados para treinar modelos acústicos. Para isso, foram desenvolvidos vários sistemas para segmentar e classificar automaticamente os noticiários. Estes sistemas podem ser combinados para criar bases de dados de fala com transcrição fonética sem a intervenção humana. Foi desenvolvido um sistema de conversão automático de grafemas para fonemas que se apoia em regras fonológicas e modelos estatísticos. Esta abordagem híbrida é justificada pelos desenvolvimentos de algoritmos de aprendizagem automática aplicados a conversão de grafemas para fonemas e pelo fato do português apresentar uma razoável regularidade fonética e fonológica bem como uma ortografia de base fonológica. Com auxílio deste sistema, foi criado um dicionário de pronunciação com cerca de 40 mil entradas, que foram verificadas manualmente. Foram implementados sistemas de segmentação e de diarização de locutor para segmentar sinais de áudio. Estes sistemas utilizam várias técnicas como a impressão digital acústica, modelos com misturas de gaussianas e critério de informação bayesiana que normalmente são aplicadas noutras tarefas de processamento de fala. Para selecionar os segmentos adequados ou descartar os segmentos com fala não preparada que podem prejudicar o treino de modelos acústicos, foi desenvolvido um sistema de deteção de estilos de fala. A deteção de estilos de fala baseia-se na combinação de parâmetros acústicos e parâmetros prosódicos, na segmentação automática e em classificadores de máquinas de vetores de suporte. Ainda neste âmbito, fez-se um estudo com o intuito de caracterizar os eventos de hesitações presentes nos noticiários em português. A transcrição fonética da base de dados de fala é indispensável no processo de treino de modelos acústicos. É frequente recorrer a sistemas de reconhecimento de fala de grande vocabulário para fazer transcrição automática quando a base de dados não apresenta nenhuma transcrição. Nesta tese, é proposto um sistema de word-spotting para fazer a transcrição fonética dos segmentos de fala. Fez-se uma implementação preliminar de um sistema de word-spotting baseado em modelos de fonemas. Foi proposta uma estratégia para diminuir o tempo de resposta do sistema, criando, a priori, uma espécie de “assinatura acústica” para cada sinal de áudio com os valores de todos os cálculos que não dependem da palavra a pesquisar, como a verosimilhanças de todos os estados dos modelos de fonemas. A deteção de uma palavra utiliza medidas de similaridade entre as verosimilhanças do modelo da palavra e do modelo de enchimento, um detetor de picos e um limiar definido por forma a minimizar os erros de deteção. Foram publicados vários recursos para a língua portuguesa que resultaram da aplicação dos vários sistemas desenvolvidos ao longo da execução desta tese com especial destaque para o sistema de conversão de grafemas para fonemas a partir do qual se publicaram vários dicionários de pronunciação, dicionários com as palavras homógrafas heterofónicas, dicionário com estrangeirismos, modelos estatísticos para a conversão de grafemas para fonemas, o código fonte de todo sistema de treino e conversão e um demonstrador online.
Characterization of intonation in Karṇāṭaka music by parametrizing context-based Svara Distributions
Resumo:
Intonation is a fundamental music concept that has a special relevance in Indian art music. It is characteristic of the rāga and intrinsic to the musical expression of the performer. Describing intonation is of importance to several information retrieval tasks like the development of rāga and artist similarity measures. In our previous work, we proposed a compact representation of intonation based on the parametrization of the pitch histogram of a performance and demonstrated the usefulness of this representation through an explorative rāga recognition task in which we classified 42 vocal performances belonging to 3 rāgas using parameters of a single svara. In this paper, we extend this representation to employ context-based svara distributions, which are obtained with a different approach to find the pitches belonging to each svara. We quantitatively compare this method to our previous one, discuss the advantages, and the necessary melodic analysis to be carried out in future.
Resumo:
A partir de los materiales de BADARE (Base de datos sobre refranes del calendario y meteorológicos en la Romania), esta contribución reivindica el enorme interés de estudiar la variación diatópica en dicho tipo de paremias, y abre una línea de investigación que podríamos denominar"dialectología paremiológica". A partir de la muestra que aquí ofrezco, se observa que tales paremias albergan componentes individuales de índole fonética, morfosintáctica y derivativa, léxica y semántica que responden a una adscripción dialecta l concreta; y, asimismo, que las propias paremias, como entidades globales, dan pie en algunos casos a identificar"tipos parémicos" o"paremiotipos" relacionables con determinadas zonas de uso: áreas parémicas dialectales que constituyen uno de los principales objetos de atención de la"geoparemiología romance"
Resumo:
La comedia Pigmalión, que Bernard Shaw escribió en 1912 y estrenó al año siguiente, es una proclamación artística de la lingüística. A pesar de la popularidad de la obra, es un acontecimiento que se conoce como una anécdota extravagante. El extraordinario mérito de Pigmalión ha pasado desapercibido para la historia de la lingüística. Su mérito estriba en la calidad teatral, la capacidad prospectiva de Shaw y la intención social de su mensaje. Shaw anuncia la utilidad de la lingüística en facetas que, décadas después, se conocerán como sociolingüística, planificación lingüística y logopedia. Por otra parte, se ha relacionado de modo simplista el personaje del profesor Higgins al fonetista H. Sweet. The play Pygmalion, that Bernard Shaw wrote in 1912 and released the following year, is an artistic proclamation of Linguistics. Despite the popularity of the play, this event is known as an extravagant story. The History of Linguistics does not recognize the extraordinary merit of Pygmalion. Its merit lays in the theatrical quality ant the social intention of the message. Shaw announces the usefulness of Linguistics in facets that will be known as Sociolinguistics, Language Planning and Speech Therapy. And furthermore, in a simplistic way, the character of Professor Higgins has been linked to the phonetician H. Sweet.
Resumo:
Aquest treball és l'anàlisi lingüística diacrònica d'un procés judicial sobre proxenetisme celebrat entre el mes de desembre de 1403 i el mes d'abril de 1404 a Binissalem (Mallorca). L'interès per la llengua no literària dels textos catalans medievals n'és el seu l'origen. L'estudi que presentam s'ha dividit en diferents seccions en què analitzam els nivells lingüístics (grafies i fonètica, morfosintaxi i lèxic). Els resultats aconseguits ens han permès confirmar i aportar més informació sobre l'estat de la llengua a la Mallorca medieval, entre els quals destacam alguns trets innovadors que detallam a l'anàlisi
Resumo:
El present treball consisteix en una descripció de les característiques d'una varietat gascona parlada a la vall de Varossa, situada al sud est de Gascunya. Aquest estudi s'ha realitzat a partir d'un documental etnogràfic gravat en aquesta zona. En primer lloc, s'introdueix el document estudiat i la zona on s'emmarca. Tot seguit, s'exposen els comentaris lingüístics, que han estat dividits en cinc apartats: trets generals del document, aspectes de fonètica i fonologia, morfologia, sintaxi i lèxic amb referències específiques al contacte de llengües. També s'ha inclòs un apartat de qüestions relatives al contacte de llengües i a la interferència. Aquest tipus d'estudi, que cal remarcar que no és exhaustiu, pot servir d'introducció a un altre de més ampli, i explora un mètode d'investigació original amb força possibilitats.
Resumo:
Aquest treball consisteix en una visió general del ribagorçà concentrada en un sol parlant de la Vall de Boí, i més concretament del municipi de Boí. La informació l’hem extret d’una entrevista realitzada per Susana Ariño a Lluís Pifarré. L’objectiu és estudiar el dialecte utilitzant el mètode inductiu: des d’un informant concret per arribar a una caracterització general. L’informant ha estat escollit escrupolosament seguint uns criteris; s’ha valorat l’edat, 92 anys, el sexe, masculí, la professió, vaquer i taxista, les experiències, èpoques de transhumància a la plana de Lleida, i la seva procedència, les seves arrels les trobem a la Vall Fosca. Després de fer una classificació per nivells de llengua: lèxic, morfològic, fonètic i sintàctic, observem les diferents característiques del dialecte i ens adonem dels trets que resten vius i d’aquells que estan en procés de recessió. Per acabar, cal remarcar que l’interès d’aquest treball era pràctic i no pas biogràfic o bibliogràfic, i reserva el seu atractiu en la conversa ribagorçana i en el dialecte, per extensió. Un factor que ha contribuït a la millora de l’enteniment del treball ha estat el coneixement previ del dialecte i l’atractiu que hom sent per la zona.
Resumo:
Les llengües que s"originen en poblacions sobre el nivell del mar utilitzen sons que necessiten aire amb més pressió i més saliva per pronunciar-los
Resumo:
La llengua catalana disposa d’informació fonètica detallada multidialectal d’ençà que el Diccionari català-valencià-balear d’Alcover & Moll (1926/1930-1962/1968) fou enllestit quatre dècades enrere. Més endavant aparegué el primer diccionari de pronunciació del català (Bruguera, 1990, 20042), restringit al català central i amb una sola pronúncia per entrada -per tant, sense variants i amb informació reduïda en relació amb noms propis, manlleus i neologismes. Més endavant es publicà un vocabulari d’unes 2.000 paraules (Paloma & Rico, 2000) en els dos estàndards orals de Catalunya: central i nord-occidental, de caràcter normatiu i en transcripció ampla, suficient per als parlants catalans. Poc després veié la llum un diccionari de pronúncia de la varietat valenciana (Lacreu, ed., 2001), que conté un nombre elevat d’entrades, però sense informació onomàstica, morfològica ni relativa a la variació de la pronúncia d’aquest parlar. Finalment, es presenta un diccionari en procés d’elaboració d’unes 70.000 entrades i de més de 200.000 pronúncies. El Diccionari de pronúncia catalana (DPC) ha estat concebut per Julià-Muné & Creus com un diccionari de pronúncia descriptiva, en principi de les varietats nord-ocidental i central de la llengua catalana, que ofereix a més la pronunciació estàndard recomanada.
Resumo:
Aquest document conté la transcripció fonètica, la fonoortogràfica i l'arxiu de so d'un fragment de conversa lliure amb un informant de Barcelona que forma part del Corpus Oral Dialectal (COD). El COD és un component del Corpus de Català Contemporani de la Universitat de Barcelona (CCCUB), un arxiu de corpus de llengua catalana oral contemporània que ha estat confegit pel grup de recerca Grup d'Estudi de la Variació (GEV) amb la finalitat de contribuir a l'estudi de la variació dialectal, social i funcional en la llengua catalana. Aquest i altres materials del CCCUB són accessibles directament al Dipòsit Digital de la UB (http://diposit.ub.edu) o a través del web del CCCUB (http://www.ub.edu/cccub).
Resumo:
Aquest document conté la transcripció fonètica, la fonoortogràfica i l'arxiu de so d'un fragment de conversa lliure amb un informant d'Alacant que forma part del Corpus Oral Dialectal (COD). El COD és un component del Corpus de Català Contemporani de la Universitat de Barcelona(CCCUB), un arxiu de corpus de llengua catalana oral contemporània que ha estat confegit pel grup de recerca Grup d'Estudi de la Variació(GEV) amb la finalitat de contribuir a l'estudi de la variació dialectal, social i funcional en la llengua catalana. Aquest i altres materials del CCCUB són accessibles directament al Dipòsit Digital de la UB (http://diposit.ub.edu) o a través del web del CCCUB (http://www.ub.edu/cccub).
Resumo:
Aquest document conté la transcripció fonètica, la fonoortogràfica i l'arxiu de so d'un fragment de conversa lliure amb un informant de Benavarri que forma part del Corpus Oral Dialectal (COD). El COD és un component del Corpus de Català Contemporani de la Universitat de Barcelona (CCCUB), un arxiu de corpus de llengua catalana oral contemporània que ha estat confegit pel grup de recerca Grup d'Estudi de la Variació (GEV) amb la finalitat de contribuir a l'estudi de la variació dialectal, social i funcional en la llengua catalana. Aquest i altres materials del CCCUB són accessibles directament al Dipòsit Digital de la UB (http://diposit.ub.edu) o a través del web del CCCUB (http://www.ub.edu/cccub).
Resumo:
Aquest document conté la transcripció fonètica, la fonoortogràfica i l'arxiu de so d'un fragment de conversa lliure amb un informant de Móra d'Ebre que forma part del Corpus Oral Dialectal (COD). El COD és un component del Corpus de Català Contemporani de la Universitat de Barcelona (CCCUB), un arxiu de corpus de llengua catalana oral contemporània que ha estat confegit pel grup de recerca Grup d'Estudi de la Variació (GEV) amb la finalitat de contribuir a l'estudi de la variació dialectal, social i funcional en la llengua catalana. Aquest i altres materials del CCCUB són accessibles directament al Dipòsit UB o a través del web del CCCUB (http://www.ub.edu/cccub).