Ressonância magnética em estudos de produção de fala


Autoria(s): Martins, Paula Maria Vaz
Contribuinte(s)

Teixeira, António Joaquim da Silva

Data(s)

22/01/2015

01/06/2014

Resumo

Estudar os mecanismos subjacentes à produção de fala é uma tarefa complexa e exigente, requerendo a obtenção de dados mediante a utilização de variadas técnicas, onde se incluem algumas modalidades imagiológicas. De entre estas, a Ressonância Magnética (RM) tem ganho algum destaque, nos últimos anos, posicionando-se como uma das mais promissoras no domínio da produção de fala. Um importante contributo deste trabalho prende-se com a otimização e implementação de protocolos (RM) e proposta de estratégias de processamento de imagem ajustados aos requisitos da produção de fala, em geral, e às especificidades dos diferentes sons. Para além disso, motivados pela escassez de dados para o Português Europeu (PE), constitui-se como objetivo a obtenção de dados articulatórios que permitam complementar informação já existente e clarificar algumas questões relativas à produção dos sons do PE (nomeadamente, consoantes laterais e vogais nasais). Assim, para as consoantes laterais foram obtidas imagens RM (2D e 3D), através de produções sustidas, com recurso a uma sequência Eco de Gradiente (EG) rápida (3D VIBE), no plano sagital, englobando todo o trato vocal. O corpus, adquirido por sete falantes, contemplou diferentes posições silábicas e contextos vocálicos. Para as vogais nasais, foram adquiridas, em três falantes, imagens em tempo real com uma sequência EG - Spoiled (TurboFLASH), nos planos sagital e coronal, obtendo-se uma resolução temporal de 72 ms (14 frames/s). Foi efetuada aquisição sincronizada das imagens com o sinal acústico mediante utilização de um microfone ótico. Para o processamento e análise de imagem foram utilizados vários algoritmos semiautomáticos. O tratamento e análise dos dados permitiu efetuar uma descrição articulatória das consoantes laterais, ancorada em dados qualitativos (e.g., visualizações 3D, comparação de contornos) e quantitativos que incluem áreas, funções de área do trato vocal, extensão e área das passagens laterais, avaliação de efeitos contextuais e posicionais, etc. No que respeita à velarização da lateral alveolar /l/, os resultados apontam para um /l/ velarizado independentemente da sua posição silábica. Relativamente ao /L/, em relação ao qual a informação disponível era escassa, foi possível verificar que a sua articulação é bastante mais anteriorizada do que tradicionalmente descrito e também mais extensa do que a da lateral alveolar. A resolução temporal de 72 ms conseguida com as aquisições de RM em tempo real, revelou-se adequada para o estudo das características dinâmicas das vogais nasais, nomeadamente, aspetos como a duração do gesto velar, gesto oral, coordenação entre gestos, etc. complementando e corroborando resultados, já existentes para o PE, obtidos com recurso a outras técnicas instrumentais. Para além disso, foram obtidos novos dados de produção relevantes para melhor compreensão da nasalidade (variação área nasal/oral no tempo, proporção nasal/oral). Neste estudo, fica patente a versatilidade e potencial da RM para o estudo da produção de fala, com contributos claros e importantes para um melhor conhecimento da articulação do Português, para a evolução de modelos de síntese de voz, de base articulatória, e para aplicação futura em áreas mais clínicas (e.g., perturbações da fala).

The study of the mechanisms underlying speech production is a complex and demanding task that requires data gathered using different techniques and including image acquisition. Among the different imaging modalities used, Magnetic Resonance Imaging (MRI) assumed an important role, in recent years, positioning itself as one of the most promising techniques and providing a wealth of information concerning speech production. An important contribution of this research is the optimization and implementation of MRI protocols and the proposal of adequate image processing techniques that can meet the requirements imposed by speech production and the specificities of different sounds. Additionally, motivated by the scarcity of data for European Portuguese (EP), image acquisitions were performed to gather articulatory data to complement and clarify previous information relating to the production of EP sounds (namely, lateral consonants and nasal vowels). For lateral consonants, MR images encompassing the entire vocal tract (VT), both in the midsagittal plane and in 3D, were acquired, during sustained productions, using a spoiled Gradient Echo (GE) sequence - 3D VIBE. The corpus, obtained for seven EP speakers, considered the lateral consonants in different syllabic contexts and syllable positions. For nasal vowels a corpus considering different syllabic positions and contexts was acquired, for three speakers, using Real-time MRI (RT- MRI) images by means of a GE - spoiled (TurboFLASH) sequence, obtained in the sagittal and coronal planes, with a temporal resolution of 72 ms (14 frames/s). A synchronized audio signal was acquired, inside the MR scanner using a fiberoptic microphone. Data processing and analysis was achieved using several semi-automatic algorithms. Analysis of the acquired data allowed a detailed articulatory description of the lateral consonants anchored in both qualitative (e.g., 3D visualization, contour comparison) and quantitative data such as, vocal tract area functions, extension and area of lateral channels and evaluation of positional and contextual effects. Specifically, for the alveolar lateral /l/, as regards velarization, the gathered data points to a variety regardless of its syllabic position. For the /L/, in respect of which the information is very scarce, evidence shows the articulation is far more fronted than traditionally described and more extensive than that observed for the alveolar lateral. The temporal resolution of 72 ms, achieved with RT- MRI acquisitions, proved to be suitable to address the study of dynamic characteristics of nasal vowels, namely velar and oral gestures, temporal coordination between gestures and durational aspects, complementing existing data for the EP, obtained using other instrumental techniques. In addition, new relevant data were attained providing additional contributions for a deep knowledge of nasality (e.g., nasal/oral areas over time, nasal/oral proportion). The work presented demonstrates the versatility and potential of MRI when applied to speech production studies and provides important contributions to a better understanding of the articulation of EP, to the development of models supporting the improvement of articulatory based speech synthesis and to future applications in clinical areas (e.g., speech disorders).

Doutoramento em Ciências e Tecnologias da Saúde

Identificador

http://hdl.handle.net/10773/13258

101285230

Idioma(s)

por

Publicador

Universidade de Aveiro

Relação

FCT - SFRH/BD/65183 /2009

QREN Portugal 2007-2013

Fundo Social Europeu

MCTES

Direitos

restrictedAccess

Palavras-Chave #Ciências da saúde #Produção da fala #Diagnóstico por imagem #Ressonância magnética #Ressonância Magnética #Imagem volumétrica #Tempo Real #Produção de Fala #Português Europeu #Laterais #Vogais nasais
Tipo

doctoralThesis