38 resultados para Processamento de voz
em Lume - Repositório Digital da Universidade Federal do Rio Grande do Sul
Resumo:
Este trabalho foi realizado dentro da área de reconhecimento automático de voz (RAV). Atualmente, a maioria dos sistemas de RAV é baseada nos modelos ocultos de Markov (HMMs) [GOM 99] [GOM 99b], quer utilizando-os exclusivamente, quer utilizando-os em conjunto com outras técnicas e constituindo sistemas híbridos. A abordagem estatística dos HMMs tem mostrado ser uma das mais poderosas ferramentas disponíveis para a modelagem acústica e temporal do sinal de voz. A melhora da taxa de reconhecimento exige algoritmos mais complexos [RAV 96]. O aumento do tamanho do vocabulário ou do número de locutores exige um processamento computacional adicional. Certas aplicações, como a verificação de locutor ou o reconhecimento de diálogo podem exigir processamento em tempo real [DOD 85] [MAM 96]. Outras aplicações tais como brinquedos ou máquinas portáveis ainda podem agregar o requisito de portabilidade, e de baixo consumo, além de um sistema fisicamente compacto. Tais necessidades exigem uma solução em hardware. O presente trabalho propõe a implementação de um sistema de RAV utilizando hardware baseado em FPGAs (Field Programmable Gate Arrays) e otimizando os algoritmos que se utilizam no RAV. Foi feito um estudo dos sistemas de RAV e das técnicas que a maioria dos sistemas utiliza em cada etapa que os conforma. Deu-se especial ênfase aos Modelos Ocultos de Markov, seus algoritmos de cálculo de probabilidades, de treinamento e de decodificação de estados, e sua aplicação nos sistemas de RAV. Foi realizado um estudo comparativo dos sistemas em hardware, produzidos por outros centros de pesquisa, identificando algumas das suas características mais relevantes. Foi implementado um modelo de software, descrito neste trabalho, utilizado para validar os algoritmos de RAV e auxiliar na especificação em hardware. Um conjunto de funções digitais implementadas em FPGA, necessárias para o desenvolvimento de sistemas de RAV é descrito. Foram realizadas algumas modificações nos algoritmos de RAV para facilitar a implementação digital dos mesmos. A conexão, entre as funções digitais projetadas, para a implementação de um sistema de reconhecimento de palavras isoladas é aqui apresentado. A implementação em FPGA da etapa de pré-processamento, que inclui a pré-ênfase, janelamento e extração de características, e a implementação da etapa de reconhecimento são apresentadas finalmente neste trabalho.
Resumo:
Este trabalho relata o desenvolvimento de uma aplicação capaz de reconhecer um vocabulário restrito de comandos de direcionamento pronunciados de forma isolada e independentes do locutor. Os métodos utilizados para efetivar o reconhecimento foram: técnicas clássicas de processamento de sinais e redes neurais artificiais. No processamento de sinais visou-se o pré-processamento das amostras para obtenção dos coeficientes cepstrais. Enquanto que para o treinamento e classificação foram utilizadas duas redes neurais distintas, as redes: Backpropagation e Fuzzy ARTMAP. Diversas amostras foram coletadas de diferentes usuários no sentido de compor um banco de dados flexível para o aprendizado das redes neurais, que garantisse uma representação satisfatória da grande variabilidade que apresentam as pronúncias entre as vozes dos usuários. Com a aplicação de tais técnicas, o reconhecimento demostrou-se eficaz, distinguindo cada um dos comandos com bons índices de acerto, uma vez que o sistema é independente do locutor.
Resumo:
Este trabalho apresenta a voz de adolescentes em conflito com a lei vinculados ao “Programa de Prestação de Serviços à Comunidade da Universidade Federal do Rio Grande do Sul” e objetiva compreender o processo que os levou à prática de atos infracionais. Para tanto, privilegiou-se o contato com jovens do gênero masculino que possuem envolvimento com o mundo do crime, pertencentes às classes populares, situados na faixa etária dos 12 aos 21 anos. Buscou-se analisar e entender a forma de ser desses sujeitos, a partir do estudo de suas relações interpessoais, sociais, afetivas e seu nível cognitivo, levando-se sempre em consideração as problemáticas mais evidenciadas, a recorrência de fatos e a repetição de informações.
Resumo:
Sete ocorrências auriferas estão inseridas na Seqüência Campestre do Complexo Bossoroca, no Escudo Sul-rio-grandense, municípios de São Sepé, no Estado do Rio Grande do Sul. Nessa região, foi realizado um aerolevantamento geofisico no qual foram coletados dados magnetométricos e aerogamaespectrométricos (K, U, Th e contagem total), em convênio finnado entre órgãos federais brasileiros (CPRM, DNPM e CNEN) e a empresa canadense Texas Instruments no período 1972-1973. Nessa dissertação são apresentados as interpretações e resultados dos dados e a metodologia utilizada para a interpretação das principais estruturas magnéticas e radiométricas visando aplicação na exploração mineral de ouro. Esse tipo de processamento, correlacionado aos dados geológicos, é uma prática usual de campanhas de prospecção mineral desde 1940 e é considerada como uma ferramenta de grande potencial para esse propósito. O processamento de dados magnetométricos forneceu mapas de primeira e segunda derivadas verticais, sinal analítico, gradiente horizontal, integral vertical, continuação para cima (1000, 2000 e 3000 metros) e seus principais lineamentos do campo magnético residual. Os dados foram tratados e posterionnente transfonnados em mapas de contorno e imagens pseudocoloridos e em tons de cinza com relevo sombreado (iluminação N, NE e SE) para realçar os principais lineamentos. Os mapas produzidos a partir dos dados aerogamaespectrométricos foram os de contagem total, K, U e Th, suas razões Th/K, U/K e UITh; mapas temários nos padrões RGB e CMY, potássio e urânio anômalos e parfunetro F, também foram transfonnados em mapas de contorno, pseudocolridos e tons de cinza com relevo sombreado (iluminação a N, NE e SE) e um mapa geológico interpretativo da região do Complexo Bossoroca As imagens magnetométricas mostraram-se importantes na caracterização estrutural regional, possibilitando a identificação de lineamentos NE-SW e NW-SE, não mapeados anterionnente e que podem estar relacionadas diretamente às ocorrências auriferas da região do Complexo Bossoroca. A aplicação das técnicas de processamento e interpretação de estruturas magnéticas por meio dos filtros como gradiente horizontal, primeira e segunda derivada, sinal analítico, continuação para cima, possibilitaram a determinação de descontinnidades fisicas que podem ser traduzidas em estruturas geológicas. O processamento de dados aerogamaespectrométricos possibilitou a caracterização de unidades geológicas regionais, a identificação de possíveis trends e zonas anômalas em potássio, relacionadas com as principais ocorrências auriferas da região. As imagens ternárias nos padrões RGB e CMY pennitiram a distinção e a caracterização das grandes unidades geológicas. Pode-se individualizar três regiões principais dentro da Seqüência Campestre, não mapeadas anterionnente, onde se encontram as ocorrências auriferas.
Resumo:
A partir de uma amostra de 30 radiografias mesiorradiais prémolares superiores, contendo um instrumento endodôntico em cada um de seus condutos, obtidas com a finalidade de odontometria, foi avaliado se a manipulação digital pela aplicação de filtros grráficos de inversão, pseudocolorização e relevo, favorece ou não a localização do ápice radiográfico.As imagens convencionais foram digitalizadas através de scanner em 300 dpi e 256 tons de cinca, tamanho original e ajuste automático de brilho e contraste, reproduzidas três vezes e submetidas aos filtros gráficos. Uma seqüência aleatória de todas as imagens foi apresentada em monitor, em condições padronizadas de visualização, a um observador habituado à utilização de imagens digitais que, através de régua eletrônica da barra de ferramentas do programa PhotoshopR, efetuou a medida da distância entre a borda superior da imagem e o limite apical para ambas as raízes, três vezes em oportunidades distintas. As quatro imagens de cada dente foram montadas em apresentação do programa PowerPointR e exibidas, com os mesmos critérios de padronização, para três observadores especialistas em endodontia, os quais qualitativamente em qual delas o limite apical de cada raiz era melhor visualizado. Através dos resultados do teste não-paramétrico de Friedman verificou-se que os valores médios para as imagens manipuladas não diferem significativamente daqueles obtidos sobre a imagem (p=0,001), onde se observa o maior coeficiente de variação. A imagem e sua versão em negativo foram classificadas como as melhores de forma mais consistente. A modalidade pseudocores e relevo receberam os piores escores, porém não de modo consistente.
Resumo:
Este estudo tem como objetivo analisar os recursos vocais utilizados nos telejornais como coadjuvantes de efeitos de sentido pretendidos com a divulgação da notícia. Os recursos vocais estudados foram a média e a variação da freqüência vocal em enunciados proferidos por apresentadores de telejornais brasileiros. Foram analisados 43 enunciados, de 12 apresentadores (6 homens e 6 mulheres), de 6 telejornais, abrangendo 3 redes de televisão. Os enunciados foram classificados em 2 tipos de notícias: positivas e negativas. Na análise descritiva contextualizada foram analisadas também chamadas e editoriais, descrevendo-se as estratégias vocais pertinentes a cada contexto. Para uma melhor clareza deste estudo, foram utilizados como procedimentos estatísticos tabelas e gráficos da média das freqüências médias encontradas e a média da variação. Foi realizada análise acústica computadorizada da freqüência média e variação de cada enunciado e a análise descritiva contextualizada de 18 desses enunciados. O quadro teórico básico deste trabalho integra elementos da teoria semiótica francesa, da fonoaudiologia e alguns aspectos da retórica. Buscou-se descrever, através dos pressupostos das três áreas, o discurso dos telejornais demonstrando sua estratégia de construção de verdade, os procedimentos utilizados neste fazer e o papel da voz neste processo. Os resultados confirmam a presença da relação voz e efeitos de sentido nos telejornais. Nas notícias positivas, houve um aumento da média das freqüências, já nas negativas houve um decréscimo, tanto nos homens como nas mulheres. A variação das médias das freqüências foi mais significante nas locuções das mulheres. Conclui-se que a voz tem um papel importante como estratégia de persuasão na busca de credibilidade da notícia e é largamente utilizada pelos apresentadores de telejornais.
Resumo:
Esta dissertação enfoca a relação entre gestão e estratégia numa autarquia voltada para o saneamento básico. O aspecto relevante do tema relaciona-se com a importância que tem o bom funcionamento desse tipo de organização para a melhoria de qualidade de vida de uma sociedade. Através de entrevistas em profundidade, levadas a efeito com os ex-Diretores da organização estudada, buscou-se determinar a estratégia dominante e seu modo de formação, bem como os principais papéis gerenciais exercidos no período de gestão enfocado pela pesquisa, na perspectiva do pensamento de Henry Mintzberg. A pesquisa revelou que a principal estratégia da organização é a gestática. A organização estudada consegue um bom desempenho no cumprimento de sua missão em decorrência de uma gestão inspirada na sua estratégia principal, levando-a a apresentar características de empresa privada, mas sem perder seu sentido de empresa voltada para o interesse público. Chegou-se à conclusão de que gestão é o meio pelo qual uma organização consegue infundir energia a uma estratégia, e estratégia é o meio pelo qual a gestão sinaliza a uma organização para onde deve dirigir suas energias. A organização enfocada é o Departamento Municipal de Água e Esgoto - DMAE, situado em Porto Alegre, fundado em 15 dezembro de 1961.
Resumo:
Neste trabalho foi desenvolvida uma câmara de alta pressão com janela de safira para processamento de filmes finos com pulsos de laser de alta potência, num regime de resfriamento ultra-rápido e geometria confinada. As amostras estudadas consistiram de filmes finos de carbono amorfo depositados sobre substratos de cobre. Os processamentos foram realizados com um laser pulsado Nd:YAG com energia de até 500 mJ por pulso, com duração de 8 ns, focalizada numa região de cerca de 1,5mm2, gerando uma região de elevada temperatura na superfície da amostra durante um intervalo de tempo bastante curto, da ordem do tempo de duração do pulso do laser. Para evitar a evaporação do filme de carbono, aplicava-se através da câmara, uma pressão de 0,5 a 1,0 GPa, confinando a amostra e eliminando o efeito da ablação. Este sistema tornou possível produzir taxas de resfriamento extremamente elevadas, com supressão da formação de uma pluma durante a incidência do laser, sendo o calor dissipado rapidamente pelo contato com os substratos de cobre e safira, ambos com elevada condutividade térmica. As amostras processadas foram analisadas por micro-espectroscopia Raman e os resultados revelaram a formação de estruturas com cadeias lineares de carbono, “carbynes”, caracterizadas pela presença de um pico Raman intenso na região de 2150 cm-1. Outro conjunto de picos Raman foi observado em 996 cm-1, 1116 cm-1 e 1498 cm-1 quando o filme fino de carbono amorfo foi processado dentro da câmara, com uma seqüência de mais de três pulsos consecutivos de laser. Várias tentativas foram feitas para investigar a natureza da fase que origina estes picos. Apesar da similaridade com o espectro Raman correspondente ao poliacetileno (CnHn), não foi possível constatar evidências experimentais sobre a presença de hidrogênio nos filmes de carbono processados. Estes picos Raman não foram observados quando o filme de carbono era depositado sobre outros substratos metálicos, a não ser em cobre. O conjunto de resultados experimentais obtidos indica que estes picos estariam relacionados a pequenos aglomerados lineares de átomos de carbono, diluídos numa matriz de átomos de cobre, formados durante os pulsos subseqüentes de laser e retidos durante o resfriamento ultra-rápido da amostra. A comparação dos resultados experimentais com a simulação do espectro Raman para diferentes configurações, permite propor que estes aglomerados seriam pequenas cadeias lineares, com poucos átomos, estabilizadas frente à formação de grafenos pela presença de átomos de cobre em abundância. Foram também realizados processamentos de materiais carbonáceos por pulsos de laser em meios líquidos, através de câmaras especialmente construídas para este fim. Os resultados, em diversos materiais e configurações, mostraram apenas a formação de estruturas grafíticas, sem evidência de outras fases.
Resumo:
(João Quevedo - Estudo do Processamento das Memórias de Curta e Longa Duração) - Este trabalho apresenta a compilação dos 4 principais experimentos carreados ao longo de 1999-2002: 3 deles envolvem o modelo animal e um quarto utilizase de voluntários humanos. Entretanto, o uso desses diferentes paradigmas não prejudica a unidade do conjunto. O Capítulo 1 apresenta sucintamente o marco teórico dos 4 trabalhos. Inicialmente são discutidos aspectos modulatórios da consolidação da memória. Após, alguns elementos da bioquímica da consolidação da memória são apresentados no intuito de permitir establecer um entendimento das vias da PKA e da MAPK e suas correlações com a via final comum – a síntese protéica. Adicionalmente, a dissociação STM e LTM é discutida a partir do referencial farmacológico. Uma última unidade apresenta conceitos primitivos do papel da amígdala na modulação da memória e das evidências da implicação das emoções, via amígdala, na modulação da memória em humanos. Os experimentos utilizando a esquiva inibitória como paradigma e o rato como sujeito ocupam os Capítulos 2, 3 e 4. No Capítulo 2 é apresentado um corpo de resultados que permite observar uma dissecção farmacológica da STM e LTM. Os dados demonstram um envolvimento de fenômenos dependentes de PKA em ambas STM e LTM, dependentes de MAPK apenas na STM, e dependentes de síntese protéica apenas na LTM. O Capítulo 3 apresenta um trabalho realizado em colaboração com o Prof. Steven P. R. Rose (Open University, UK), que envolve a determinação dos momentos sensíveis à inibição da síntese protéica na consolidação da LTM. Foram observados dois momentos: um inicial, junto ao treino, e um tardio apos 3h. Além disso, foi possível demonstrar que um treino prévio de baixa intensidade, mas não a pré-exposição ao aparato, pode impedir o estabelecimento de amnésia induzida pelo bloqueio da síntese protéica. O Capítulo 4 estende os achados com anisomicina observados no Capítulo 3, estudando também o inibidor da PKA, Rp-cAMPs, e o inibidor da MAPKK, PD 098059. Os dados obtidos confirmam também para essas cascatas a indução em um treino prévio de baixa intensidade de algum fenômeno celular de longa duração que torna o aprendizado de um segundo treino independente de PKA, MAPK ou síntese protéica. O estudo da dissociação da STM e LTM foi ampliado, agora no modelo humano, no experimento descrito no Capítulo 6. Nesse experimento, observamos uma clara influência do conteúdo emocional na LTM, mas a ausência desse efeito na STM. A discussão geral (Capítulo 7) busca integrar esses achados descritos nos capítulos anteriores dentro da nova perspectiva molecular da neurobiologia da memória. Além disso, abre discussão acerca de possíveis novas possibilidades de pesquisa.
Resumo:
A identificação e o monitoramento de microorganismos aquáticos, como bactérias e microalgas, tem sido uma tarefa árdua e morosa. Técnicas convencionais, com uso de microscópios e corantes, são complexas, exigindo um grande esforço por parte dos técnicos e pesquisadores. Uma das maiores dificuldades nos processos convencionais de identificação via microscopia é o elevado número de diferentes espécies e variantes existentes nos ambientes aquáticos, muitas com semelhança de forma e textura. O presente trabalho tem por objetivo o desenvolvimento de uma metodologia para a caracterização e classificação de microorganismos aquáticos (bactérias e microalgas), bem como a determinação de características cinemáticas, através do estudo da mobilidade de microalgas que possuem estruturas que permitem a natação (flagelos). Para caracterização e reconhecimento de padrões as metodologias empregadas foram: o processamento digital de imagens e redes neurais artificiais (RNA). Para a determinação da mobilidade dos microorganismos foram empregadas técnicas de velocimetria por processamento de imagens de partículas em movimento (Particle Tracking Velocimetry - PTV). O trabalho está dividido em duas partes: 1) caracterização e contagem de microalgas e bactérias aquáticas em amostras e 2) medição da velocidade de movimentação das microalgas em lâminas de microscópio. A primeira parte envolve a aquisição e processamento digital de imagens de microalgas, a partir de um microscópio ótico, sua caracterização e determinação da densidade de cada espécie contida em amostras. Por meio de um microscópio epifluorescente, foi possível, ainda, acompanhar o crescimento de bactérias aquáticas e efetuar a sua medição por operadores morfológicos. A segunda parte constitui-se na medição da velocidade de movimentação de microalgas, cujo parâmetro pode ser utilizado como um indicador para se avaliar o efeito de substâncias tóxicas ou fatores de estresse sobre as microalgas. O trabalho em desenvolvimento contribuirá para o projeto "Produção do Camarão Marinho Penaeus Paulensis no Sul do Brasil: Cultivo em estruturas Alternativas" em andamento na Estação Marinha de Aquacultura - EMA e para pesquisas no Laboratório de Ecologia do Fitoplâncton e de Microorganismos Marinhos do Departamento de Oceanografia da FURG. O trabalho propõe a utilização dos níveis de intensidade da imagem em padrão RGB e oito grandezas geométricas como características para reconhecimento de padrões das microalgas O conjunto proposto de características das microalgas, do ponto de vista de grandezas geométricas e da cor (nível de intensidade da imagem e transformadas Fourier e Radon), levou à geração de indicadores que permitiram o reconhecimento de padrões. As redes neurais artificiais desenvolvidas com topologia de rede multinível totalmente conectada, supervisionada, e com algoritmo de retropropagação, atingiram as metas de erro máximo estipuladas entre os neurônios de saída desejados e os obtidos, permitindo a caracterização das microalgas.
Resumo:
A Descoberta de Conhecimento em Banco de Dados (DCBD) é uma nova área de pesquisa que envolve o processo de extração de conhecimento útil implícito em grandes bases de dados. Existem várias metodologias para a realização de um processo de DCBD cuja essência consiste basicamente nas fases de entendimento do domínio do problema, pré-processamento, mineração de dados e pós-processamento. Na literatura sobre o assunto existem muitos trabalhos a respeito de mineração de dados, porém pouco se encontra sobre o processo de pré-processamento. Assim, o objetivo deste trabalho consiste no estudo do pré-processamento, já que é a fase que consome a maior parte do tempo e esforço de todo o processo de DCBD pois envolve operações de entendimento, seleção, limpeza e transformação de dados. Muitas vezes, essas operações precisam ser repetidas de modo a aprimorar a qualidade dos dados e, conseqüentemente, melhorar também a acurácia e eficiência do processo de mineração. A estrutura do trabalho abrange cinco capítulos. Inicialmente, apresenta-se a introdução e motivação para trabalho, juntamente com os objetivos e a metodologia utilizada. No segundo capítulo são abordadas metodologias para o processo de DCBD destacando-se CRISP-DM e a proposta por Fayyad, Piatetsky-Shapiro e Smyth. No terceiro capítulo são apresentadas as sub-fases da fase de pré-processamento contemplando-se entendimento, seleção, limpeza e transformação de dados, bem como os principais métodos e técnicas relacionados às mesmas. Já no quarto capítulo são descritos os experimentos realizados sobre uma base de dados real. Finalmente, no quinto capítulo são apresentadas as considerações finais sobre pré-processamento no processo de DCBD, apontando as dificuldades encontradas na prática, contribuições do presente trabalho e pretensões da continuidade do mesmo. Considera-se como principais contribuições deste trabalho a apresentação de métodos e técnicas de pré-processamento existentes, a comprovação da importância da interatividade com o especialista do domínio ao longo de todo o processo de DCBD, mas principalmente nas tomadas de decisões da fase de pré-processamento, bem como as sugestões de como realizar um pré-processamento sobre uma base de dados real.
Resumo:
O rápido avanço tecnológico coloca a tecnologia do Si diante de um grande desafio: substituir o dielétrico de porta utilizado por mais de 40 anos em dispositivos MOSFET (transistor de efeito de campo metal-óxido-semicondutor), o óxido de silício (SiO2), por um material alternativo com maior constante dielétrica. Nesse contexto, vários materiais têm sido investigados. Nesta tese concentramos nossa atenção em três candidatos: o óxido de alumínio (Al2O3), o silicato de zircônio (ZrSixOy) e o aluminato de zircônio (ZrAlxOy). Nossos resultados experimentais baseiam-se em técnicas de análise com feixes de íons ou raios-X e de microscopia de força atômica. No caso do Al2O3, investigamos a difusão e reação de oxigênio através de filmes relativamente espessos (35 nm) quando submetidos a tratamento térmico em atmosfera oxidante, e os efeitos que esses processos provocam em filmes finos (6,5 nm) de Al2O3 depositados sobre uma estrutura SiO2/Si. Observamos que o processo de difusão-reação em filmes de Al2O3 é diferente do observado em filmes de SiO2: no primeiro caso, oxigênio difunde e incorpora-se em todo o volume do filme, enquanto que em filmes de SiO2, oxigênio difunde através do filme, sem incorporar-se em seu volume, em direção à interface SiO2/Si, onde reage. Além disso, quando oxigênio atinge a interface Al2O3/Si e reage com o Si, além da formação de SiO2, parte do Si migra em direção ao Al2O3, deslocando parte dos átomos de Al e de O. Modelos baseados em difusão e reação foram capazes de descrever qualitativamente os resultados experimentais em ambos os casos. A deposição de filmes de Al2O3 sobre Si por deposição química de camada atômica a partir de vapor também foi investigada, e uma nova rotina de deposição baseada em préexposição dos substratos de Si ao precursor de Al foi proposta. As estruturas ZrSixOy/Si e ZrAlxOy/Si (ligas pseudobinárias (ZrO2)z(SiO2)1-z e (ZrO2)z(Al2O3)1-z depositadas sobre Si) foram submetidas a tratamentos térmicos em oxigênio ou vácuo com o objetivo de investigar possíveis instabilidades. Os tratamentos térmicos não provocaram instabilidades na distribuição de Zr, mas migração e incorporação de Si no filme dielétrico foram observadas durante os dois tratamentos para ambos os materiais.