27 resultados para Português Arcaico
em Universidade Federal do Pará
Resumo:
O processamento de voz tornou-se uma tecnologia cada vez mais baseada na modelagem automática de vasta quantidade de dados. Desta forma, o sucesso das pesquisas nesta área está diretamente ligado a existência de corpora de domínio público e outros recursos específicos, tal como um dicionário fonético. No Brasil, ao contrário do que acontece para a língua inglesa, por exemplo, não existe atualmente em domínio público um sistema de Reconhecimento Automático de Voz (RAV) para o Português Brasileiro com suporte a grandes vocabulários. Frente a este cenário, o trabalho tem como principal objetivo discutir esforços dentro da iniciativa FalaBrasil [1], criada pelo Laboratório de Processamento de Sinais (LaPS) da UFPA, apresentando pesquisas e softwares na área de RAV para o Português do Brasil. Mais especificamente, o presente trabalho discute a implementação de um sistema de reconhecimento de voz com suporte a grandes vocabulários para o Português do Brasil, utilizando a ferramenta HTK baseada em modelo oculto de Markov (HMM) e a criação de um módulo de conversão grafema-fone, utilizando técnicas de aprendizado de máquina.
Resumo:
A fala apresenta aspectos paralinguísticos que não pertencem ao código linguístico convencional, mas contribuem significativamente para a unidade temática do discurso, Essas realizações se constituem em enunciados não-lexicalizados que funcionam que funcionam como atos de fala completos nas interações comunicativas interpessoais. Sobre essas emissões não-verbais, Campbell (2002a, 2002b, 2003 e 2004), Maekawa (2004), Fujie et. al (2004), Hoult (2004), Key (1958) apud Steimberg (1988) postulam que elas constribuem para a manifestação da fala expressiva. Para os autores, é justamente o fenômeno da paralinguagem que sinaliza informações sobre atitudes, opiniões e emoções do falante em relação ao interlocutor ou ao tópico discursivo. Nesse sentido, investigamos, neste trabalho, as manifestações paralinguísticas recorrentes em conversas informais para demonstrarmos seu papel expressivo na linguagem falada. Para tanto, fizemos um levantamento de 450 ocorrências de elementos paralinguísticos no processo de transcrição de amostras de falas do Português Regional Paraense produzidas em situações reais de conversação. Pressupondo que essas realizações não-verbais são caracterizadas por variações prosódicas, nós as submetemos a uma análise fonética por meio do software PRAAT. A partir dessa análise, constatamos a contribuição de duas propriedades: a frequência fundamental (F0) e o tempo de emissão, para a manifestação expressiva dos elementos paralinguísticos no discurso falado. Além disso, identificamos também a silabação como uma propriedade comum às realizações sonoras focalizadas. Após o processo de análise, fizemos a descrição do uso e do funcionamento desses elementos nas conversas, bem como da contribuição deles para a manifestação da fala expressiva. Os resultados nos mostram que os elementos paralinguísticos, além de contribuírem para a fluência do discurso falado, desempenham a função de sinalizar compreensão, interesse e/ou atenção, gerenciar relações interpessoais e expressar emoções, atitudes e afeto.
Resumo:
Nos anos 80, a crise vivenciada pela escola pública, materializada no aumento da repetência e da evasão escolar, teve como conseqüência uma maior conscientização por parte dos estudiosos da área de educação em relação à necessidade de melhorar o processo de ensino/aprendizagem. Na área da avaliação escolar, essa crise, dentre outros problemas, fez com que os estudiosos dessa área criticassem o tipo de avaliação exclusivamente somativa, predominante nas práticas avaliativas tradicionais, e valorizassem a avaliação de cunho mais formativo. Surgiram então numerosas propostas de transformação das práticas avaliativas, dentre elas a avaliação autêntica, a democrática, a dialógica, a formativo-reguladora, a mediadora, a avaliação para conhecer e a participativa, geralmente pouco ou nada específicas no que tange ao ensino de línguas. A aparente multiplicidade de concepções avaliativas e as dificuldades que essa variedade suscita para o professor de português língua materna por si só justificam que seja empreendido um estudo no sentido de oferecer a este profissional melhor clareza conceitual e condições para integrar reflexão em língua e reflexões em avaliação. O objetivo deste trabalho é contribuir para melhor conhecer as noções que envolvem a concepção formativa de avaliação com vistas à integração de concepções mais atuais de avaliação no processo de ensino/aprendizagem de português língua materna, condição sine qua non para a renovação efetiva dessa área. A hipótese centra-se na idéia de que por trás dessas diferentes propostas, expostas nas modalidades de avaliação apresentadas pelas obras do corpus, há características que se interseccionam, ligando essas modalidades de avaliação entre si e à concepção formativa de avaliação. Essa pesquisa fundamenta-se, por um lado, nas concepções formativa e formadora de avaliação da aprendizagem1 (NUNZIATI, 1990; ALLAL, BAIN & PERRENOUD, 1993; BONNIOL & VIAL, 2001), bem como nos estudos sobre autoavaliação e autorregulação da aprendizagem (ALLAL, 1993; PERRENOUD, 1993; PARIS & AYRES, 2000), e por outro, nas concepções que influenciam o ensino/aprendizagem do português, como as concepções de linguagem e as concepções de ensino/aprendizagem de línguas (GERALDI, 1984; BERTOCHINI & CONSTANZO, 1989; SOARES, 1998). Este estudo foi realizado por meio de uma pesquisa bibliográfica, tendo como corpus obras impressas e acessíveis aos profissionais de educação brasileiros, as quais apresentam modalidades de avaliação que respondam ao critério principal de se apresentarem como uma alternativa à avaliação tradicional, favorecendo o processo de aprendizagem. Esta pesquisa aponta o desenvolvimento das competências avaliativas como meio de ampliação das competências discursivas e a avaliação formativa a serviço da aprendizagem da língua materna.
Resumo:
Descreve a implementação de um software de reconhecimento de voz para o Português Brasileiro. Dentre os objetivos do trabalho tem-se a construção de um sistema de voz contínua para grandes vocabulários, apto a ser usado em aplicações em tempo-real. São apresentados os principais conceitos e características de tais sistemas, além de todos os passos necessários para construção. Como parte desse trabalho foram produzidos e disponibilizados vários recursos: modelos acústicos e de linguagem, novos corpora de voz e texto. O corpus de texto vem sendo construído através da extração e formatação automática de textos de jornais na Internet. Além disso, foram produzidos dois corpora de voz, um baseado em audiobooks e outro produzido especificamente para simular testes em tempo-real. O trabalho também propõe a utilização de técnicas de adaptação de locutor para resolução de problemas de descasamento acústico entre corpora de voz. Por último, é apresentada uma interface de programação de aplicativos que busca facilitar a utilização do decodificador Julius. Testes de desempenho são apresentados, comparando os sistemas desenvolvidos e um software comercial.
Resumo:
Sistema Texto-Fala (TTS) é atualmente uma tecnologia madura que é utilizada em muitas aplicações. Alguns módulos de um sistema TTS são dependentes do idioma e, enquanto existem muitos recursos disponíveis para a língua inglesa, os recursos para alguns idiomas ainda são limitados. Este trabalho descreve o desenvolvimento de um sistema TTS completo para português brasileiro (PB), o qual também apresenta os recursos já disponíveis. O sistema usa a plataforma MARY e o processo de síntese da voz é baseado em cadeias escondidas de Markov (HMM). Algumas das contribuições deste trabalho consistem na implementação de silabação, determinação da sílaba tônica e conversão grafema-fonema (G2P). O trabalho também descreve as etapas para a organização dos recursos desenvolvidos e a criação de uma voz em PB junto ao MARY. Estes recursos estão disponíveis e facilita a pesquisa na normalização de texto e síntese baseada em HMM par o PB.
Resumo:
Este trabalho tem por objetivo apresentar os resultados de um estudo sobre a simplificação do ditongo decrescente /ej/ no português falado no Estado do Pará, localizado ao Norte do Brasil, com base nos pressupostos teórico-metodológicos da Sociolingüística Variacionista e da Geografia Linguística. Trata-se, portanto, de uma abordagem Geo-Sociolingüística, a qual relaciona fenômenos lingüísticos a comportamentos sociológicos e geográficos, que impõem e são impostos por normas específicas nas mais diversas manifestações da vida em sociedade. O corpus que se utilizou para a análise foi levantado a partir de questionários do Projeto Atlas Lingüístico do Brasil (ALiB), e está composto de entrevistas aplicadas a informantes previamente selecionados por meio de critérios também definidos a priori. Foram utilizados três questionários – QFF (Questionário Fonético-Fonológico), QSL (Questionário Semântico-Lexical) e QMS (Questionário Morfossintático) – além de perguntas sobre questões de pragmática, discurso semi-dirigido e texto reproduzido via leitura. Todo esse material foi elaborado pela equipe do projeto ALiB e aplicado por diretores científicos e suas respectivas equipes. Abrange a transcrição grafemática de todo o corpus e fonética do QSL e QFF, além da triagem dos itens lexicais continentes do ditongo supracitado que o corpus apresentou, para que estes pudessem ser submetidos à análise probabilística do programa computacional VARBRUL. Obtidos os resultados estatísticos, buscou-se interpretar os dados à luz das pesquisas já apresentadas sobre a variável no Brasil, além daquelas que serviram de base às problematizações acerca do fenômeno em língua portuguesa. Com base nessa interpretação, verificamos que, do ponto de vista lingüístico, o ditongo /ej/ apresenta restrições estruturais à sua realização plena; e que, do ponto de vista extralingüístico, há uma significativa distribuição dessas realizações no Estado ora pesquisado, que parece estar pautada em fatores dialetológicos, mas pouco relacionada a fatores sociais, exceto o fator escolaridade, que se mostrou relevante na aplicação da regra de monotongação ou na manutenção da semivogal do ditongo
Resumo:
Este trabalho tem como objetivo observar, descrever e analisar aspectos (inter)culturais em livros didáticos (LDs) de português para estrangeiros a fim de contribuir para o desenvolvimento de procedimentos didáticos-metodológicos suscetíveis de otimizar a aprendizagem da língua portuguesa. Foram analisados cinco livros didáticos de ensino do português para estrangeiros produzidos no Brasil. A metodologia utilizada é a análise de livros didáticos usando os parâmetros culturais propostos por Byram (1993) e os princípios interculturais propostos por Kramsch (1993). Os dados foram analisados tanto qualitativa como quantitativamente. Com relação à análise qualitativa, os referenciais (inter)culturais foram identificados e analisados tendo por base a adequação a uma abordagem de ensino que leve em conta a formação do aprendente em uma dimensão (inter)cultural. Existem várias atividades que podem levar os alunos a desenvolverem uma competência (inter)cultural. Com relação à análise quantitativa, existe certo desequilíbrio entre os livros didáticos, enquanto uns possuem considerável frequência de atividade com enfoque cultural, outros possuem fraca frequência. Conclui-se que os elementos (inter)culturais podem enriquecer o processo de ensino-aprendizagem de uma língua estrangeira – neste caso do português do Brasil – e colaborar para que o aprendente amplie sua percepção da realidade cultural de origem e estrangeira. Quanto mais diversificadas e relevantes forem as atividades em manuais de PLE, mais instrumentos os professores e alunos poderão ter a sua disposição para desenvolver a dimensão (inter)cultural no processo de ensino-aprendizagem.
Resumo:
Esta pesquisa investigou as atitudes de uma professora de língua portuguesa de uma escola pública e de seus alunos da 3ª etapa da Educação de Jovens e Adultos (EJA). Procurei observar indícios de comportamentos autônomos tanto por parte da professora quanto por parte dos alunos para verificar em que medida a professora colaboradora fazia a transferência da responsabilidade para o aprendente e como se dava este processo de transferência. Teoricamente, a compreensão da problemática baseia-se nos postulados sobre autonomia, em conformidade com Benson (2001), Dam (2003), Dickinson (1994), Melo (2007), Magno e Silva (2008), e nos Documentos Oficiais como os Parâmetros Curriculares Nacionais (1998). Os resultados apresentados apontam, nas atitudes dos sujeitos investigados, a parca preocupação com uma transferência de responsabilidades que poderia levar á autonomização dos alunos. Dessa forma este estudo abre a possibilidade de se pensar as práticas da sala de aula, enquanto espaço no qual o exercício da autonomia seria possível.
Resumo:
Este trabalho enfoca o processo de avaliação em português, no contexto escolar municipal da cidade de Belém, especificamente no Ciclo Básico II. Apresenta-se o projeto educacional denominado "Escola Cabana" que a Secretaria Municipal de Educação vem realizando desde 1997, em consonância com ideais políticos de formação cidadã e com uma concepção sócio-interacionista de aprendizagem. Este projeto inclui, como um de seus principais eixos, uma proposta de Avaliação Emancipatória, considerada essencial ao desenvolvimento pleno do educando. Com base em uma pesquisa bibliográfica e documental, assim como em uma pesquisa de campo, incluindo entrevistas com os professores e observação participativa, analisam-se as práticas de avaliação em português realizadas neste contexto, examinando que concepções de ensino/aprendizagem da língua materna permeiam a práxis dos professores e verificando de que modo essas concepções se coadunam com os pressupostos de uma Avaliação Emancipatória. Propõem-se, enfim, sugestões de atividades com vistas a uma intervenção didática integrando uma Avaliação Emancipatória com uma abordagem interacionista de ensino/aprendizagem do português.
Resumo:
A etiquetagem morfossintática é uma tarefa básica requerida por muitas aplicações de processamento de linguagem natural, tais como análise gramatical e tradução automática, e por aplicações de processamento de fala, por exemplo, síntese de fala. Essa tarefa consiste em etiquetar palavras em uma sentença com as suas categorias gramaticais. Apesar dessas aplicações requererem etiquetadores que demandem maior precisão, os etiquetadores do estado da arte ainda alcançam acurácia de 96 a 97%. Nesta tese, são investigados recursos de corpus e de software para o desenvolvimento de um etiquetador com acurácia superior à do estado da arte para o português brasileiro. Centrada em uma solução híbrida que combina etiquetagem probabilística com etiquetagem baseada em regras, a proposta de tese se concentra em um estudo exploratório sobre o método de etiquetagem, o tamanho, a qualidade, o conjunto de etiquetas e o gênero dos corpora de treinamento e teste, além de avaliar a desambiguização de palavras novas ou desconhecidas presentes nos textos a serem etiquetados. Quatro corpora foram usados nos experimentos: CETENFolha, Bosque CF 7.4, Mac-Morpho e Selva Científica. O modelo de etiquetagem proposto partiu do uso do método de aprendizado baseado em transformação(TBL) ao qual foram adicionadas três estratégias, combinadas em uma arquitetura que integra as saídas (textos etiquetados) de duas ferramentas de uso livre, o TreeTagger e o -TBL, com os módulos adicionados ao modelo. No modelo de etiquetador treinado com o corpus Mac-Morpho, de gênero jornalístico, foram obtidas taxas de acurácia de 98,05% na etiquetagem de textos do Mac-Morpho e 98,27% em textos do Bosque CF 7.4, ambos de gênero jornalístico. Avaliou-se também o desempenho do modelo de etiquetador híbrido proposto na etiquetagem de textos do corpus Selva Científica, de gênero científico. Foram identificadas necessidades de ajustes no etiquetador e nos corpora e, como resultado, foram alcançadas taxas de acurácia de 98,07% no Selva Científica, 98,06% no conjunto de teste do Mac-Morpho e 98,30% em textos do Bosque CF 7.4. Esses resultados são significativos, pois as taxas de acurácia alcançadas são superiores às do estado da arte, validando o modelo proposto em busca de um etiquetador morfossintático mais confiável.
Resumo:
Sistemas de reconhecimento e síntese de voz são constituídos por módulos que dependem da língua e, enquanto existem muitos recursos públicos para alguns idiomas (p.e. Inglês e Japonês), os recursos para Português Brasileiro (PB) ainda são escassos. Outro aspecto é que, para um grande número de tarefas, a taxa de erro dos sistemas de reconhecimento de voz atuais ainda é elevada, quando comparada à obtida por seres humanos. Assim, apesar do sucesso das cadeias escondidas de Markov (HMM), é necessária a pesquisa por novos métodos. Este trabalho tem como motivação esses dois fatos e se divide em duas partes. A primeira descreve o desenvolvimento de recursos e ferramentas livres para reconhecimento e síntese de voz em PB, consistindo de bases de dados de áudio e texto, um dicionário fonético, um conversor grafema-fone, um separador silábico e modelos acústico e de linguagem. Todos os recursos construídos encontram-se publicamente disponíveis e, junto com uma interface de programação proposta, têm sido usados para o desenvolvimento de várias novas aplicações em tempo-real, incluindo um módulo de reconhecimento de voz para a suíte de aplicativos para escritório OpenOffice.org. São apresentados testes de desempenho dos sistemas desenvolvidos. Os recursos aqui produzidos e disponibilizados facilitam a adoção da tecnologia de voz para PB por outros grupos de pesquisa, desenvolvedores e pela indústria. A segunda parte do trabalho apresenta um novo método para reavaliar (rescoring) o resultado do reconhecimento baseado em HMMs, o qual é organizado em uma estrutura de dados do tipo lattice. Mais especificamente, o sistema utiliza classificadores discriminativos que buscam diminuir a confusão entre pares de fones. Para cada um desses problemas binários, são usadas técnicas de seleção automática de parâmetros para escolher a representaçãao paramétrica mais adequada para o problema em questão.
Resumo:
O presente estudo, baseado na metodologia da Sociolinguistica Variacionista, tem como objetivo investigar a variação das vogais médias pretônicas /e/ e /o/ no português falado na área urbana da cidade de Belém (PA). A amostra constitui-se de 48 (quarenta e oito) entrevistas coletadas de informantes pertencentes a uma amostra estratificada em que se controlam as variáveis sociais, como faixa etária (15 a 25 anos, 26 a 45 anos e 46 anos em diante), sexo e grau de escolaridade (não-escolarizado, fundamental, médio e superior). Foram selecionadas as ocorrências de vogais pretônicas segundo os moldes silábicos V, VC (exceto travamento em /N/ e /S/), CV, CVC, CCV e CCVC. Na análise final, 1.434 dados foram submetidos ao programa Varbrul: 776 das variantes de /e/ e 658 das variantes de /o/. Para o objetivo do presente trabalho, a análise tomou como base 10 (dez) grupos de fatores lingüísticos e 03 (três) grupos de fatores sociais que possivelmente pudessem explicar a variação das vogais. Os resultados mostraram que no dialeto em questão predomina a manutenção das vogais médias pretônicas (.819), sendo esta favorecida por 06 (seis) grupos de fatores lingüísticos e 02 (dois) grupos de fatores sociais.
Resumo:
O reconhecimento automático de voz vem sendo cada vez mais útil e possível. Quando se trata de línguas como a Inglesa, encontram-se no mercado excelentes reconhecedores. Porem, a situação não e a mesma para o Português Brasileiro, onde os principais reconhecedores para ditado em sistemas desktop que já existiram foram descontinuados. A presente dissertação alinha-se com os objetivos do Laboratório de Processamento de Sinais da Universidade Federal do Pará, que é o desenvolvimento de um reconhecedor automático de voz para Português Brasileiro. Mais especificamente, as principais contribuições dessa dissertação são: o desenvolvimento de alguns recursos necessários para a construção de um reconhecedor, tais como: bases de áudio transcrito e API para desenvolvimento de aplicações; e o desenvolvimento de duas aplicações: uma para ditado em sistema desktop e outra para atendimento automático em um call center. O Coruja, sistema desenvolvido no LaPS para reconhecimento de voz em Português Brasileiro. Este alem de conter todos os recursos para fornecer reconhecimento de voz em Português Brasileiro possui uma API para desenvolvimento de aplicativos. O aplicativo desenvolvido para ditado e edição de textos em desktop e o SpeechOO, este possibilita o ditado para a ferramenta Writer do pacote LibreOffice, alem de permitir a edição e formatação de texto com comandos de voz. Outra contribuição deste trabalho e a utilização de reconhecimento automático de voz em call centers, o Coruja foi integrado ao software Asterisk e a principal aplicação desenvolvida foi uma unidade de resposta audível com reconhecimento de voz para o atendimento de um call center nacional que atende mais de 3 mil ligações diárias.
Resumo:
O ensino de Português como Língua Estrangeira (PLE) tem apresentado um crescimento significativo no Brasil e mundo. Acordos internacionais, de caráter tanto acadêmico quanto comercial, colocam a língua Portuguesa em evidência. Motivados por esse novo cenário, muitos profissionais e estudantes estrangeiros têm procurado por cursos de PLE. Alguns desses se submeterão ao exame CELPE-Bras – iniciativa do Ministério da Educação do Brasil para consolidar o ensino de PLE no mundo. Os professores que atuam na preparação de candidatos estrangeiros a esse exame se deparam com dificuldades para encontrar materiais possibilitem o desenvolvimento da compreensão oral de seus alunos. Neste trabalho procuramos apontar um caminho para o ensino-aprendizagem da compreensão oral em PLE partindo dos gêneros textuais orais como insumo. Para tanto, buscamos suporte teórico fundamentado no Interacionismo sociodiscursivo (Teoria dos Gêneros e modelo de Sequência Didática) e tentamos aproximar a Abordagem Comunicativa da Abordagem por Gêneros no ensino de Língua Estrangeira. Partindo desses pressupostos teóricos propomos várias Sequências Didáticas para o ensinoaprendizagem da compreensão oral em PLE, elaboramos e aplicamos atividades de compreensão oral. Descrevemos e analisamos tais atividades e tentamos mostrar em que medida o ensino-aprendizagem de PLE utilizando o gênero textual como insumo e aplicado a luz da abordagem comunicativa pode facilitar o desenvolvimento da compreensão oral de alunos estrangeiros candidatos ao exame CELPE-Bras.
Resumo:
Desde os anos 80, a avaliação somativa tem sido denunciada como sendo um dos principais mecanismos de classificação, de seleção e de exclusão social. As críticas suscitaram várias propostas de transformações das práticas avaliativas levando ao predomínio teórico da modalidade formativa. Consequentemente, as pesquisas sobre a modalidade somativa foram relegadas a um segundo plano. Porém, esta modalidade continua amplamente usada por professores do nível básico ao acadêmico. Além disto, a aplicação desta modalidade é necessária para a validação e certificação, pelo sistema educacional, dos resultados obtidos ao término de um período de aprendizagem. Recentemente, tem sido cada vez mais divulgadas as propostas de Schneuwly e Dolz (2004) para o desenvolvimento das capacidades de produção textual em língua materna com base no procedimento didático-metodológico chamado “Sequência Didática” com vistas ao domínio de uma diversidade de gêneros da escrita e da oralidade. Embora os autores tenham previsto a realização da avaliação somativa em um dos componentes do modelo (a produção final), pouco parece ser dito ou escrito em torno das práticas que tal modalidade pressupõe e sobre sua inclusão em uma proposta marcadamente formativa. Esta pesquisa tem como objetivo, portanto, identificar dificuldades e possíveis soluções a respeito da realização da avaliação somativa em Sequências Didáticas para o oral e a escrita no ensino/aprendizagem da língua portuguesa. Após caracterizar a avaliação somativa e os instrumentos que essa modalidade mobiliza no ensino/aprendizagem da língua portuguesa, propõe-se a análise de um corpus de dezessete documentos acadêmicos com propósito de verificar como a avaliação somativa foi realizada nas diferentes Sequências Didáticas relatadas nestes documentos. Para tal, foi observada a ocorrência ou não da avaliação somativa na produção final, os objetos de aprendizagem levados em conta na sua realização e os sujeitos desta modalidade de avaliação. Conclui-se, mostrando a importância da articulação dessa modalidade com a modalidade formativa pressuposta na Sequência Didática.