998 resultados para Modelos de dados de contagem
Resumo:
Esta tese resume os trabalhos desenvolvidos na área de processamento automático de fala com o objetivo de incrementar a quantidade de recursos linguísticos disponíveis para o português europeu. O estágio de desenvolvimento e a aplicação das tecnologias de fala para uma língua estão relacionados com a quantidade e a qualidade de recursos disponíveis para esta língua. Poucas línguas apresentam, no domínio público e livre, todos os recursos necessários para desenvolver as tecnologias de fala. A língua portuguesa, como muitas outras, tem escassez de recursos públicos e livres, o que pode dificultar o desenvolvimento e a aplicação de tecnologias de fala que incorporam esta língua. Os trabalhos descritos nesta tese apresentam uma abordagem para criar bases de dados de fala, recorrendo apenas aos recursos do domínio público e livres, partindo de sinais multimédia sem transcrições ortográficas ou fonéticas. É apresentada uma solução para aproveitar a grande disponibilidade de material multimédia existente no domínio público (podcasts por exemplo) e selecionar segmentos de fala adequados para treinar modelos acústicos. Para isso, foram desenvolvidos vários sistemas para segmentar e classificar automaticamente os noticiários. Estes sistemas podem ser combinados para criar bases de dados de fala com transcrição fonética sem a intervenção humana. Foi desenvolvido um sistema de conversão automático de grafemas para fonemas que se apoia em regras fonológicas e modelos estatísticos. Esta abordagem híbrida é justificada pelos desenvolvimentos de algoritmos de aprendizagem automática aplicados a conversão de grafemas para fonemas e pelo fato do português apresentar uma razoável regularidade fonética e fonológica bem como uma ortografia de base fonológica. Com auxílio deste sistema, foi criado um dicionário de pronunciação com cerca de 40 mil entradas, que foram verificadas manualmente. Foram implementados sistemas de segmentação e de diarização de locutor para segmentar sinais de áudio. Estes sistemas utilizam várias técnicas como a impressão digital acústica, modelos com misturas de gaussianas e critério de informação bayesiana que normalmente são aplicadas noutras tarefas de processamento de fala. Para selecionar os segmentos adequados ou descartar os segmentos com fala não preparada que podem prejudicar o treino de modelos acústicos, foi desenvolvido um sistema de deteção de estilos de fala. A deteção de estilos de fala baseia-se na combinação de parâmetros acústicos e parâmetros prosódicos, na segmentação automática e em classificadores de máquinas de vetores de suporte. Ainda neste âmbito, fez-se um estudo com o intuito de caracterizar os eventos de hesitações presentes nos noticiários em português. A transcrição fonética da base de dados de fala é indispensável no processo de treino de modelos acústicos. É frequente recorrer a sistemas de reconhecimento de fala de grande vocabulário para fazer transcrição automática quando a base de dados não apresenta nenhuma transcrição. Nesta tese, é proposto um sistema de word-spotting para fazer a transcrição fonética dos segmentos de fala. Fez-se uma implementação preliminar de um sistema de word-spotting baseado em modelos de fonemas. Foi proposta uma estratégia para diminuir o tempo de resposta do sistema, criando, a priori, uma espécie de “assinatura acústica” para cada sinal de áudio com os valores de todos os cálculos que não dependem da palavra a pesquisar, como a verosimilhanças de todos os estados dos modelos de fonemas. A deteção de uma palavra utiliza medidas de similaridade entre as verosimilhanças do modelo da palavra e do modelo de enchimento, um detetor de picos e um limiar definido por forma a minimizar os erros de deteção. Foram publicados vários recursos para a língua portuguesa que resultaram da aplicação dos vários sistemas desenvolvidos ao longo da execução desta tese com especial destaque para o sistema de conversão de grafemas para fonemas a partir do qual se publicaram vários dicionários de pronunciação, dicionários com as palavras homógrafas heterofónicas, dicionário com estrangeirismos, modelos estatísticos para a conversão de grafemas para fonemas, o código fonte de todo sistema de treino e conversão e um demonstrador online.
Resumo:
The main purpose of an Experimental Design resides mainly in the search for relationships between variables and in comparing levels of factors, using statistical treatment of collected data. The use of blocks in Experimental Design is essential because it allows reducing or eliminating the variability introduced by factors that can influence the experience but are not of main interest and/or were not explicitly included during experiments. In this work we present the results of the study and research of Balanced Incomplete Block Designs (BIBD), Balanced Incomplete Block Designs with repeated blocks (BIBDR) and the Incomplete Blocks Designs with blocks with different dimensions (VBBD). We explore some properties and construction methods of such designs and illustrate, when possible, with examples. Based on Block Designs, we present an application of BIBDR in Education, with the aim of comparing five domains of algebraic thinking in a sample of 1st year students of higher education in Cape Verde. For the analysis of sample data, the software R was used, version 2.12.1. We observed that significant differences exist between some of the domains of algebraic thinking, especially among the domains of Generalization of Arithmetic and Algebraic Technicality with the remaining areas. For a more representative sample, we recommend a bigger sample consisting of students from all higher institutions of Cape Verde.
Resumo:
Este trabalho baseia-se na análise de dados do desemprego em Cabo Verde nos anos de 2006 e 2008, usando informação da base de dados do INE e IEFP. Partindo da análise dos dados em estudo vai-se procurar descrever e perspectivar metodologias que contemplam as variáveis qualitativas e quantitativas com significado social positivo para a sociedade deste país. Após a introdução no capítulo 1, fez-se, no capítulo 2, a análise exploratória dos dados do desemprego em Cabo Verde referente aos anos 2006 e 2008. No capítulo 3 estudam-se associações entre variáveis, usando a metodologia de tabelas contingência, através da realização de testes de independência e testes de homogeneidade, e análise de medidas de associação. As variáveis usadas, vão ser essencialmente, o escalão etário, o género e o ano. O capítulo 4 é dedicado ao estudo de modelos Log - lineares em tabela de contingência, finalizando-se o trabalho com a apresentação das principais conclusões.
Resumo:
O principal objetivo de um Planeamento de Experiências reside essencialmente na procura de relações entre variáveis e na comparação de níveis de fatores, recorrendo ao tratamento estatístico dos dados recolhidos. A utilização de blocos no Planeamento de Experiências é fundamental, pois permite reduzir ou eliminar a variabilidade introduzida por fatores que podem influenciar a experiência mas que não interessam e/ou não foram explicitamente incluídos durante o planeamento. Neste trabalho apresentamos os resultados do estudo e investigação dos Planos em Blocos Incompletos Equilibrados (BIBD), Planos em Blocos Incompletos Equilibrados com repetição de blocos (BIBDR) e Planos em Blocos Incompletos com blocos de diferentes dimensões (VBBD). Exploramos algumas propriedades e métodos de construção destes planos e ilustramos, sempre que possível, com exemplos. Tendo como base o planeamento em blocos, apresentamos uma aplicação dos BIBDR na área da Educação com o objetivo de comparar cinco domínios do pensamento algébrico de uma amostra de alunos do 1º ano do ensino superior em Cabo Verde. Para a análise dos dados da amostra foi utilizado o software R, versão 2.12.1. Pudemos constatar que existem diferenças significativas entre alguns dos domínios do pensamento algébrico, nomeadamente entre os domínios da Generalização da Aritmética e Tecnicismo Algébrico com os restantes domínios. Recomendamos a escolha de uma amostra mais representativa constituída por alunos de todas as instituições superiores de Cabo Verde
Resumo:
A alimentação/nutrição é hoje considerada inseparável do desenvolvimento, sobretudo em países deficitários a nível da oferta face a uma população crescente como é o caso de Cabo Verde. As questões de alimentação/nutrição (Segurança Alimentar) no país têm merecido uma enorme atenção, reflectindo uma preocupação pela situação de défice alimentar, que torna o país muito dependente do exterior para satisfazer as suas necessidades alimentares. A presente dissertação tem por objecto o estudo dos Hábitos Alimentares e Comportamento dos Consumidores em Cabo Verde (caso da ilha de Santiago). Este país transitou para um segundo estado de desenvolvimento (Desenvolvimento Médio), mas continua com uma significativa percentagem da população a viver em situação de pobreza e grande vulnerabilidade, o que se reflecte nos níveis de acesso ao consumo alimentar e nutricional da população. Utiliza-se dados secundários (consultados nas diversas fontes bibliográficas), e levantamento directo de informação, com aplicação de inquéritos e entrevistas que permitiram responder às principais questões levantadas nas fases elementares e são utilizadas em processo de modelação e definição de “racionalidades”. Fez-se ainda análise mais pormenorizada de algumas situações que nos pareciam mais relevantes. Os resultados obtidos permitem evidenciar alterações nos hábitos alimentares. Através da análise antropométrica, e dos resultados obtidos, conclui-se que existem problemas e carências nutricionais. As famílias de maior dimensão são as que apresentam maior vulnerabilidade alimentar e consumos energéticos inferiores aos recomendados. Este estudo permitiu evidenciar alguns problemas nas crianças. Os problemas de obesidade afectam cerca de 11% das crianças, enquanto que a mal nutrição aguda moderada atingia cerca de 5%. Verifica-se uma tendência para a diminuição do consumo de produtos tradicionais (como é o caso do milho) e também uma maior diversificação da dieta com o aumento do rendimento, (caso do consumo do arroz) que aumenta globalmente, mas observando-se também diminuição per capita com níveis de rendimento mais elevados. Para o caso do leite há uma tendência para incremento do consumo com o rendimento. Estas alterações de consumo de leite fazem-se em duas direcções. Por um lado o aumento do rendimento induz a um maior consumo de leite, por outro a substituição do leite em pó por leite de “pacote” é uma evidência para estratos mais elevados de rendimentos. Comprova-se que a alimentação absorve uma fatia muito elevada do rendimento familiar, a elasticidade consumo alimentar ao nível do rendimento familiar é muito grande. Constata-se a partir dos modelos econométricos que o nível de educação da família é importante para a definição do padrão alimentar e que existe espaço para melhorias comportamentais da população, designadamente nas formas e escolhas de consumo alimentar
Resumo:
O presente estudo parte de uma questão orientadora da qual nos conduziu à elaboração de três objectivos específicos. O primeiro objectivo procura analisar as perspectivas teórico-conceptuais sobre avaliação institucional; o segundo, tenta analisar a realidade cabo-verdiana ao nível dos normativos sobre avaliação institucional no ensino superior, o terceiro procura compreender as perspectivas de diferentes gestores da Uni-CV e do Ministério do Ensino Superior, Ciência e Inovação (MESCI) sobre avaliação institucional. Na concecussão destes objectivos começámos por abordar, teoricamente, a avaliação institucional em estreita ligação com os conceitos-chave a ela inerentes: auto-avaliação e avaliação externa, os seus paradigmas, modelos e práticas. A abordagem e análise de literatura lida remeteu-nos para a necessidade de elaborar um roteiro de entrevista, tendo em vista a recolha de dados de opinião dos actores visados. As entrevistas foram administradas a um total de oito (9) gestores/adminstradores/professores/aluno da Uni-CV e MESCI. As conclusões do nosso estudo, e de acordo com a metodologia utilizada, apontam que, apesar de existir o reconhecimento de que a avaliação institucional, na Uni-CV, quer auto-avaliação quer avaliação externa, serem indispensáveis para monitorar o desempenho e obter subsídios para a melhoria, não é ainda uma prática consolidada em todos os dominios da actuação. Não encontramos na Universidade de Cabo Verde um dispositivo que regula global e exclusivamente a avaliação institucional, mas não existe um total vazio regulamentar nesta matéria. Não existe um consenso quanto a periodicidade, tal deve proceder-se de acordo com as modalidades adoptadas. Depreende-se que quanto ao perfil, os avaliadores internos devem ser especialistas na área, e os avaliadores externos pessoal credenciado reconhecido a nivel internacional. Avaliação deve-se fazer com base na combinação dos instrumentos, recorrendo às técnicas e métodos diversificados. No que diz respeito a existência de avaliação institucional e uma cultura de avaliação, induz-se que é vista, por um lado, numa relação que reflecte a sua legitimidade e aceitação e por outro, numa relação de punição e de censura social
Resumo:
O artigo aborda os resultados de um estágio desenvolvido, no Laboratório de Educação Digital da Universidade Jean Piaget de Cabo Verde no âmbito do projecto de desenvolvimento do Sistema de Informação Académico onde nos foi proposto projectar, desenvolver e testar um modelo de representação de eventos e sumários, bem como desenvolver uma rotina que permita converter os dados no formato de dados utilizado pela aplicação iCal. Para se atingir os objectivos acima propostos foi desenvolvido um modelo de representação de eventos e actas recorrendo a ferramentas UML. Posteriormente o modelo foi implementado e testado recorrendo a um SGBD orientado a objectos (ORACLE 10g). Por fim foi desenvolvida uma rotina que permite efectuar a migração e conversão dos dados extraídos da base de dados num ficheiro utilizado pela aplicação iCal.
Resumo:
Em virtude da crescente demanda mundial por alimentos, um monitoramento eficaz e em larga escala da umidade do solo constitui fator de grande importância para a previsão de safras. Este trabalho teve por objetivo apresentar uma técnica para o cálculo do teor de água no solo, utilizando modelos preditivos de umidade do solo, baseados em dados de radar de abertura sintética (SAR). Foram utilizados dados do SAR a bordo do JERS-1 ("Japanese Earth Resources Satellite") e dois modelos empíricos. O primeiro relaciona o coeficiente de retroespalhamento com a permissividade complexa (modelo de Dubois), e o segundo relaciona a permissividade complexa com o teor de água do solo e algumas de suas características físico-hídricas, tais como percentagem de areia e argila (modelo de Hallikainen). Inicialmente, os dados do SAR/JERS-1 foram calibrados e, por meio do modelo de Dubois, foram calculados os valores de permissividade complexa. Para tanto, foi necessário inserir níveis estimados de rugosidade do solo. A partir destes resultados, utilizou-se o modelo de Hallikainen para calcular a umidade volumétrica. A análise geral dos resultados indica que a técnica de estimação de umidade do solo a partir de imagens de radar de abertura sintética, utilizada neste estudo, mostrou-se física e matematicamente exeqüível. No entanto, apresentou uma precisão moderada, não sendo ainda recomendada para o uso operacional no mapeamento de umidade do solo. A análise dos resultados revelou também que a precisão dos dados é bastante influenciada pela precisão dos valores de rugosidade introduzidos.
Resumo:
A estimativa de chuvas intensas máximas é de grande importância para o dimensionamento de projetos agrícolas, tais como: terraços para controle de erosão, obras de barragens de terra e drenagem em solo agrícola. As chuvas são caracterizadas pela sua intensidade (mm h-1), pelo tempo de duração (min) e pelo período de retorno (anos). O modelo básico tem sido usado para determinação da intensidade de precipitação máxima diária a ser aplicada no dimensionamento de estruturas de contenção, fixando-se o período de retorno e a duração da chuva. O tempo de concentração em bacias hidrográficas, que normalmente fica entre 60 e 120 min para bacias consideradas pequenas, tem sido usado como tempo de duração na estimativa de chuvas intensas. Nesse intervalo, existem outros modelos que propiciam melhores ajustes e, conseqüentemente, maior confiabilidade na estimativa da chuva a ser usada nos dimensionamentos de estruturas de contenção. Assim, este trabalho teve como objetivo ajustar dois outros modelos para a estimativa de chuvas intensas: um exponencial e um linear, além do modelo básico. Esses modelos foram ajustados com base em dados de precipitação máxima diária anual da região de Lavras (MG), empregando-se dados de chuvas diárias do período de 1914 a 1991. Os dados foram transformados em intensidades de precipitação, com tempo de retorno variando de 2 a 100 anos e duração entre 5 e 1.440 min. Verificou-se que o modelo exponencial proposto proporcionou melhores ajustes, com menores erros na estimativa, para chuvas variando de 5 a 240 min, sendo, portanto, recomendável a bacias em que o tempo de concentração se enquadre nesta faixa de tempo; o modelo básico mostrou-se mais aplicável a bacias em que o tempo de duração seja maior que 240 min, enquanto o modelo linear não se mostrou confiável para a estimativa de chuvas intensas.
Resumo:
A curva de retenção de água no solo é fundamental para o desenvolvimento de estudos relacionados com a dinâmica da água, com a modelagem de processos físicos do solo e crescimento das plantas. Normalmente, a curva de retenção é obtida por meio de medidas simultâneas do conteúdo de água (θ) e do potencial mátrico da água no solo (ψ) numa única amostra. Um procedimento alternativo consiste em utilizar várias amostras por ψ para descrever a curva de retenção. A utilização deste procedimento requer a incorporação dos fatores de variação existentes entre as amostras nos parâmetros das funções matemáticas utilizadas para descrever essa curva. O objetivo deste trabalho foi obter a curva de retenção, utilizando esta última sistemática, e ajustar duas diferentes funções não-lineares aos dados de θ(ψ). Amostras indeformadas (0,05 m de diâmetro e 0,05 m de altura) foram obtidas num Latossolo Vermelho distroférrico cultivado com milho sob plantio direto e preparo convencional do solo. Foram retiradas 96 amostras por sistema de preparo, na profundidade de 0-0,10 m, na linha e na entrelinha da cultura. A curva de retenção foi obtida utilizando-se 12 ψ, sendo 16 amostras por ψ: oito por sistema de preparo e quatro por posição amostrada. Os modelos de Genuchten (1980) - VG e o de Hutson & Cass (1987) - HC foram ajustados aos dados. Funções relacionando os parâmetros dos modelos com as variáveis independentes preparo, posição de amostragem e densidade do solo (Ds) os substituíram no ajuste dos dados. Não houve influência estatisticamente significativa dos sistemas de preparo e posição de amostragem (p > 0,05) no ajuste das funções aos dados . Com a função de VG obtiveram-se efeitos significativos da Ds no parâmetro n, o qual foi descrito por uma função quadrática da Ds. Resultado similar foi obtido com o parâmetro "a" da função de HC. A curva de retenção foi sensível às variações da Ds e o procedimento utilizado apresenta vantagens de natureza metodológica, bem como a redução substancial de tempo e custo para obter a curva de retenção. A precisão dos modelos utilizados foi praticamente similar, mas o modelo de HC apresentou menor número de parâmetros empíricos que o modelo de VG.
Resumo:
A avaliação do processo da redistribuição da água no solo, em condições de campo, demanda considerável tempo e apreciável custo, porque as propriedades hidráulicas do solo sofrem extensa variabilidade espacial e estão sujeitas a freqüentes alterações no tempo. O presente trabalho propõe dois modelos analíticos para estimar a dinâmica desse processo, a partir da adoção do gradiente de potencial hidráulico unitário na equação de Richards. O primeiro modelo estima a umidade do solo e o segundo estima a densidade de fluxo, ambos de acordo com o tempo de drenagem interna para a profundidade de interesse. Os resultados gerados pelos modelos confrontam-se satisfatoriamente física e estatisticamente com os valores medidos da umidade e densidade de fluxo durante o período de drenagem em diferentes profundidades numa Areia Marinha submetida a esse processo em condições de campo. Os modelos propostos exigem somente o conhecimento prévio dos dados da curva de retenção e da condutividade hidráulica do solo na profundidade de interesse.
Resumo:
O trabalho teve como objetivo avaliar modelos de calibração para dois tipos de guias de onda de TDR, referentes a dois equipamentos (Trase System e TDR 100), acopladas diretamente ao analisador de umidade ou a multiplexadores. Amostras de três tipos de solo foram acondicionadas em segmentos de tubos de PVC e saturadas. Dois tipos de guias de onda de três hastes, com capacitor e com resistor foram inseridas dentro de cada segmento de tubo com solo e conectadas a dois equipamentos de TDR, diretamente no testador de cabos ou via multiplexadores. Dados de umidade obtidos por gravimetria e da constante dielétrica foram tomados em cada coluna durante a secagem do solo da saturação até umidades próximas do limite inferior de disponibilidade de água por meio de leituras com as guias de onda conectadas ao testador de cabos e conectadas ao multiplexador. Um modelo polinomial cúbico foi ajustado aos dados da constante dielétrica do solo (épsilon) e da correspondente umidade (teta) e cinco modelos de determinação de q em função de e foram testados quanto ao desempenho. Os resultados mostraram que não houve diferença significativa na calibração das guias de onda com capacitor para uso com a TDR Trase System, considerando a conexão das guias ao analisador de umidade ou a multiplexadores. No caso da TDR 100, as guias de onda com resistor devem ser calibradas conforme o seu uso. O modelo cúbico foi o de melhor desempenho seguido pelo modelo de Roth que estimou, com boa exatidão, os valores da constante dielétrica e da umidade com a mais próximo de 0,5 para as guias de onda com capacitor que com as guias com resistor.
Resumo:
Pesquisas sobre a variabilidade espacial dos atributos do solo que influenciam a produtividade são de uma grande importância para o desenvolvimento de novas técnicas que beneficiam a agricultura. A variabilidade desses atributos pode ser avaliada por técnicas de geoestatística e auxiliar no mapeamento e manejo do solo. Este trabalho teve por objetivo avaliar a qualidade do ajuste dos modelos teóricos espaciais segundo o Critério de Informação de Akaike, de Filliben, de Validação Cruzada e o valor máximo do logaritmo da função verossimilhança, de dados da umidade do solo, da densidade do solo e da resistência do solo à penetração, nas camadas de 0 a 0,1, 0,1 a 0,2 e 0,2 a 0,3 m, e de produtividade da soja do ano agrícola 2004-2005. Os parâmetros dos modelos de variabilidade espacial foram estimados por meio dos métodos de mínimos quadrados ordinários, mínimos quadrados ponderados e máxima verossimilhança. A pesquisa foi desenvolvida em uma área de 57 ha de um Latossolo Vermelho distroférrico, utilizando-se uma malha de 75 x 75 m georreferenciada. Concluiu-se que, dos métodos de avaliação de ajustes estudados, o da Validação Cruzada foi o mais adequado para escolha do melhor ajuste do modelo de variabilidade espacial; conseqüentemente têm-se mapas temáticos mais acurados.
Resumo:
A caracterização da capacidade de retenção de água de um solo é fundamental para a descrição do fluxo de água através dele e para o adequado manejo da irrigação. São apresentadas comparações entre curvas de retenção de água do solo: ajustadas pelos modelos propostos por van Genuchten e por Hutson & Cass; obtidas pelo método do WP4 usando processo de umedecimento e de secagem; obtidas pelo método da centrífuga utilizando amostras deformadas e indeformadas; e obtidas pelo WP4 e centrífuga, usando um processo de secagem e amostra deformada. Amostras deformadas e indeformadas foram coletadas com trados específicos em um Latossolo Vermelho-Amarelo (LVA), textura argilosa. Foram determinadas as propriedades hídricas do solo necessárias à elaboração das curvas de retenção de água obtidas por análise de regressão. O modelo de van Genuchten possibilitou o melhor ajuste nas diversas situações estudadas. Considerando o processo de secagem, o teor de água útil obtido superou em 13 % o resultado do processo de umedecimento e evidenciou reduzido efeito de histerese. A amostra deformada apresentou-se com um teor de água útil superior 61,7 % ao valor obtido para a amostra indeformada. Entre os métodos estudados, verificou-se que aquele que usa o WP4 subestimou os dados obtidos pela centrífuga. Verificou-se que há diferenças entre amostra deformada e indeformada e os métodos utilizados na obtenção da curva de retenção.
Resumo:
A permeabilidade intrínseca - ou simplesmente permeabilidade do solo ao ar - é uma propriedade importante para a identificação de alterações no espaço poroso do solo causadas pelas práticas de manejo, na estimativa de propriedades do solo mais difíceis e onerosas e na composição de modelos de fluxo de fluidos em solos agrícolas e em solos contaminados. O objetivo do presente estudo foi construir um sistema de aquisição de dados (módulo eletrônico e programa computacional) para a medida da permeabilidade do solo ao ar em laboratório, utilizando-se materiais disponíveis no local e ferramentas computacionais de acesso livre. O sistema de aquisição de dados mostrou-se bastante preciso na determinação da permeabilidade do solo ao ar, com intervalo de confiança de 9,42 ± 0,085 μm² (95 %), para uma amostra-padrão constituída de partículas com diâmetro de 0,106 a 0,250 mm da fração areia de um Latossolo Vermelho-Amarelo textura média. A estimativa da permeabilidade do solo ao ar, considerando a viscosidade dinâmica do ar em função da temperatura, foi significativamente maior que a estimativa com valor fixo de viscosidade dinâmica em aproximadamente 20 ºC. A medição realizada em uma amostra de solo com estrutura indeformada de um Latossolo Vermelho foi tão precisa quanto à da amostra-padrão, e a estimativa da massa de água removida da amostra foi de 3,27 mg.