1000 resultados para Recuperação da informação na Web
Resumo:
Dissertação de Mestrado, Ciências da Linguagem, Faculdade de Ciências Humanas e Sociais, Universidade do Algarve, 2010
Resumo:
Atuando no monitoramento agroambiental e socioeconômico da agricultura familiar na Amazônia, a Embrapa Monitoramento por Satélite coordena um projeto de acompanhamento de um conjunto de pequenas propriedades rurais em Machadinho D'Oeste, RO, desde 1986. O acompanhamento é feito a cada três anos junto aos produtores da região. Até 2008, a coleta de dados utilizou formulários analógicos. A quantidade desses formulários ao longo dos anos tornou-se um problema. Dada sua fragilidade e potencial deterioração, surgiu a necessidade de preservá-los em meio digital. Além disso, o volume de papel era considerável e dificultava a tarefa de encontrar um formulário específico. O objetivo deste trabalho foi solucionar os problemas de preservação e recuperação desses formulários. Para preservação, foi feita a digitalização dos formulários. Cada formulário em papel, composto por sete páginas, deu origem a um arquivo PDF. Esses arquivos foram estruturados em pastas organizadas cronologicamente e disponibilizados em uma página web. Para a criação da página, foram executados os seguintes passos: 1 - listagem de arquivos correspondentes a cada formulário (utilizando o comando dir do sistema operacional Windows); 2 - criação da página web (utilizando funções de concatenação de texto do Excel para construir o código HTML); 3 - publicação da página (por meio da sua disponibilização da rede interna). A partir dessa organização, foi possível preservar os formulários, torná-los acessíveis para os envolvidos no projeto e criar um mecanismo para sua localização e recuperação na rede interna da Embrapa.
Resumo:
O presente trabalho propõe a concepção e implementação de um sistema de recuperação de informação de diversos Objectos Digitais (objecto originalmente criado no meio informático, como por exemplo um documento, um vídeo…) com recurso a anotações/metadados descritivos do objecto (dados que descrevem outros dados). Para fomentar o processo de preenchimento dos metadados é proposto um mecanismo de créditos para estimular o preenchimento cooperativo entre utilizadores e autores de Objectos Digitais (OD), com base na metáfora da bolsa de valores. Deste processo de anotações resulta incerteza, ou seja, o mesmo objecto pode ser descrito de forma diferente por utilizadores distintos. Este sistema propõe uma forma de lidar com esta incerteza, recorrendo ao conceito de base de dados probabilística que não é mais que associar a cada termo armazenado, um valor (peso do termo) entre 0 e 1, a que demos o nome de peso do termo. Deste modo, foi também proposto um modelo de cálculo do peso dos termos descritivos dos OD baseado no feedback fornecido pelos utilizadores. Recorrendo ao peso dos termos, foi ainda possível determinar a relevância de um OD quando confrontado com uma pergunta dando assim a possibilidade a um utilizador, recuperar/pesquisar OD de qualquer tipo, ordenados por um valor de relevância. Para além da concepção e correspondente implementação do BOD, este trabalho discute ainda diferentes cenários de aplicação do sistema, ilustrando consequentemente a sua versatilidade e flexibilidade
Resumo:
Introdução Actualmente, as mensagens electrónicas são consideradas um importante meio de comunicação. As mensagens electrónicas – vulgarmente conhecidas como emails – são utilizadas fácil e frequentemente para enviar e receber o mais variado tipo de informação. O seu uso tem diversos fins gerando diariamente um grande número de mensagens e, consequentemente um enorme volume de informação. Este grande volume de informação requer uma constante manipulação das mensagens de forma a manter o conjunto organizado. Tipicamente esta manipulação consiste em organizar as mensagens numa taxonomia. A taxonomia adoptada reflecte os interesses e as preferências particulares do utilizador. Motivação A organização manual de emails é uma actividade morosa e que consome tempo. A optimização deste processo através da implementação de um método automático, tende a melhorar a satisfação do utilizador. Cada vez mais existe a necessidade de encontrar novas soluções para a manipulação de conteúdo digital poupando esforços e custos ao utilizador; esta necessidade, concretamente no âmbito da manipulação de emails, motivou a realização deste trabalho. Hipótese O objectivo principal deste projecto consiste em permitir a organização ad-hoc de emails com um esforço reduzido por parte do utilizador. A metodologia proposta visa organizar os emails num conjunto de categorias, disjuntas, que reflectem as preferências do utilizador. A principal finalidade deste processo é produzir uma organização onde as mensagens sejam classificadas em classes apropriadas requerendo o mínimo número esforço possível por parte do utilizador. Para alcançar os objectivos estipulados, este projecto recorre a técnicas de mineração de texto, em especial categorização automática de texto, e aprendizagem activa. Para reduzir a necessidade de inquirir o utilizador – para etiquetar exemplos de acordo com as categorias desejadas – foi utilizado o algoritmo d-confidence. Processo de organização automática de emails O processo de organizar automaticamente emails é desenvolvido em três fases distintas: indexação, classificação e avaliação. Na primeira fase, fase de indexação, os emails passam por um processo transformativo de limpeza que visa essencialmente gerar uma representação dos emails adequada ao processamento automático. A segunda fase é a fase de classificação. Esta fase recorre ao conjunto de dados resultantes da fase anterior para produzir um modelo de classificação, aplicando-o posteriormente a novos emails. Partindo de uma matriz onde são representados emails, termos e os seus respectivos pesos, e um conjunto de exemplos classificados manualmente, um classificador é gerado a partir de um processo de aprendizagem. O classificador obtido é então aplicado ao conjunto de emails e a classificação de todos os emails é alcançada. O processo de classificação é feito com base num classificador de máquinas de vectores de suporte recorrendo ao algoritmo de aprendizagem activa d-confidence. O algoritmo d-confidence tem como objectivo propor ao utilizador os exemplos mais significativos para etiquetagem. Ao identificar os emails com informação mais relevante para o processo de aprendizagem, diminui-se o número de iterações e consequentemente o esforço exigido por parte dos utilizadores. A terceira e última fase é a fase de avaliação. Nesta fase a performance do processo de classificação e a eficiência do algoritmo d-confidence são avaliadas. O método de avaliação adoptado é o método de validação cruzada denominado 10-fold cross validation. Conclusões O processo de organização automática de emails foi desenvolvido com sucesso, a performance do classificador gerado e do algoritmo d-confidence foi relativamente boa. Em média as categorias apresentam taxas de erro relativamente baixas, a não ser as classes mais genéricas. O esforço exigido pelo utilizador foi reduzido, já que com a utilização do algoritmo d-confidence obteve-se uma taxa de erro próxima do valor final, mesmo com um número de casos etiquetados abaixo daquele que é requerido por um método supervisionado. É importante salientar, que além do processo automático de organização de emails, este projecto foi uma excelente oportunidade para adquirir conhecimento consistente sobre mineração de texto e sobre os processos de classificação automática e recuperação de informação. O estudo de áreas tão interessantes despertou novos interesses que consistem em verdadeiros desafios futuros.
Resumo:
Os investigadores sentem grande pressão em mostrar trabalho e em publicar, em especial, nas últimas décadas. Muito provavelmente esta situação não se alterará, na medida em que os processos de avaliação do trabalho científico e académico, inicialmente muito confinados às ciências naturais, abrangem cada vez mais todas as disciplinas. Desde meados do séc. XX que os resultados da investigação privilegiam a comunicação em formato de artigo científico devido à rapidez e à facilidade de publicação e de recuperação da informação (bases de dados, plataformas científicas, repositórios e, mais recentemente, redes sociais), revolucionando o tradicional ecossistema de comunicação científica. Como nas últimas décadas se desenvolveram novos meios de difusão, também o conceito de internacionalidade das revistas científicas adquiriu outra importância e tem sido usado como um indicador da sua qualidade.
Resumo:
A tomada de decisão na saúde pode-se tornar um processo complexo e moroso. A complexidade associada ao processo de decisão na saúde advém da diversidade de opções clinicamente razoáveis, ou seja, nenhuma opção se sobrepõem _a outra, visto que cada uma possui os seus riscos e benefícios, que são normalmente interpretados de modo diferente entre os indivíduos. Desta forma, cabe ao paciente e _a sua equipa médica optarem pela opção que melhor se enquadra na situação clínica do paciente Para tornar este processo menos complexo, cada vez mais se utiliza as chamadas "ferramentas de decisão", que se caraterizam por fornecer informação sobre as diferentes opções clínicas, traduzindo-se numa diminuição da dificuldade da tomada de decisão. De uma forma geral, as ferramentas de decisão são desenvolvidas com o intuito de facilitar a tomada de decisão, através do aumento do conhecimento científico sobre um determinado problema (tomada de decisão informada) e uma mudança de atitude do paciente face aos seus cuidados de saúde. Na realização da presente dissertação foi desenvolvido um sistema de informação na web, que engloba informação relativa ao rastreio do cancro da próstata. Este sistema também surge acoplado a um conjunto de componentes de decisão, que têm como objetivo auxiliar os indivíduos no processo de decisão para a realização do rastreio do cancro da próstata, assim como a prevenção de doenças relacionadas com a próstata. A implementação desta aplicação web teve como base as necessidades do indivíduo, ou seja informações clínicas sobre possíveis riscos e benefícios associados ao rastreio, assim como fornecer uma maior interatividade com o utilizador. A primeira versão da aplicação já foi testada e avaliada através da participação de um conjunto de indivíduos que compõem o público-alvo para este tipo de aplicações. Os resultados obtidos permitiram concluir que os requisitos definidos para esta aplicação, permitem o aumento do conhecimento do indivíduo e o auxílio na tomada de decisão para a realização do rastreio do cancro da próstata.
Resumo:
Comunicação apresentada na 6ª CAPSI - Conferência da Associação Portuguesa de Sistemas de Informação - Escola Superior de Tecnologia de Bragança, 26-28 de Outubro.
Resumo:
Relatório de Estágio de Mestrado em Ciências da Informação e da Documentação
Resumo:
Relatório de Estágio apresentado para cumprimento dos requisitos necessários à obtenção do grau de Mestre em Ciências da Informação e da Documentação
Resumo:
Este trabalho incide sobre a gestão do conhecimento e cultura organizacional, as suas barreiras os seus facilitadores na Parque Escolar E.P.E. Este estudo teve por base o método quadripolar. Várias foram as atividades ao longo deste trabalho, inicialmente foi recolhida a documentação interna, nomeadamente diplomas legais, regulamentos, manuais de procedimentos, manuais de formações internas, entre outros documentos, que serviram de base ao reconhecimento da instituição, a sua evolução estrutural e de funcionamento. Para identificar as barreiras e os facilitadores na recuperação da informação nos três principais meios para o efeito: arquivo físico, file system e aplicações informáticas foram aplicados inquéritos aos produtores/ utilizadores de informação da Parque Escolar, E.P.E. Com base neste estudo foi possível identificar qual o recurso de recuperação de informação que traz mais dificuldades na sua utilização, se existem documentos exclusivos em papel ou exclusivos em formato digital, se os mesmos são recuperáveis com facilidade. Foi possível averiguar se os colaboradores da Parque Escolar, E.P.E. consideram os documentos que constam no Arquivo Físico mais fidedignos do que os documentos em formato digital guardados no file system ou nas aplicações informáticas. Em relação às aplicações informáticas foi ainda possível averiguar se os colaboradores consideram uteis as suas atualizações, ou se demonstram alguma resistência à mudança, e se consideram que tiveram o acompanhamento necessário para compreender e aplicar as alterações. Com este estudo esperamos ter contribuído para dar uma maior visibilidade à temática da gestão do conhecimento e como a cultura organizacional pode influenciar, criando barreiras ou facilitadores.
Resumo:
Dissertação de Mestrado em Engenharia Informática
Resumo:
Tendo como caso de estudo um conjunto documental do Arquivo Histórico dos Museus da Universidade de Lisboa (AHMUL) – Museu Nacional de História Natural e da Ciência (MUHNAC), anteriormente fazendo parte do antigo Arquivo Histórico do Museu Bocage – fortemente atingido por um incêndio em 1978, o objectivo principal desta investigação é dar início à pesquisa e explorar a possibilidade de aplicação de métodos não invasivos de restauro digital, como a técnica de digitalização volumétrica (volumetric scanning), para a recuperação da informação escrita na parte mais deteriorada do arquivo; e propor métodos de estabilização/recuperação do seu suporte físico, usando técnicas tradicionais de conservação e restauro. Assim, o objectivo deste estudo não é apenas rever métodos de recuperação da informação para estes documentos tidos como perdidos, mas também propor uma forma de recuperar, tanto quanto possível, o seu suporte original. Será realizada a caracterização material da colecção, com recurso a métodos de exame e análise e o diagnóstico de conservação da parte da colecção mais deteriorada, bem como uma contextualização histórica sobre o arquivo e as condições do incêndio. Como conclusões principais salienta-se a confirmação da possibilidade de aplicação de técnicas de digitalização, os resultados promissores de outras técnicas como a fotografia de infravermelho com recurso adicional a software de processamento da imagem e o uso da imagem multiespectral em documentos carbonizados, além do estabelecimento de uma proposta de protocolo de intervenção para documentos queimados, com recurso a dois éteres de celulose, com diferentes solventes (água e etanol) de acordo com a solubilidade dos meios de escrita. Pretendeu-se ainda com este estudo contribuir para a divulgação da existência deste fundo do AHMUL em específico, tendo sido fundamental a realização, após 37 anos, do primeiro registo e compilação de fontes documentais sobre o incêndio de 18 de março de 1978, um facto tão relevante para a Memória do MUHNAC e dos Museus de Portugal.
Resumo:
Bibliografia internacional seletiva e anotada sobre bibliotecas digitais. Aborda os seguintes aspectos: a) visionários, principais autores que escreveram sobre a biblioteca do futuro, no período de 1945-1985; b) conceituação de biblioteca digital; c) projetos em andamento na Alemanha, Austrália, Brasil, Canadá, Dinamarca, Espanha, Estados Unidos, França, Holanda, Japão, Nova Zelândia, Reino Unido, Suécia e Vaticano; d) aspectos técnicos relativos à construção de uma biblioteca digital: arquitetura do sistema, conversão de dados e escaneamento, marcação de textos, desenvolvimento de coleções, catalogação, classificação/indexação, metadados, referência, recuperação da informação, direitos autorais e preservação da informação digital; e) principais fontes de informação: monografia, periódicos, reuniões técnicas específicas, lista de discussão, grupos e centros de estudos, cursos e treinamento.
Resumo:
Base de dados que objetiva disponibilizar, em único local de fácil e rápido acesso, informações básicas essenciais aos interessados na biblioteca do futuro, seja ela eletrônica, virtual, digital, sem paredes ou biônica. Desenvolvida com o software MicroIsis, encontra-se disponível na Internet a todo e qualquer interessado por intermédio do servidor de bases de dados ISIS para o WWW (software intitulado WWWIsis, desenvolvido pela Bireme). A recuperação da informação é possível por índice de termos indexados ou formulário de pesquisa utilizando-se lógica booleana em campos de autoria, título, assunto, data e língua. Delimitações de pesquisa por tipo de documento e conteúdo de informação também são oferecidas. URL: http://www.eca.usp.br/eca/nucleos/biblial/futura/index.htm
Resumo:
O artigo aborda os programas de pesquisa do Centro de Estudos Informétricos de Copenhague. Descrevendo a informetria como subcampo da bibliometria, discute uma nova abordagem para a área, qual seja, a combinação de teorias e metodologias avançadas de recuperação da informação com o estudo científico dos fluxos da informação. O Centro objetiva aplicar métodos bibliométricos não somente em estudos cienciométricos e em avaliações da pesquisa científica e tecnológica, mas também na análise de suas relações sociais, econômicas etc., ampliando as análises bibliométricas tradicionais para abranger as comunidades não acadêmicas nas quais a informação é produzida, comunicada e usada. A autora também convoca os profissionais de biblioteconomia e ciência da informação para enfrentarem o desafio dessa nova área de estudos quantitativos, aprendendo a explorar as bases de dados também como um instrumento para desenvolver atividades de análise, enfatizando as possibilidades que esses profissionais têm para elevar o nível de suas posições hierárquicas, assim como para explorar as técnicas informétricas no gerenciamento de políticas e de tomadas de decisão.