914 resultados para pacs: information retrieval techniques
Resumo:
This paper summarized the recent research results of Changhe Zhou's group of Information Optics Lab in Shanghai Institute of Optics and Fine Mechanics (SIOM). The first is about the Talbot self-imaging research. We have found the symmetry rule, the regular-rearranged neighboring phase difference rule and the prime-number decamping rule, which is briefly summarized in a recent educational publication of Optics and Photonics News, pp.46-50, November 2004. The second is about four novel microoptical gratings designed and fabricated in SIOM. The third is about the design and fabrication of novel supperresolution phase plates for beam shaping and possible use in optical storage. The fourth is to develop novel femtosecond laser information processing techniques by incorporating microoptical elements, for example, use of a pair of reflective Dammann gratings for splitting the femtosecond laser pulses. The most attractive feature of this approach is that the conventional beam splitter is avoided. The conventional beam splitter would introduce the unequal dispersion due to the broadband spectrum of ultrashort laser pulses, which will affect the splitting result. We implemented the Dammann splitting apparatus by using two-layered reflective Dammann gratings, which generates the almost same array without angular dispersion. We believe that our device is highly interesting for splitting femtosecond laser pulses.
Resumo:
Interest in the identification and characterisation of cyanobacteria and dinoflagellates in aquatic environments is increasing rapidly due to the perceived roles of these organisms in primary production and nuisance aspects in terms of water treatment and public health. Techniques for the identification and quantification of these organisms currently are limited, and the application of molecular approaches provides fundamental taxonomic information and techniques of practical value. Antigenic properties of algal cells may be useful taxonomic markers. Immunodetection techniques utilise the specificity of the antibody/antigen association as a probe for recognising and distinguishing between microorganisms according to their cell- surface chemistry. Immunofluorescent detection of unicellular cyanobacteria and dinoflagellates has been studied with success in marine and freshwater ecosystems and a range of techniques and results are presented and discussed. The most recent advances in the study of planktonic algae have come with the application of continuous flow cytometric methods (CFC). Flow cytometry makes use of the autofluorescence properties of the algal cells, which alone can be used to demonstrate their presence and permit their quantification in natural water samples. When used in conjunction with immunolabelling techniques, the potential of CFC analysis is broadened to study the serological/strain composition of plankters in natural populations. Changes in algal strains represented within and between waters over periods of time are reported and discussed, along with the ecological issues thus raised.
Resumo:
O problema que justifica o presente estudo refere-se à falta de semântica nos mecanismos de busca na Web. Para este problema, o consórcio W3 vem desenvolvendo tecnologias que visam construir uma Web Semântica. Entre estas tecnologias, estão as ontologias de domínio. Neste sentido, o objetivo geral desta dissertação é discutir as possibilidades de se imprimir semântica às buscas nos agregadores de notícia da Web. O objetivo específico é apresentar uma aplicação que usa uma classificação semi-automática de notícias, reunindo, para tanto, as tecnologias de busca da área de recuperação de informação com as ontologias de domínio. O sistema proposto é uma aplicação para a Web capaz de buscar notícias sobre um domínio específico em portais de informação. Ela utiliza a API do Google Maps V1 para a localização georreferenciada da notícia, sempre que esta informação estiver disponível. Para mostrar a viabilidade da proposta, foi desenvolvido um exemplo apoiado em uma ontologia para o domínio de chuvas e suas consequências. Os resultados obtidos por este novo Feed de base ontológica são alocados em um banco de dados e disponibilizados para consulta via Web. A expectativa é que o Feed proposto seja mais relevante em seus resultados do que um Feed comum. Os resultados obtidos com a união de tecnologias patrocinadas pelo consórcio W3 (XML, RSS e ontologia) e ferramentas de busca em página Web foram satisfatórios para o propósito pretendido. As ontologias mostram-se como ferramentas de usos múltiplos, e seu valor de análise em buscas na Web pode ser ampliado com aplicações computacionais adequadas para cada caso. Como no exemplo apresentado nesta dissertação, à palavra chuva agregaram-se outros conceitos, que estavam presentes nos desdobramentos ocasionados por ela. Isto realçou a ligação do evento chuva com as consequências que ela provoca - ação que só foi possível executar através de um recorte do conhecimento formal envolvido.
Resumo:
Este trabalho tem por objetivo propor um modelo de ontologia simples e generalista, capaz de descrever os conceitos mais básicos que permeiam o domínio de conhecimento dos jornais on-line brasileiros não especializados, fundamentado tanto na prática quanto conceitualmente, em conformidade com os princípios da Web Semântica. A partir de uma nova forma de classificação e organização do conteúdo, a ontologia proposta deve ter condições de atender as necessidades comuns de ambas as partes, jornal e leitor, que são, resumidamente, a busca e a recuperação das informações.
Resumo:
Esta pesquisa discute a participação do bibliotecário na formação de equipes multidisciplinares dos grupos de Avaliação de Tecnologias em Saúde (ATS), caracterizando sua atuação num novo campo que se abre para os bibliotecários em instituições de pesquisa. O objetivo geral baseia-se na criação de uma Biblioteca Digital (BD) com os parâmetros de qualidade da informação inerentes a ATS, a partir dos documentos gerados pelo Serviço de Comutação Bibliográfica (SCB) da Rede de Bibliotecas da FIOCRUZ, recomendando a inserção do bibliotecário na equipe multidisciplinar para ATS. A metodologia foi dividida em três partes: levantamento do estado da arte do conhecimento produzido na Saúde Coletiva, onde se insere a Avaliação de Tecnologias em Saúde, e da Ciência da Informação, pesquisa exploratória com uma abordagem qualitativa para coleta de dados junto ao grupo de pesquisadores de ATS de diversas instituições públicas e privadas e uma abordagem quantitativa para coleta de dados dos profissionais do SCB da Rede de Bibliotecas da Fiocruz e análise dos dados. Verificou-se que existe uma participação ativa do bibliotecário nas atividades de ATS, no que diz respeito, à formulação de estratégias de busca em base de dados, revisão de protocolos de busca, localização de publicações relevantes, auxílio para realização de revisões sistemática para os grupos de pesquisa. Pressupõe a criação de uma BD permitindo o compartilhamento de todos os documentos digitais gerados pelas bibliotecas. Com essa iniciativa pretende-se contribuir para impulsionar a produção do conhecimento científico e tecnológico na área da saúde e de ATS.
Resumo:
High salinity estuaries in the southeastern U.S. have experienced increased inputs of contaminants from nonpoint source (NPS) urban runoff and decreases in habitat due to filling of wetlands and dock/bulkhead construction. Urbanization may pose significant risks to estuarine fauna, particularly crustaceans. The grass shrimp of the genus Palaemonetes, is one of the dominant species found in estuarine tidal creeks, accounting for greater than 50% of all macropelagic fauna on an annual basis. Spatial analytical and geographic information system techniques were used to determine which factors influenced the Palaemonetes population structures in a South Carolina bar-built estuary surrounded by urban development. Impacts from land use practices were investigated using concentric circular buffers around study sites. Factors investigated included sediment-associated polycyclic aromatic hydrocarbons concentration, land use classification, percent impervious surfaces, and other selected urban factors. Geographic information system and statistical modeling showed quantitative relationships between land use class and impacts on Palaemonetes density. The study suggests that habitat loss is a major factor influencing grass shrimp densities. Multiple regression modeling suggests a significant relationship between habitat alterations and Palaemonetes densities.
Resumo:
Ideally, one would like to perform image search using an intuitive and friendly approach. Many existing image search engines, however, present users with sets of images arranged in some default order on the screen, typically the relevance to a query, only. While this certainly has its advantages, arguably, a more flexible and intuitive way would be to sort images into arbitrary structures such as grids, hierarchies, or spheres so that images that are visually or semantically alike are placed together. This paper focuses on designing such a navigation system for image browsers. This is a challenging task because arbitrary layout structure makes it difficult - if not impossible - to compute cross-similarities between images and structure coordinates, the main ingredient of traditional layouting approaches. For this reason, we resort to a recently developed machine learning technique: kernelized sorting. It is a general technique for matching pairs of objects from different domains without requiring cross-domain similarity measures and hence elegantly allows sorting images into arbitrary structures. Moreover, we extend it so that some images can be preselected for instance forming the tip of the hierarchy allowing to subsequently navigate through the search results in the lower levels in an intuitive way. Copyright 2010 ACM.
Resumo:
Spoken content in languages of emerging importance needs to be searchable to provide access to the underlying information. In this paper, we investigate the problem of extending data fusion methodologies from Information Retrieval for Spoken Term Detection on low-resource languages in the framework of the IARPA Babel program. We describe a number of alternative methods improving keyword search performance. We apply these methods to Cantonese, a language that presents some new issues in terms of reduced resources and shorter query lengths. First, we show score normalization methodology that improves in average by 20% keyword search performance. Second, we show that properly combining the outputs of diverse ASR systems performs 14% better than the best normalized ASR system. © 2013 IEEE.
Resumo:
政府信息检索系统作为政府信息公开平台的重要组成部分,对于用户从大量信息中准确查找所需信息起到关键作用,然而现有政府信息检索系统存在两个主要问题:一是系统采用的基于关键词匹配的检索技术忽视了对于用户检索条件的语义的理解,缺乏对于文档实质内涵的准确描述;二是由于对政府信息领域知识的缺乏,用户不能很好地提出符合自己检索需求的检索条件。这两个问题导致检索结果远远不能满足用户的要求。 本体是“概念模型的明确的规范说明”,它提供明确定义的词汇表,描述概念和概念之间的关系,被当作某个领域内不同主体之间进行交流的一种语义基础。它被广泛的应用于信息检索,特别是基于知识的检索中,能显著提高检索系统的查全率和查准率。 本文提出了构建政府信息领域本体并将其应用于政府信息检索系统的方案。首先,研究了现有的领域本体构建方法;在分析了政府信息领域的特点,考察了该领域可用资源的基础上,提出了基于政务主题词表的政府信息领域本体的构建方法。该方法充分利用了《综合电子政务主题词表》中已有的主题词和关系,保证了本体概念添加的完备性和科学性,减少了对领域专家的依赖,提高了构建效率。 设计和实现了基于领域本体的政府信息检索系统。该系统以领域本体为核心,对检索条件进行了扩展,既解决了检索词同政府信息中的公文用词存在差异的问题,又进一步明确了用户的检索需求;对政府信息文档进行了语义标注,提高了检索匹配时的准确度。同时,系统将与检索条件相关的领域概念反馈给用户,便于用户了解领域知识,进一步优化检索条件,获得更全更准的检索结果。
Resumo:
需求是后续开发活动的基准,早期的一些研究者认为应该在需求完全确定之后再进行后续开发,Royce所提出的瀑布模型就是这种思想的一个体现。但是,实践经验告诉我们,不管前期的需求分析做的多么完美,需求还是会发生变更。一方面是因为需求本身很复杂,对它的分析、理解和描述是一个循序渐进的过程,不可能一蹴而就;另一方面由于用户期望和偏好的改变、市场环境的转变、使用环境的日益复杂、技术的革新等都会使得原有的软件系统无法满足各涉众的利益。因此,需求变更是软件开发中固有的规律,是不可避免和普遍存在的。 需求变更通常会导致需求间及需求与后续工作产品间的不一致。因此,频繁的需求变更会造成产品质量下降、进度延期、成本超支等问题。变更影响分析(Change Impact Analysis)通过分析变更对象及其相关工作产品间的关系来评估变更造成的影响,从而控制变更。现有方法多数是从软件维护的角度,对代码的变更影响进行分析,过于细节和技术化,不能对需求变更影响分析提供有力支持。即使针对需求变更的影响分析方法也只是基于形式化需求规约,通过分析需求间的关系来识别影响范围,并未考虑需求变更对后续工作产品造成的影响,同时形式化需求规约的应用困难也限制了该方法的实用性。此外,随着需求和工作产品的规模与复杂性日益增加,使得手工建立和维护需求间及需求与工作产品间关系面临着不小的难度。 基于以上分析,本文提出了针对自然语言需求规约的需求变更影响分析模型RCIAM (Requirement Change Impact Analysis Model),围绕着如何自动识别和筛选需求间的关系——横向需求跟踪关系(Horizontal Requirement Traceability)、如何自动识别和筛选需求与工作产品间的关系——纵向需求跟踪关系(Vertical Requirement Traceability)、如何较全面的进行需求变更影响计算和决策三个问题展开了研究。 本文的主要贡献有: (1) 提出了需求变更影响分析模型RCIAM 本文对RCIAM进行了形式化定义。该模型不但提供了需求变更影响分析算法和对决策的支持,还提供了自动识别横向和纵向需求跟踪关系的方法。RCIAM主要包含数据处理和数据分析两个层次。数据处理层采用了文本处理(Text Processing)技术实现了横向和纵向需求跟踪关系的自动识别,为数据分析层提供需求跟踪关系数据;数据分析层基于需求跟踪关系数据,在产生需求变更申请(Change Request)时,进行量化影响计算,并提供决策支持。 (2) 提出了横向需求跟踪关系的识别与筛选方法 在对自然语言需求规约文档进行深入分析后,我们发现了两种与需求变更影响密切相关的关系类型,并从文本相似性的角度将它们定义为相似跟踪关系和引用跟踪关系。在将需求项拆分为需求片段的基础上,利用信息检索技术(Information Retrieval,IR)计算需求片段间的文本相似度,并设计了相应的算法对相似跟踪关系和引用跟踪关系进行自动识别。最后,提出了“变更影响跟踪”的规则来辅助对候选跟踪关系的人工筛选。 (3) 提出了纵向需求跟踪关系的识别与筛选方法 已有的研究多采用IR技术来自动建立需求与工作产品之间的跟踪关系,但是却存在着精度不理想的问题。我们从查全率(Recall)和查准率(Precision)的角度,分析了应用IR技术自动建立需求与代码跟踪关系的方法中产生的错误关系,发现了造成精度问题的根源所在。依据这一发现,基于现有方法,本文方法加入了相关反馈(Relvant Feedback)辅助识别和代码注释信息辅助识别等改进措施,并提供了人工筛选策略。 (4) 提出了需求变更影响分析计算与决策方法 本文通过矩阵运算说明了需求变更影响通过需求跟踪关系传播到其它需求和工作产品的过程,并设计了相应的需求变更影响分析算法。该算法考虑变更发生在不同阶段时对不同类型工作产品的影响,采用变更类型和关系强度两个因子加权计算影响值,并提出了根据影响值来进行变更决策的方法。 (5) 应用研究 结合中科方德公司Qone平台的开发,对以上工作进行了应用研究和性能分析。在Qone平台的需求管理工具版本1.0的开发中,首先采用本文方法对横向和纵向需求跟踪关系进行了自动识别,然后对开发期间发生的十次需求变更申请进行了影响分析和决策。在项目完成后,设计了实验对横向和纵向需求跟踪关系的识别进行了性能分析。结果表明,本文方法能够有效辅助进行需求变更影响分析。