20 resultados para NUDIST (Information retrieval system)
em Chinese Academy of Sciences Institutional Repositories Grid Portal
Resumo:
With the digital all-sky imager (ASI) emergence in aurora research, millions of images are captured annually. However, only a fraction of which can be actually used. To address the problem incurred by low efficient manual processing, an integrated image analysis and retrieval system is developed. For precisely representing aurora image, macroscopic and microscopic features are combined to describe aurora texture. To reduce the feature dimensionality of the huge dataset, a modified local binary pattern (LBP) called ALBP is proposed to depict the microscopic texture, and scale-invariant Gabor and orientation-invariant Gabor are employed to extract the macroscopic texture. A physical property of aurora is inducted as region features to bridge the gap between the low-level visual features and high-level semantic description. The experiments results demonstrate that the ALBP method achieves high classification rate and low computational complexity. The retrieval simulation results show that the developed retrieval system is efficient for huge dataset. (c) 2010 Elsevier Inc. All rights reserved.
Resumo:
政府信息检索系统作为政府信息公开平台的重要组成部分,对于用户从大量信息中准确查找所需信息起到关键作用,然而现有政府信息检索系统存在两个主要问题:一是系统采用的基于关键词匹配的检索技术忽视了对于用户检索条件的语义的理解,缺乏对于文档实质内涵的准确描述;二是由于对政府信息领域知识的缺乏,用户不能很好地提出符合自己检索需求的检索条件。这两个问题导致检索结果远远不能满足用户的要求。 本体是“概念模型的明确的规范说明”,它提供明确定义的词汇表,描述概念和概念之间的关系,被当作某个领域内不同主体之间进行交流的一种语义基础。它被广泛的应用于信息检索,特别是基于知识的检索中,能显著提高检索系统的查全率和查准率。 本文提出了构建政府信息领域本体并将其应用于政府信息检索系统的方案。首先,研究了现有的领域本体构建方法;在分析了政府信息领域的特点,考察了该领域可用资源的基础上,提出了基于政务主题词表的政府信息领域本体的构建方法。该方法充分利用了《综合电子政务主题词表》中已有的主题词和关系,保证了本体概念添加的完备性和科学性,减少了对领域专家的依赖,提高了构建效率。 设计和实现了基于领域本体的政府信息检索系统。该系统以领域本体为核心,对检索条件进行了扩展,既解决了检索词同政府信息中的公文用词存在差异的问题,又进一步明确了用户的检索需求;对政府信息文档进行了语义标注,提高了检索匹配时的准确度。同时,系统将与检索条件相关的领域概念反馈给用户,便于用户了解领域知识,进一步优化检索条件,获得更全更准的检索结果。
Resumo:
植物志是植物分类学研究中最重要的成果之一,它包含了大量的信息,如形态描述、命名及考证、地理分布等,其中形态学信息最为丰富,而且在分类学研究中始终占据着重要地位。植物分类学数据量的庞大和繁琐显然不适合手工处理,因此有必要利用计算机收集整理批量化数据的优势,以实现植物形态数据的自动处理。 本项研究结合作者的计算机实践和对分类学的认识,首次采用转换生成语法技术对植物志文本进行词法分析、语法分析以提炼植物志所包含的形态学信息,初步实现了植物志自然文本的中英文转换、中文检索表到数据库的自动转换、普通植物志描述文本到数据库的自动转换。 1.本系统处理过程对植物志文本不加任何限制,即无须前编辑处理,于是就增加了植物形态术语的切分难度,但由此提出了结合植物形态信息处理特点的词语切分方法。数值信息在植物志中占据着重要的地位,本系统则采用正规文法处理整数和无符号小数。 2.本系统将植物志文本的句式分为基本句和复合句,以基本句为基础总结归纳了一套适用于植物志文本的上下文无关文法,系统扩充了DELTA系统的描述结构,允许无性状主体句式的存在。而在语法制导翻译阶段利用继承属性补足无主句的性状主体。 3.本系统虽以绞股蓝属为基础来开展研究工作的,总结出文法并进行植物志文本的中英文转换,但经扩大术语库的词汇量后,也能适用于其他的科属。本系统附带有术语库的修订功能,可以自行编辑、修改和添加术语库中的词汇。 4.本系统设计了从检索表到数据库的自动转换程序,利用数据库的特点方便检索的查询。 5.系统实现了从一般植物志描述文本到数据库的自动生成,以利于对植物志住处的收集整理和查询。
Resumo:
The photocurrent curves of reflection-mode GaAs photocathodes as a function of time, when were illuminated by white light with an intensity of 0, 33 and 100 Ix, respectively, were measured using a multi-information measurement system. The calculated lifetimes of cathodes are 320, 160 and 75 min, respectively, showing that the stability of cathodes degraded with the increase of light intensity. The lifetime of cathode, illuminated by white light with an intensity of 100 Ix, while no photocurrent was being drawn during the illumination, was 100 min. Through comparison, we found that the influence of illumination on cathodes stability is greater than that of photocurrent. The quantum-yield curves of cathodes as a functions of time, when illuminated by white light with an intensity of 33 Ix, were measured also. The measured results show that the shape of the yield curves changes with increasing illumination time due to the faster quantum-yield degradation rate of low energy photons. Based on the revised quantum-efficiency equations for the reflection-mode cathodes, the variation of yield curves are analyzed to be due to the intervalley diffusion of photoelectrons and the evolution of the surface potential barrier profile of the photocathodes during degradation process.
Resumo:
需求是后续开发活动的基准,早期的一些研究者认为应该在需求完全确定之后再进行后续开发,Royce所提出的瀑布模型就是这种思想的一个体现。但是,实践经验告诉我们,不管前期的需求分析做的多么完美,需求还是会发生变更。一方面是因为需求本身很复杂,对它的分析、理解和描述是一个循序渐进的过程,不可能一蹴而就;另一方面由于用户期望和偏好的改变、市场环境的转变、使用环境的日益复杂、技术的革新等都会使得原有的软件系统无法满足各涉众的利益。因此,需求变更是软件开发中固有的规律,是不可避免和普遍存在的。 需求变更通常会导致需求间及需求与后续工作产品间的不一致。因此,频繁的需求变更会造成产品质量下降、进度延期、成本超支等问题。变更影响分析(Change Impact Analysis)通过分析变更对象及其相关工作产品间的关系来评估变更造成的影响,从而控制变更。现有方法多数是从软件维护的角度,对代码的变更影响进行分析,过于细节和技术化,不能对需求变更影响分析提供有力支持。即使针对需求变更的影响分析方法也只是基于形式化需求规约,通过分析需求间的关系来识别影响范围,并未考虑需求变更对后续工作产品造成的影响,同时形式化需求规约的应用困难也限制了该方法的实用性。此外,随着需求和工作产品的规模与复杂性日益增加,使得手工建立和维护需求间及需求与工作产品间关系面临着不小的难度。 基于以上分析,本文提出了针对自然语言需求规约的需求变更影响分析模型RCIAM (Requirement Change Impact Analysis Model),围绕着如何自动识别和筛选需求间的关系——横向需求跟踪关系(Horizontal Requirement Traceability)、如何自动识别和筛选需求与工作产品间的关系——纵向需求跟踪关系(Vertical Requirement Traceability)、如何较全面的进行需求变更影响计算和决策三个问题展开了研究。 本文的主要贡献有: (1) 提出了需求变更影响分析模型RCIAM 本文对RCIAM进行了形式化定义。该模型不但提供了需求变更影响分析算法和对决策的支持,还提供了自动识别横向和纵向需求跟踪关系的方法。RCIAM主要包含数据处理和数据分析两个层次。数据处理层采用了文本处理(Text Processing)技术实现了横向和纵向需求跟踪关系的自动识别,为数据分析层提供需求跟踪关系数据;数据分析层基于需求跟踪关系数据,在产生需求变更申请(Change Request)时,进行量化影响计算,并提供决策支持。 (2) 提出了横向需求跟踪关系的识别与筛选方法 在对自然语言需求规约文档进行深入分析后,我们发现了两种与需求变更影响密切相关的关系类型,并从文本相似性的角度将它们定义为相似跟踪关系和引用跟踪关系。在将需求项拆分为需求片段的基础上,利用信息检索技术(Information Retrieval,IR)计算需求片段间的文本相似度,并设计了相应的算法对相似跟踪关系和引用跟踪关系进行自动识别。最后,提出了“变更影响跟踪”的规则来辅助对候选跟踪关系的人工筛选。 (3) 提出了纵向需求跟踪关系的识别与筛选方法 已有的研究多采用IR技术来自动建立需求与工作产品之间的跟踪关系,但是却存在着精度不理想的问题。我们从查全率(Recall)和查准率(Precision)的角度,分析了应用IR技术自动建立需求与代码跟踪关系的方法中产生的错误关系,发现了造成精度问题的根源所在。依据这一发现,基于现有方法,本文方法加入了相关反馈(Relvant Feedback)辅助识别和代码注释信息辅助识别等改进措施,并提供了人工筛选策略。 (4) 提出了需求变更影响分析计算与决策方法 本文通过矩阵运算说明了需求变更影响通过需求跟踪关系传播到其它需求和工作产品的过程,并设计了相应的需求变更影响分析算法。该算法考虑变更发生在不同阶段时对不同类型工作产品的影响,采用变更类型和关系强度两个因子加权计算影响值,并提出了根据影响值来进行变更决策的方法。 (5) 应用研究 结合中科方德公司Qone平台的开发,对以上工作进行了应用研究和性能分析。在Qone平台的需求管理工具版本1.0的开发中,首先采用本文方法对横向和纵向需求跟踪关系进行了自动识别,然后对开发期间发生的十次需求变更申请进行了影响分析和决策。在项目完成后,设计了实验对横向和纵向需求跟踪关系的识别进行了性能分析。结果表明,本文方法能够有效辅助进行需求变更影响分析。
Resumo:
首先分析国内电信企业对于商业智能的需求及一些现有电信企业商业智能系统的不足,如投资大、建设周期长等,然后提出解决措施,通过采用数据集市和配置文件的方式控制建设成本、降低实施难度,并描述面向电信企业的商业智能应用分析系统TEIAS(Telecom Enterprise Information Analysis System)的系统结构和实现,最后提出改进方向。
Resumo:
为满足移动环境对非结构化个人信息管理的自然性和高效性的需求,提出一个基于移动设备的个人信息管理系统Ruby.首先分析了移动环境对个人信息管理的需求,描述了系统框架,接着介绍了系统界面和交互过程,并阐述了支持该系统的2个主要技术:非结构化笔记编辑技术和基于笔迹标签的检索技术.对2个技术和整个系统的评估结果表明,该系统能够满足移动环境对自然交互、非结构化信息采集加工及个人信息自然检索的需求.
Resumo:
针对船载综合信息显示系统在实体船舶内开发不方便的问题,提出了一种半实物仿真系统的设计与实现方法。结合"科学三号"海洋科学考察船的综合信息显示系统的设计和开发过程,从体系结构、信息流程和实现方法3个方面对半实物仿真系统的设计和实现过程进行了探索。实践结果表明,这种半实物仿真系统一方面可以为实际系统的体系结构、信息流程设计提供支持,另一方面可以为实际系统应用软件的开发提供较为真实的环境,有效的缩短开发时间和降低开发风险。