3 resultados para wordnet

em Chinese Academy of Sciences Institutional Repositories Grid Portal


Relevância:

10.00% 10.00%

Publicador:

Resumo:

在基于映射的数据交换系统框架下,提出了一种本体辅助的模式匹配方法.它利用WordNet词汇本体和决策树学习相结合的方法进行属性名称匹配,构建数据类型本体计算属性数据类型的语义距离,依赖领域本体发现一对多的语义匹配关系,这3个过程逐步提高了匹配质量.建立在实际应用数据上的实验结果表明,该方法具有较高的精确度和召回率.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

随着网络技术的快速发展、企业信息化的不断深入,企业中分布的数据、信息和知识更加多样,更加复杂,企业信息系统更加开放。如何实现企业中这些数据、信息和知识集成和共享已成为关键性问题。数据集成技术正是针对这种需求,实现分布、异构、复杂数据、信息和知识的动态、灵活、实时的集成和共享。 OnceDI 2.0很好的解决了在数据级别上异构数据源的互操作问题,满足不同的数据集成需求,跨平台,跨多种数据源,具有增量传输,冲突解决等多种实用机制,并提供完善的安全和管理工具。然而,它也存在缺陷,包括:接收数据源只能根据接收到的数据块定义,这时已经完成了数据的发送过程;发送数据源和接收数据源的字段对应关系必须完全由人工构建等问题。 数据集成的目标是为用户访问多个分布的、独立的、异构的数据源提供统一的应用界面。在ETL(Extract-Transform-Load,即数据抽取、转换和加载)过程可视化配置中,包含如何让用户更好地理解ETL过程以及如何让用户更有效地、更容易地配置、管理和执行ETL过程等问题。 论文在研究数据集成过程特点基础上,围绕数据集成中的可视化ETL过程的问题,确立了本文关于数据集成中数据转换和数据过滤的研究方向。针对数据转换,论文从模式匹配和实例转换两方面入手。在模式匹配方面,论文提出一种本体辅助的自动化模式匹配算法,它包括三部分:决策树学习和WordNet词汇本体相结合的方法计算属性名称匹配,定义属性数据类型本体解决带数据类型的属性匹配以及利用领域本体构建属性间的非直接映射关系解决一对多的语义匹配。该方法使得数据转换的可视化过程操作更加简便,自动化匹配结果更令用户满意。在实例转换方面,论文提出一种实例转换工具的设计方案,界面更加友好,更重要地,使得用户对实例级别的转换操作更加清晰、简单。针对数据过滤,论文从数据质量控制条件设置的特点入手,提出一种数据质量控制条件设置工具设计方案。 最后,本文针对OnceDI 3.0中的数据集成模型和OnceDI 3.0客户端-控制中心-DI服务器的三层体系结构设计实现数据集成中的可视化ETL工具,在设计中通过设计模式的应用增强了系统的可扩展性。

Relevância:

10.00% 10.00%

Publicador:

Resumo:

领域构件的接口名称不仅仅只是一个使其唯一的标识符,其中往往蕴含了相关领域中的语义信息。本文假设构件的设计者在对构件接口进行命名时,会尽量包含接口在领域中的语义信息,这些信息包括:构件接口运行的环境,构件接口操作的领域对象,以及构件接口对领域对象所进行的操作。本文将试图从接口的名称中发掘出这些信息,并以此作为依据来对用户的查询请求进行基于语义的匹配度计算。本文将本体论的观点用在知识表达上,即借由本体论中的基本元素:概念及概念间的关联,作为描述真实世界的知识模型。描述了如何运用本体来表现领域中一组基本概念以及这些概念之间的关系,以及利用这些术语和关系构成的规定领域本体外延的规则的定义。本文利用经过改进的WordNet模型来描述领域本体,通过对保险领域进行分析得到描述保险领域基本语义的原始语料库,并利用原始语料库对构件接口进行解析,将解析得到的语义信息记录在解析构件库。对于用户的查询请求,也采用基于语义的描述,将其和解析构件库中的接口名称包含的语义进行相似度计算,并返回给查询用户。本文将上述方法在北京市科委的项目中进行了实践,建立了保险领域本体的参考模型,以保险核心业务系统的构件库作为实验对象,设计了一套基于语义的接口匹配系统,取得了较好的效果。