993 resultados para iscas
Resumo:
Abstract. Latent Dirichlet Allocation (LDA) is a document level language model. In general, LDA employ the symmetry Dirichlet distribution as prior of the topic-words’ distributions to implement model smoothing. In this paper, we propose a data-driven smoothing strategy in which probability mass is allocated from smoothing-data to latent variables by the intrinsic inference procedure of LDA. In such a way, the arbitrariness of choosing latent variables'priors for the multi-level graphical model is overcome. Following this data-driven strategy,two concrete methods, Laplacian smoothing and Jelinek-Mercer smoothing, are employed to LDA model. Evaluations on different text categorization collections show data-driven smoothing can significantly improve the performance in balanced and unbalanced corpora.
Resumo:
普适计算的计算环境和交互信息动态变化,为了提供适时适地的服务,服务组合除了满足用户的需求之外,还要适应环境的变化.以面向普适计算的分布式文档管理系统为例,提出一种基于上下文协商的动态服务组合方法,适应普适计算环境下资源动态变化的特点,同时满足用户对服务的需求.首先定义上下文和带有上下文信息的服务模型;然后给出服务和设备以及服务和用户之间的上下文协商约束条件,根据约束条件提出基本算法实现服务动态组合,并对基本算法进行优化;最后通过原型系统和实验验证算法的性能和有效性,并通过实验数据分析上下文对于服务组合的影响.实验数据说明:提出的方法能够应用在普适计算环境中上下文敏感的服务组合问题上,提高服务组合的动态适应性和网络资源利用率.
Resumo:
网络查询分类对提高搜索引擎的搜索质量有重要的意义。本文通过真实用户查询日志的分析和标 注,发现四种特征词(称之为“VASE”特征词)对查询分类起决定性作用。我们提取特征词并构造了一个 特征词倒排索引,用于对查询进行主题分类。在此基础之上,提出了基于网络扩展和加权特征词的方法改 善分类的效果。实验结果显示,基于此分类方法的正确率和召回率分别达到78.2%和77.3%。
Resumo:
搜索引擎是网络用户最常用的网络服务之一。用户通过向搜索引擎提交查询(Query)的方式获取与该查询相关的信息。由于用户的背景各不相同,即使他们输入完全相同的查询语句,其需求也可能是不同的。传统的搜索引擎并没有针对用户来设计查询的相关度算法,因此难以给出令每个用户满意的结果。目前人们提出通过个性化检索技术来解决这一难题。而查询分类是个性化检索中最具挑战性的关键技术之一。 本文通过对大规模真实中文查询语句的分析,提出使用VASE特征词的方法对查询所属的主题进行分类,并采用规则的方法对用户的意图进行自动识别,实验结果表明该方法能够有效地对查询主题和用户意图进行识别。 随后本文探讨了如何使用查询分类的结果进行个性化检索。基于用户的点击信息和查询类别,分别采用对查询结果进行过滤、次级关键词的提取以及对不同的查询意图采用不同的排序算法等三种策略对检索的结果进行改进。实验结果表明这些方法都取得了良好的效果。 最后,本文设计并实现了客户端个性化检索工具,以Firefox浏览器插件的形式,对用户输入的查询进行分类,并基于百度的搜索结果并为用户提供个性化检索的功能。
Resumo:
知识在多个参与者之间的产生、传播与应用称为知识流.在知识密集型组织中,对业务过程的控制和对知识资产的管理具有紧密的依赖关系.工作流管理是实现业务过程控制的重要技术.当前的工作流过程元模型不支持对知识管理机制的表示.为此,提出了一个扩展的工作流过程元模型,以支持业务过程控制与知识管理的集成.在此慕?S肟刂平?辛松钊氲难芯?提出了一种知识流建模方法,通过 5 类知识流单元对知识传递与重用、人员协作与交流进行表示.针对知识流中的动态因素,研究了基于资源约束、知识需求变化和时间约束的知识流控制方法,以实现自适应的知识流控制,并给出了有关算法.为工作流技术与知识管理技术的有效结合提供了一个有益的途径.
Resumo:
随着硬件性能的不断提升,计算机正在被赋予越来越艰巨的任务,运行其上的软件作为沟通人类思维和底层硬件的桥梁,其重要性日益增加。与此同时,软件系统的规模也在不断变大,所涉及的逻辑也更为复杂,这导致开发人员难免会由于疏漏在软件设计实现的过程中引入缺陷、埋下隐患。所以,如何检验、确保软件的属性就成为时下一个亟待解决的热点问题。而在此背景下,源代码静态分析技术由于恰好可以弥补现有测试方法的不足,已经开始在这一研究领域崭露头角。有鉴于此,本文为了推进安全信息系统的研发,分别围绕源代码静态分析技术在软件属性保障中两个最主要的应用场景展开研究,涉及高等级安全操作系统开发过程中的源代码自动化审计,以及分布式信息系统中平台间互信建立时针对软件属性所进行的远程验证,其中,前者是为从深度上将现有安全操作系统向更高等级推进提供助力,而后者是为了从广度上将信息安全领域现有的围绕单机平台的研究成果向分布式架构推广建立基础。具体来说,本文选择针对编程接口规范的一致性检验和应用静态分析的软件属性远程验证作为研究的切入点,探讨了应用源代码静态分析技术检验、确保软件属性的方法和用途,主要取得以下几个方面的成果: 第一,本文给出了一个基于值等价类的别名分析方法。该方法依据相关的传值操作维护一个值等价类空间,可以在编程接口规范一致性检验的过程中按需推导变量符号间的等值关系,不仅有能力支持上下文相关、路径相关的全局分析,还可以有效应对C代码中因结构、指针等构件所衍生出来的大量变量符号。 第二,针对大部分现有代码静态分析工具分析规模受限的问题,本文围绕编程接口规范的一致性检验给出了可以与别名分析有效结合的性能优化方案。该方案不仅能通过剔除与分析无关的执行分支和引入缓存机制提高分析效率,还可以尽量确保分析的准确性少受影响。 第三,我们设计、实现了一个C代码静态分析工具ABAZER(A Bug AnalyZER)。该工具可以依据用户使用有限自动机模型描述的编程接口规范,对操作系统内核级别的软件进行全局分析,指出代码中可能有悖于规范的部分。我们使用ABAZER实际考查了FreeBSD内核中锁机制以及GCC 4.x中库GNU Libiberty的使用情况,从中发现了若干真实的缺陷。 第四,本文针对现有应用可信计算技术、基于完整性信息进行远程验证的方案在灵活性和实用性上所存在的不足,给出一个扩展方案。该方案通过引入虚拟机技术,在软件构建过程中收集举证信息,应用静态分析方法分析软件功能模块间的相关性,划分出与验证相关的模块,有效控制用户定制软件验证时所要依赖的可信列表的规模,使其有能力适应当今网络环境中的大量异质平台和各种安全需求。此外,它还可以为自身所依赖的可信计算基的替换和更新提供支持。 第五,本文针对Flask架构的特点,给出了一个既能检验强制访问控制实现正确性,又能最大限度保留软件灵活性、使得用户可以在一定程度上对软件进行定制的远程验证方案。该方案依赖源代码静态分析技术界定软件中无需基于完整性进行验证的模块,在进一步缩减可信列表规模的同时,使用代码改写技术在这些模块中自动化地插入监控代码约束软件的动态行为,以达到确保强制访问控制实现正确性的目的。该方案初步展现了源代码静态分析技术在远程验证中广阔的应用前景。
Resumo:
传统的基于“词袋”的文本表示方法假定词的权重只和它本身的出现频率有关,而忽略上下文信息。 本文提出了一种基于上下文的图模型文本表示方法,使用一种类似PageRank的图模型来建立词和词之间的相 互推荐关系,该方法克服了传统文本表示认为词和词之间相互独立,忽略词的上下文环境的缺陷。在复邑中文 文本分类和20newsgroup英文文本分类的语料库上的实验表明,我们的方法可以有效地提升文本分类的性能。
Resumo:
参数化系统(paramterized system)是指包含特定有限状态进程多个实例的并发系统,其中的参数是指系统内进程实例的数目,即系统的规模.反向可达性分析(backward reachability analysis)已被广泛用于验证参数化系统是否满足以向上封闭(upward-closed)集合表示的安全性(safety property).与有限状态系统验证相类似,参数化系统的验证同样也面临着状态爆炸(state explosion)问题,并且模型检测算法的有效性依赖于如何采用有效的数据结构表示状态集合.针对表示无穷状态的向上封闭集合,研究人员提出了多种基于约束(constraint-based)的符号表示方法.但这些方法依然面临着符号状态爆炸(symbolic state explosion)问题或者其包含判定问题,即判断一个约束条件集合符号化表示的实际状态集合是否为另一约束条件集合所对应的状态集合的子集,是Co-NP完全问题.因此,虽然有限状态验证技术能够验证一些具有一定规模的问题,但现有针对参数化系统的验证方法所能解决的问题的规模较为有限,需要近一步提高模型检测算法的效率.针对参数化系统提出了加快反向可达性分析的多个启发式规则,实验结果表明,这些启发式规则可以使算法的效率提高几个数量级,从而有助于解决现有参数化系统验证方法所存在的问题.
Resumo:
在网络环境中,计算机系统面临的安全威胁是复杂的、多样的和动态变化的,因而,计算机系统的安全需求具有复杂性、多样性和动态变化性等特点。研究表明,多安全策略访问控制是应对复杂、动态安全需求的有效手段。本文对多安全策略访问控制的关键技术进行了研究,并取得了以下研究成果: 第一,对操作系统的强制访问控制框架的正确性验证进行了研究,提出了正确性验证的三个目标,给出了路径敏感的基于静态分析的正确性验证方法,对TrustedBSD MAC框架进行了正确性验证,并成功发现了多处钩子函数放置错误。 第二,对RBAC模型的安全策略的动态调整进行了研究,指出了RBAC模型在安全策略动态调整,特别是角色授权动态调整方面存在的不足,给出了基于状态的安全策略动态调整模型,并给出了基于虚拟域的安全策略动态调整模型的实现方法。 第三,对RBAC模型和Clark-Wilson模型的融合进行了研究,指出了这两个模型在大型应用的完整性保护方面存在的不足,对Clark-Wilson模型的验证规则和实施规则进行了扩展,并给出了RBAC模型和Clark-Wilson模型基于层次方法的融合。 第四,对安全策略描述框架的评价进行了研究,分析了灵活表达安全策略所需的安全策略描述组件,总结了六类典型的安全策略描述框架,提出了基于描述性和实施性评价指标的安全策略描述框架的评价方法,并对六类典型的安全策略描述框架进行了评价。 本文的研究解决了多安全策略访问控制的一些关键问题,为进一步研究多安全策略的实施、多安全策略的动态调整以及多安全策略的融合等问题奠定了理论与实践基础。
Resumo:
针对内网办公中机密数据需要安全和高速加解密的特点,本文提出了基于组合对称密钥的机密数据存储和传输方案。其中组合对称密钥的加密方法与以往对称加密相比,具有加密密钥一次一变和密钥免维护的优点:与传统的非对称加密相比,具有加解密速度快,密钥管理简单的特点,并且该方案能够在基于对称加密的系统中实现一人加密文件,多人可以解密查看。
Resumo:
软件需求管理是软件生产与质量管理的重要内容 .面对今天以需求变化难以控制为主要特点的软件危机 ,我们一方面必须采用更加合适的软件工程和需求工程方法 ,去适应需求的不断变化和增长 ;同时还必须采用合适的度量方法和手段 ,去分析需求变化的趋势和原因 ,并控制和管理需求的变化 .该文提出了一种以统计过程控制原理对软件项目的需求变化进行统计控制 ,并对异常波动进行度量分析的软件需求度量方法 .
Resumo:
汉字输入技术是中文信息处理领域特有的一项基础性关键技术,中文输入法是中文用户使用计算机必备的应用软件。依赖于键盘的中文输入法可以分为两大类:基于汉字字形和基于拼音的输入法。据统计,拼音输入法是计算机用户最常用的汉字输入工具。 在互联网高速发展的今天,随着Web2.0以用户为中心的网络环境的流行,普通用户已经成为信息的发布者,而这对中文输入技术提出了更高的要求。因此,在这个时代背景下,如何进一步提高中文输入法的效率成为一个既有挑战性又有实际应用价值的研究课题。我们在分析了现有拼音输入法的基础上,主要在以下几个方面做了一些研究: 实现了一个基于统计语言模型的音字转换系统。针对音字转换系统中基于字的统计语言模型的一些问题进行了研究,提出了利用更多上下文信息来改进语言模型的方法,最后设计实验进行了验证和分析。 改进了基于分层隐马尔可夫模型的音字转换解码方法。对音字转换中拼音流切分作了分析,发现拼音流切分存在歧义,而且这些歧义对音字转换的准确率存在较大影响,提出了利用统计语言模型辅助拼音流切分的方法,最后设计实验进行验证。 对网络用户常用的应用以及用户的个性化因素(用户的聊天记录,浏览历史,搜索引擎查询历史)进行了分析与研究,实现了基于网络用户信息的个性化拼音输入法,提高输入法系统性能和用户输入体验。
Resumo:
通过软件开发实践,人们逐步地认识到软件产品的质量在很大程度上依赖于产品开发时所使用的过程.软件过程建模是通过特定的方法对软件过程进行抽象、表示和分析以增加对软件过程的理解,同时,可执行的(enactable)软件过程模型可以直接指导实际软件开发活动,进而规范软件开发行为并最终提高软件质量.为了系统地了解软件过程建模方法研究的现状和最新进展,采用系统评价(systematic review)方法对该领域最近10年的主要研究进行了概括和分析.从一系列的相关研究中,选出来自20个会议和7种期刊的72篇文献,作为系统评价的依据.该系统评价回答了如下关于软件过程建模方法的3个问题,以便从总体上概括和把握该领域的研究:1)软件过程建模方法主要基于什么范式;2)软件过程建模方法研究的主要目的集中在哪些方面;3)软件过程建模方法的研究有哪些新的趋势.同时,在仔细回顾和分析软件过程建模领域研究现状的基础上,给出了一种多维度的集成化软件过程建模方法.该方法有助于解决过程建模领域所面临的主要问题.
Resumo:
分布式应用的飞速发展让结点平台的可信保障成为信息安全的研究热点。传统计算机平台的信息安全技术很难满足分布式计算环境的安全需求。可信计算技术通过引入可信硬件作为“信任根”,为保障结点平台的可信性提供了新的机制。基于可信计算的度量验证技术是保障平台可信性的核心机制,目前的相关研究在可信性、隐私性、易用性等方面还存在问题。 本文总结度量验证的基本概念和实施模型;分析现有度量验证机制在平台隐私保护、运行时完整性保障上存在的问题,提出相应具体解决方案;并基于度量验证机制提出一种新的对等网络声誉系统,具体创新成果如下: 1. 分析可信与完整性的本质,提出动态系统完整性的概念,并基于Clark-Wilson完整性模型给出具体实施规则,用于指导运行时完整性保障机制的设计与实现。 2. 针对经典度量验证体系架构存在的平台隐私保护不力、验证效率低下、验证方式单一等不足,提出基于Merkle哈希树的度量验证机制RAMT,并阐述其体系架构和具体实现。 3. 分析载入时完整性保障的缺陷,提出运行时完整性保障机制,通过对关键系统构件的运行时完整性进行监控提高其可信性;给出一种基于动态完整性度量模块DIMM的具体实现方案,分析该方案的可靠性和有效性,并阐述其在虚拟机环境下的实际应用vTPM-DIMM。 4. 为解决现有声誉系统的负载平衡、冷启动以及协同作弊问题,基于度量验证机制提出一种多级别的可信声誉系统MRS;通过CCEA实施全局的访问控制规则,MRS还可作为激励机制使用。
Resumo:
首先针对开放式实时系统 ,讨论了自适应实时调度的需求情况和自适应技术应用上的关键问题 ;提出了适用于硬实时调度需求的调度参数自适应调整机制 ;重点面向软实时调度需求 ,提出了一种基于模糊控制策略的自适应调度方法 ,它致力于动态跟踪调度对象的负载变化 ,并把截止期错过率控制在期望值附近 .相对于现有方法 ,更适合于解决开放式实时系统中的自适应调度问题