67 resultados para Vision-based row tracking algorithm
Resumo:
An optimal feedback control of broadband frequency up-conversion in BBO crystal is experimentally demonstrated by shaping femto-second laser pulses based on genetic algorithm, and the frequency up-conversion efficiency can be enhanced by similar to 16%. SPIDER results show that the optimal laser pulses have shorter pulse-width with the little negative chirp than the original pulse with the little positive chirp. By modulating the fundamental spectral phase with periodic square distribution on SLM-256, the frequency up-conversion can be effectively controlled by the factor of about 17%. The experimental results indicate that the broadband frequency up-conversion efficiency is related to both of second harmonic generation (SHG) and sum frequency generation (SFG), where the former depends on the fundamental pulse intensity, and the latter depends on not only the fundamental pulse intensity but also the fundamental pulse spectral phase. (c) 2006 Elsevier B.V. All rights reserved.
Resumo:
强外加电场与大调制度在光折变效应的研究中已经得到了广泛应用。采用PDECOL算法, 严格求解光折变带输运方程, 得到外加电场时不同调制度下光折变晶体中随时间变化的空间电荷场、载流子浓度, 并讨论了外加电场对它们的影响。通过将物质方程与耦合波方程联立数值求解, 可得到光折变光栅形成过程中两波耦合增益系数以及光束条纹相位的变化。模拟结果表明, 在强外加电场作用下, 两束记录光之间的光强与相位耦合都得到了增强, 而原有的解析式忽视了强外加电场与大调制度对空间电荷场相位耦合的影响, 此时不再适用。同时发现折射率光
Resumo:
Far-field spot compression without energy loss in main lob is of great significance to wireless laser communication. In this letter, we propose two schemes to obtain far-field spot compression without energy loss in main lob. One scheme is based on the simulated annealing (SA) algorithm. Using SA algorithm, we design the phase profile of the diffractive phase element (DPE). Using the designed DPE, far-field spot compression without energy loss in main lob is achieved. The other scheme is based on YG algorithm. By means of YG algorithm, we appropriately designed the DPE in the emitting plane. Using the DPE, far-field spot compression without energy loss in main lob is obtained. (c) 2007 Elsevier GmbH. All rights reserved.
Resumo:
为了弥补WIMP界面模型对视觉交互描述的不足,提出一种基于视觉交互的用户界面模型.首先在分析和总结视觉交互过程的基础上,以活动理论为基础,提出一种以用户为中心、面向任务和基于事件驱动的用户界面模型;然后描述了该模型的组成结构及其相互关系;最后给出了一个基于此模型的视频手势交互系统实例.实验结果表明,该模型能够有效地支持视觉交互设计,使用户界面满足可用性要求.
Resumo:
针对视觉手势界面存在的问题,提出了一套行之有效的解决方案.首先,为了解决视觉手势交互中的Midas Touch问题,以人类注意的信息加工模型为理论依据提出了一个可扩展的视觉手势交互模型,该模型将手势交互过程分为选择性处理、分配性处理和集中处理3个不同阶段;然后,基于该模型提出了一个视觉手势识别框架,并结合认知心理学从手势检测、跟踪和识别3个方面对该框架的各个组成模块的关键技术进行了阐述,其中手势检测模块和识别管理模块能够辅助系统在复杂的背景中滤除掉不相关信息而选择性地搜索人手并根据上下文信息对手势识别任务重定向,从而避免了系统时刻都处于激活状态并对所有的手势动作都进行识别分析,有效解决了Midas Touch问题.文中介绍了使用该方法实现的IEToolkit手势界面工具平台,并基于一个视觉手势交互系统进行了实验测试与评估,结果验证了文中方法的可用性.
Resumo:
1 引言多Agent系统是由若干具有一个或多个目标的Agent按照一定的信息关系和控制关系以及问题求解能力的分布模式组成的系统,它主要研究一组在逻辑上或物理上分离的Agent之间行为的协调。目前,多Agent系统已应用于诸如空中交通控制、电子商务、通讯网络管理和作业调度等生产实际领域。Agent技术应用到实际领域时映射的对象一般有
Resumo:
为了减少地形动态变化时的地形计算时间,满足动态地形实时可视化的需要,在地形渲染库libMini的基础上,依据地形动态变化的局部性特点,以及库中LOD(Level ofDetail)算法的具体实现方式,运用局部更新的思想,提出了一种动态地形实时计算和渲染算法.算法避免了在地形动态变化时进行大量重复计算,使得在地形动态变化时所需的计算量大大减少,达到实时渲染要求.实验表明,算法使得局部地形动态变化时地形计算和渲染的时间从秒级降低到毫秒级,可以满足实时渲染要求.
Resumo:
According to the research results reported in the past decades, it is well acknowledged that face recognition is not a trivial task. With the development of electronic devices, we are gradually revealing the secret of object recognition in the primate's visual cortex. Therefore, it is time to reconsider face recognition by using biologically inspired features. In this paper, we represent face images by utilizing the C1 units, which correspond to complex cells in the visual cortex, and pool over S1 units by using a maximum operation to reserve only the maximum response of each local area of S1 units. The new representation is termed C1 Face. Because C1 Face is naturally a third-order tensor (or a three dimensional array), we propose three-way discriminative locality alignment (TWDLA), an extension of the discriminative locality alignment, which is a top-level discriminate manifold learning-based subspace learning algorithm. TWDLA has the following advantages: (1) it takes third-order tensors as input directly so the structure information can be well preserved; (2) it models the local geometry over every modality of the input tensors so the spatial relations of input tensors within a class can be preserved; (3) it maximizes the margin between a tensor and tensors from other classes over each modality so it performs well for recognition tasks and (4) it has no under sampling problem. Extensive experiments on YALE and FERET datasets show (1) the proposed C1Face representation can better represent face images than raw pixels and (2) TWDLA can duly preserve both the local geometry and the discriminative information over every modality for recognition.
Resumo:
随着人机交互技术的发展,各种新的交互手段不断涌现,使人机交互朝着更加自然、高效和智能化的方向前进。基于手势的视觉用户界面是post-WIMP时代的一种重要的界面形式,与传统的WIMP交互方式相比视觉手势交互能够使用户摆脱鼠标键盘的束缚而采用一种更加自然、无约束的交互方式,从而提供给用户更大的交互空间、更多的交互自由度和更逼真的交互体验,具有较高的应用价值和良好的应用前景,因此被国内外越来越多的研究者所关注,迅速成为了人机交互领域一个热门的研究方向,并被广泛应用于虚拟/增强现实、普适计算、智能空间以及基于计算机的互动游戏等多个领域。 视觉交互是自然人机交互的核心和热点研究内容之一,视觉交互可以通过手势、目光、头部运动或者面部表情等多种方式进行。其中,手势是人类进行视觉交互的主要手段,手势所能表达的语义信息十分丰富。在人机交互中使用视觉手势完成交互任务不仅自然、直观和方便,而且从计算机的角度出发来看系统实现起来也较为容易。因此,基于手势的视觉用户界面得到了广泛的关注并取得了许多研究成果。从目前的研究现状来看,在基于手势的视觉用户界面研究中,仍然存在着以下的问题: (1)传统的WIMP界面模型已经不适合描述视觉手势界面这种post-WIMP界面的特点,需要对传统的用户界面模型加以扩展,构造适于描述视觉交互特征的界面模型帮助用户清晰、准确地分析和表达界面功能及其变化,描述出用户与系统的交互过程,指导软件系统的设计和实现; (2)具体的交互设计过程中还存在着许多关键技术没有解决好,例如手势的正确理解问题、算法的鲁棒性问题以及手势的可扩展性问题等; (3)传统视觉工具箱复杂难用的问题。需要降低开发难度,开发出便捷、易用、可扩展的软件界面开发工具及相应的开发方法,支持领域内非专家用户快速开发出视觉手势原型系统。 本文正是从以上问题出发,围绕着视觉手势界面交互技术,从理论、方法与应用等几个方面展开了深入的研究。首先论述了用户界面的发展历程,继而对视觉界面研究现状进行了综述。在充分研究和对比国内外相关研究成果的基础上提出了一种基于手势的视觉用户界面模型UIDT。接下来针对视觉手势交互中存在的难题,以认知心理学为理论依据提出了一种可扩展的手势交互状态转移模型,并在此基础上构建了视觉手势处理框架。随后对该框架中的关键技术进行了针对性的研究。针对非专家用户在构建具有个性化视觉手势界面过程中所遇到的问题,设计开发了一个支持视觉手势交互的开发工具IEToolkit并给出了一套基于该工具的通用的软件开发方法。最后,将上述成果应用于互动娱乐领域,取得了满意的效果。 本文的创新点主要表现在以下几个方面: 1. 提出了一种基于手势的视觉用户界面模型UIDT 在充分分析视觉交互特征的基础上,以传统的用户界面模型为基础提出了一种基于手势交互的视觉界面模型UIDT。该模型从用户模型、任务模型、设备模型和交互模型等几个方面对视觉手势交互进行了深入分析和描述,给出了各个模型的形式化定义,介绍了模型的各个组成模块以及它们之间的相互关系,讨论了视觉手势界面设计中应该遵循的设计规范。评估结果表明,该模型具有较强的通用性,有助于设计者对VBI的任务、用户、设备以及交互的不同层次进行抽象描述,使用户界面满足可用性要求,提高界面设计和原型开发的效率。 2. 提出了一个可扩展的视觉手势交互模型及一种新的视觉手势识别处理框架,围绕着该框架提出了一种新的视觉手势跟踪和识别方法 首先,提出了一个可扩展的视觉手势交互模型。根据认知心理学原理将视觉手势交互处理过程细分为选择性处理、分配性处理和集中处理三个不同的阶段,有效解决了Midas Touch问题;基于该模型提出了一个视觉手势识别框架,并结合认知心理学从手势检测、跟踪和识别三个方面对该框架的各个组成模块的关键技术进行了阐述。其中手势检测模块和识别管理模块能够辅助系统在复杂的背景中滤除掉不相关信息而选择性地搜索人手并根据上下文信息对手势识别任务重定向,从而避免了系统时刻都处于激活状态并对所有的手势动作都进行识别分析,有效解决了Midas Touch问题;为了提高系统的性能,提出了一种鲁棒的面向实时交互的变形手势跟踪方法和基于小样本学习的模板匹配方法用于动态手势识别。评估结果表明,上述技术有效地提高了系统的实时性、准确性和鲁棒性。 3. 设计开发了一个支持快速原型开发的视觉手势工具箱系统 针对目前大多数视觉手势工具箱复杂难用的问题,设计开发了一个简单、易用、可扩展的手势工具箱系统IEToolkit,实现了本文所述的各种关键交互技术。它包含了构造一个基于视觉手势的交互系统所需要的方方面面,从事件模型、交互模型、数据流模型等几个方面对工具箱的组成结构进行了描述,并给出了一个基于IEToolkit的通用的软件系统开发流程,开发人员可以将更多的精力集中在具体的高层逻辑语义处理上,而不需要过多考虑底层的技术细节与支撑结构。应用实例及评估结果表明IEToolkit能够降低开发门槛,较好地支持基于视觉手势交互的应用系统的快速构造,具有较高的应用价值。 4. 基于上述研究成果设计开发了一系列典型的视觉手势交互系统 将上述理论模型与具体的交互技术进行有效结合,在视觉手势开发工具平台基础上开发了一系列典型的互动娱乐系统,在实践中对本文的研究成果进行了有效性验证。
Resumo:
从无线传感器网络(WSN)环境数值监测应用的实际需求出发,提出了一种应用于该类场景中的等值线绘制(CMBC)算法.CMBC算法基于图形学中常用的贝塞尔(Bezier)曲线理论,通过选择部分节点提供信息给网关节点绘制等值线.此方法有效解决了监测应用场景中对最终监测精度的需求与大量报告节点所引发的高流量负载和网络能耗之间的矛盾.仿真结果表明,CMBC算法和已有研究工作相比能够使用更少的汇报节点完成高精度等值线的绘制,因此CMBC算法能够节省节点的能量,延长网络的生存期.
Resumo:
实时目标跟踪是模式识别、图像处理、计算机视觉、武器制导等领域的重要课题,而且在工业、军事和科学研究方面都具有广泛的应用。相关跟踪是目前使用最广泛的跟踪算法。但传统相关跟踪方法以假设目标仅发生平移运动为前提,当目标仅发生平移时能够获得理想的跟踪效果。但当目标尺度和灰度变化时,这种算法往往表现出一定的不适应性。 差值分解(Difference Decomposition)最早于1997年Michael Gleicher提出,并被应用于目标跟踪,图像配准等领域。由于具有计算速度快,对目标变化适应性好等特点,被认为是目标跟踪中的一种有效的方法。本文在跟踪算法中引入了这种方法,力图解决传统相关跟踪所出现的上述问题。在研究差值分解(Difference Decomposition)理论的同时,对使用该方法在实际应用中遇到的问题进行了深入的分析和大量的实验。主要包括:算法应用中一些参数的选择对算法的影响,算法迭代中参数更新的方法等。并在应用中发现了算法的不足之处,提出了相应的改进方法。 同时,介绍了TI DM642硬件处理平台的基本构成和性能指标。作为正常算法分析的重要组成部分,对差值分解算法在该硬件处理平台上通过软件编程方式实现的复杂度进行了详细的分析与论证。 最后本文构建了一个比较完整的跟踪流程,将改进后的跟踪算法应用到所建立的跟踪流程中。采用工具对算法进行了开发,并使用序列图像对算法进行了跟踪仿真实验,为算法将来的实际应用奠定了良好的基础。
Resumo:
针对传统机器人加工路径规划采用示教再现方法很难适应复杂变化任务的问题 ,提出了基于遗传算法的路径规划方法 ,研究了遗传算法中的编码方式、交叉算子和变异算子的改进方法 .仿真实验表明 ,采用遗传算法进行机器人加工路径规划是可行的和有效的 .
Resumo:
基于区域的立体匹配算法仅针对支撑窗内的灰度信息定义匹配代价函数,导致在弱(无)纹理区域采用WTA优化出现歧义性。该文在外极线分区的基础上,改用区域作为匹配基元,针对歧义性区域,在代价函数中引入遮挡项和平滑项,并按照区域优先级的高低,动态匹配相应区域,获得可靠的视差信息。实验证明,该算法在保持实时性的同时对弱纹理区域处理具有有效性。
Resumo:
基于墙角、房门和通路等高级环境特征的辨识与提取,依据几何和拓扑环境模型完成混合地图的构建,并根据混合地图的特点,提出在局部几何环境采用扩展卡尔曼滤波算法实现移动机器人的位姿跟踪,而在拓扑地图的节点位置则根据绑定的高级环境特征进行位姿再校正的混合定位方法.将该方法应用于实际移动机器人平台,所得结果证明了方法的有效性和实用性.