977 resultados para approximate KNN query


Relevância:

10.00% 10.00%

Publicador:

Resumo:

The Support Vector Machine (SVM) is a new and very promising classification technique developed by Vapnik and his group at AT&T Bell Labs. This new learning algorithm can be seen as an alternative training technique for Polynomial, Radial Basis Function and Multi-Layer Perceptron classifiers. An interesting property of this approach is that it is an approximate implementation of the Structural Risk Minimization (SRM) induction principle. The derivation of Support Vector Machines, its relationship with SRM, and its geometrical insight, are discussed in this paper. Training a SVM is equivalent to solve a quadratic programming problem with linear and box constraints in a number of variables equal to the number of data points. When the number of data points exceeds few thousands the problem is very challenging, because the quadratic form is completely dense, so the memory needed to store the problem grows with the square of the number of data points. Therefore, training problems arising in some real applications with large data sets are impossible to load into memory, and cannot be solved using standard non-linear constrained optimization algorithms. We present a decomposition algorithm that can be used to train SVM's over large data sets. The main idea behind the decomposition is the iterative solution of sub-problems and the evaluation of, and also establish the stopping criteria for the algorithm. We present previous approaches, as well as results and important details of our implementation of the algorithm using a second-order variant of the Reduced Gradient Method as the solver of the sub-problems. As an application of SVM's, we present preliminary results we obtained applying SVM to the problem of detecting frontal human faces in real images.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

We consider the often-studied problem of sorting, for a parallel computer. Given an input array distributed evenly over p processors, the task is to compute the sorted output array, also distributed over the p processors. Many existing algorithms take the approach of approximately load-balancing the output, leaving each processor with Θ(n/p) elements. However, in many cases, approximate load-balancing leads to inefficiencies in both the sorting itself and in further uses of the data after sorting. We provide a deterministic parallel sorting algorithm that uses parallel selection to produce any output distribution exactly, particularly one that is perfectly load-balanced. Furthermore, when using a comparison sort, this algorithm is 1-optimal in both computation and communication. We provide an empirical study that illustrates the efficiency of exact data splitting, and shows an improvement over two sample sort algorithms.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

In this paper, we present a P2P-based database sharing system that provides information sharing capabilities through keyword-based search techniques. Our system requires neither a global schema nor schema mappings between different databases, and our keyword-based search algorithms are robust in the presence of frequent changes in the content and membership of peers. To facilitate data integration, we introduce keyword join operator to combine partial answers containing different keywords into complete answers. We also present an efficient algorithm that optimize the keyword join operations for partial answer integration. Our experimental study on both real and synthetic datasets demonstrates the effectiveness of our algorithms, and the efficiency of the proposed query processing strategies.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

We present a technique for the rapid and reliable evaluation of linear-functional output of elliptic partial differential equations with affine parameter dependence. The essential components are (i) rapidly uniformly convergent reduced-basis approximations — Galerkin projection onto a space WN spanned by solutions of the governing partial differential equation at N (optimally) selected points in parameter space; (ii) a posteriori error estimation — relaxations of the residual equation that provide inexpensive yet sharp and rigorous bounds for the error in the outputs; and (iii) offline/online computational procedures — stratagems that exploit affine parameter dependence to de-couple the generation and projection stages of the approximation process. The operation count for the online stage — in which, given a new parameter value, we calculate the output and associated error bound — depends only on N (typically small) and the parametric complexity of the problem. The method is thus ideally suited to the many-query and real-time contexts. In this paper, based on the technique we develop a robust inverse computational method for very fast solution of inverse problems characterized by parametrized partial differential equations. The essential ideas are in three-fold: first, we apply the technique to the forward problem for the rapid certified evaluation of PDE input-output relations and associated rigorous error bounds; second, we incorporate the reduced-basis approximation and error bounds into the inverse problem formulation; and third, rather than regularize the goodness-of-fit objective, we may instead identify all (or almost all, in the probabilistic sense) system configurations consistent with the available experimental data — well-posedness is reflected in a bounded "possibility region" that furthermore shrinks as the experimental error is decreased.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Tanto los Sistemas de Información Geográfica como la Recuperación de Información han sido campos de investigación muy importantes en las últimas décadas. Recientemente, un nuevo campo de investigación llamado Recuperación de Información Geográfica ha surgido fruto de la confluencia de estos dos campos. El objetivo principal de este campo es definir estructuras de indexación y técnicas para almacenar y recuperar documentos de manera eficiente empleando tanto las referencias textuales como las referencias geográficas contenidas en el texto. En este artículo presentamos la arquitectura de un sistema para recuperación de información geográfica y definimos el flujo de trabajo para la extracción de las referencias geográficas de los documentos. Presentamos además una nueva estructura de indexación que combina un índice invertido, un índice espacial y una ontología. Esta estructura mejora las capacidades de consulta de otras propuestas

Relevância:

10.00% 10.00%

Publicador:

Resumo:

This paper proposes a high-level reinforcement learning (RL) control system for solving the action selection problem of an autonomous robot. Although the dominant approach, when using RL, has been to apply value function based algorithms, the system here detailed is characterized by the use of direct policy search methods. Rather than approximating a value function, these methodologies approximate a policy using an independent function approximator with its own parameters, trying to maximize the future expected reward. The policy based algorithm presented in this paper is used for learning the internal state/action mapping of a behavior. In this preliminary work, we demonstrate its feasibility with simulated experiments using the underwater robot GARBI in a target reaching task

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Changes in the angle of illumination incident upon a 3D surface texture can significantly alter its appearance, implying variations in the image texture. These texture variations produce displacements of class members in the feature space, increasing the failure rates of texture classifiers. To avoid this problem, a model-based texture recognition system which classifies textures seen from different distances and under different illumination directions is presented in this paper. The system works on the basis of a surface model obtained by means of 4-source colour photometric stereo, used to generate 2D image textures under different illumination directions. The recognition system combines coocurrence matrices for feature extraction with a Nearest Neighbour classifier. Moreover, the recognition allows one to guess the approximate direction of the illumination used to capture the test image

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Desenvolupament una aplicació informàtica basada en un sistema de visió per computador, la qual permeti donar una resposta en forma d'informació a partir d'una query d'una imatge que conté una escena o objecte en concret de manera que permeti reconèixer els objectes que apareixen en una imatge per llavors donar informació referent al contingut de la imatge a l’usuari que ha fet la consulta. Resumint, es tracta d’analitzar, dissenyar i construir un sistema de visió per computador capaç de reconèixer objectes d’interès en imatges

Relevância:

10.00% 10.00%

Publicador:

Resumo:

In this lecture, we will focus on analyzing user goals in search query logs. Readings: M. Strohmaier, P. Prettenhofer, M. Lux, Different Degrees of Explicitness in Intentional Artifacts - Studying User Goals in a Large Search Query Log, CSKGOI'08 International Workshop on Commonsense Knowledge and Goal Oriented Interfaces, in conjunction with IUI'08, Canary Islands, Spain, 2008.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

En este proyecto a través de la aplicación de modelos de mejoramiento como la gestión de procesos y tiempos y movimientos se solucionaron problemas internos relacionados con la oportunidad, eficacia y eficiencia en una institución prestadora de salud de nivel II de complejidad, siendo aplicables en cualquier organización del sector salud cuya razón de ser sea atender pacientes, dándole a la organización la capacidad de responder adecuadamente a las necesidades del cliente en términos de tiempo sin comprometer la calidad del servicio prestado. Esto se desarrolló en la clínica Belén de Fusagasugá en el periodo comprendido entre septiembre de 2010 y septiembre de 2011, se utilizo la metodología de tiempos y movimientos, determinando los desequilibrios entre la capacidad instalada y el volumen de pacientes que ingresaron , a través de tiempos de atención socialmente aceptados, la capacidad instalada requerida para evitar retrasos en los horarios de alto volumen de consulta los cuales producen insatisfacción del usuario. Lo anterior se aplicó en dos procesos institucionales: urgencias y hospitalización ya que son las unidades funcionales donde los tiempos de espera son mayores a los socialmente aceptados produciendo importantes fallas de calidad, se establecieron indicadores de alerta que permitieron detectar en tiempo real las demoras en la atención, para asi realizar ajustes inmediatos a través de acciones de contingencia que se implementan en la institución, a partir de la desviación de los indicadores de alerta para cada uno de los procedimientos, determinando la existencia de cuellos de botella, gracias a la aplicación de la metodología de gestión de procesos y la que permitieron que el factor volumen de pacientes no afecte los tiempos de prestación de los servicios garantizando la satisfacción de los clientes.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Bajo la investigación “LAS INTERACCIONES ORGANIZACIONALES DESDE LA VISIÓN ECOLOGICA: LA DEPREDACIÓN” que hace parte del trabajo de doctorado de la Señora Ángela Noguera, se encuentra en este documento un avance que describe la relación que se ha encontrado en diversas fuentes en cuanto a la relación entre el concepto biológico de “Depredación” y las organizaciones tal como las conocemos hoy en día. Es un trabajo donde se realizan resúmenes de las investigaciones ya existentes sobre estos temas, es decir un estado del arte.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Las enfermedades cardiovasculares son la principal causa de muerte en el mundo, siendo la enfermedad coronaria, la más representativa. Con los avances en tratamientos invasivos, se ha logrado disminuir la morbi-mortalidad global, siendo crucial el tiempo de realización de dichas terapias desde el tiempo de inicio de los síntomas. Por tanto es necesario determinar los factores relacionados con la tardanza en la búsqueda de atención. METODOLOGIA: Estudio observacional analítico transversal, en pacientes hospitalizados por evento coronario agudo en un hospital universitario de tercer nivel en Bogotá durante 6 meses. El tiempo de consulta se dicotomizó entre menor igual y mayor a 6 horas desde el inicio de los síntomas, se realizaron análisis bivariados y de regresión logística para evaluar asociación ente las variables estudiadas con el tiempo de consulta. RESULTADOS: 100 pacientes se incluyeron en el estudio, con edad promedio de 68 años. La mayoría con algún grado de educación, con estado civil casado/unión libre y antecedente de hipertensión arterial (HTA). El tiempo promedio de consulta fue 14 horas, con un 48% antes de 6 horas. Existió una tendencia del estado civil, tipo trasporte, antecedente de HTA y hora de inicio de síntomas con el consultar tempranamente DISCUSION: En esta población se encontró un retraso importante en el tiempo de consulta en paciente con infarto de miocardio, con factores que pueden estar relacionados y serían sujetos de intervención en la atención primaria de estos pacientes. Se requieren estudios con mayor población para validar los resultados acá encontrados.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

El presente es un estudio de caso que busca encontrarle significado a la actuación de la República de China (Taiwán) como Estado de Facto en el Sistema Internacional, durante el periodo 1971 – 2011. El estudio se centra en las formas de validación jurídicas que le permiten a Taiwán interactuar con otros actores en el Sistema Internacional.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

El objetivo de la presente investigación consiste en describir las características de un asesino en serie colombiano desde la perspectiva psicodinámica. En este sentido, el abordaje teórico realizado en este trabajo se compone inicialmente de una concepción de asesinos en serie, posteriormente se hace una revisión acerca de las bases biológicas y los factores sociales del homicida serial, igualmente, se explican tres teorías psicodinámicas a trabajar (Sigmund Freud y Erick Erickson). Finalmente, se hace mención dentro de la investigación a la comparación casuística de los asesinos en serie, teniendo en cuenta a cuatro asesinos en serie mediante el abordaje psicodinámico. Por otra parte, a nivel metodológico, el tipo de estudio realizado es descriptivo con un corte cualitativo y un diseño no experimental, basado en la revisión de fuentes bibliográficas. Como producto se pretende hacer una aproximación al perfil correspondiente de la personalidad de un asesino en serie colombiano mediante las teorías psicodinámicas.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

La idea de negocio consiste en ofrecer al mercado una bebida refrescantemente novedosa. La bebida consiste en un concentrado de fruta hecho a base de pulpa natural el cual rinde seis veces su contenido, siendo ideal para la familia en general y establecimientos en los que se sirvan bebidas. Se estima que hay alrededor de 200 mil familias que podrían ajustarse al perfil de consumidores potenciales en Bogotá. Para comprobar el potencial del producto se hizo una validación de este en la Ciclovia específicamente en un punto donde practicarían deporte familias con características a las preestablecidas en la descripción de clientes potenciales, favorablemente las apreciaciones hacia el producto fueron positivas hasta el punto en que se genero expectativa por el lanzamiento del producto al mercado, además se validaron hipótesis planteadas durante la formulación del modelo de negocio. El enfoque inicial de la empresa seria desarrollar el mercado, comercializar la bebida atreves de sus canales, realizar constantes investigaciones de mercado con el fin de entender las necesidades de sus clientes y de esta forma fidelizarlos.