931 resultados para Johnson, Mark
Resumo:
Visual recognition is a fundamental research topic in computer vision. This dissertation explores datasets, features, learning, and models used for visual recognition. In order to train visual models and evaluate different recognition algorithms, this dissertation develops an approach to collect object image datasets on web pages using an analysis of text around the image and of image appearance. This method exploits established online knowledge resources (Wikipedia pages for text; Flickr and Caltech data sets for images). The resources provide rich text and object appearance information. This dissertation describes results on two datasets. The first is Berg’s collection of 10 animal categories; on this dataset, we significantly outperform previous approaches. On an additional set of 5 categories, experimental results show the effectiveness of the method. Images are represented as features for visual recognition. This dissertation introduces a text-based image feature and demonstrates that it consistently improves performance on hard object classification problems. The feature is built using an auxiliary dataset of images annotated with tags, downloaded from the Internet. Image tags are noisy. The method obtains the text features of an unannotated image from the tags of its k-nearest neighbors in this auxiliary collection. A visual classifier presented with an object viewed under novel circumstances (say, a new viewing direction) must rely on its visual examples. This text feature may not change, because the auxiliary dataset likely contains a similar picture. While the tags associated with images are noisy, they are more stable when appearance changes. The performance of this feature is tested using PASCAL VOC 2006 and 2007 datasets. This feature performs well; it consistently improves the performance of visual object classifiers, and is particularly effective when the training dataset is small. With more and more collected training data, computational cost becomes a bottleneck, especially when training sophisticated classifiers such as kernelized SVM. This dissertation proposes a fast training algorithm called Stochastic Intersection Kernel Machine (SIKMA). This proposed training method will be useful for many vision problems, as it can produce a kernel classifier that is more accurate than a linear classifier, and can be trained on tens of thousands of examples in two minutes. It processes training examples one by one in a sequence, so memory cost is no longer the bottleneck to process large scale datasets. This dissertation applies this approach to train classifiers of Flickr groups with many group training examples. The resulting Flickr group prediction scores can be used to measure image similarity between two images. Experimental results on the Corel dataset and a PASCAL VOC dataset show the learned Flickr features perform better on image matching, retrieval, and classification than conventional visual features. Visual models are usually trained to best separate positive and negative training examples. However, when recognizing a large number of object categories, there may not be enough training examples for most objects, due to the intrinsic long-tailed distribution of objects in the real world. This dissertation proposes an approach to use comparative object similarity. The key insight is that, given a set of object categories which are similar and a set of categories which are dissimilar, a good object model should respond more strongly to examples from similar categories than to examples from dissimilar categories. This dissertation develops a regularized kernel machine algorithm to use this category dependent similarity regularization. Experiments on hundreds of categories show that our method can make significant improvement for categories with few or even no positive examples.
Resumo:
Los principales avances metodológicos que aporta la presente tesis son los siguientes: I. El análisis y cuantificación de los ecos generados por los chasquidos de ecolocalización emitidos por los zifios, al reflejarse en el fondo marino y en organismos en la columna de agua, registrados en marcas DTAG. Estos ecos permiten describir de forma simultánea el entorno biofísico que rodea a los zifios, según las capacidades sensoriales de los propios animales, mientras se alimentan, contribuyendo a interpretar de forma única las decisiones de estos depredadores marinos en el contexto de su hábitat. II. El desarrollo de una modificación a los métodos analíticos ¿Distance¿ tradicionales, para estudiar el efecto de la profundidad sobre la distribución de los zifios en El Hierro, a partir de datos de avistamientos realizados desde un punto fijo en tierra. III. El uso de una serie de sistemas autónomos de grabación DMON colocados en boyas de deriva para realizar un muestreo acústico estratificado y estudiar la selección del hábitat de los zifios en El Hierro. Las principales contribuciones científicas que aporta la presente tesis son las siguientes: I. La colocación de 14 marcas acústicas no invasivas DTAG a zifios de Blainville, para el estudio de su comportamiento de buceo, alimentación y comunicación social. El análisis de los registros acústicos muestra lo siguiente: i) Los zifios de Blainville se alimentan en aguas mesopelágicas y bentopelágicas profundas, a distancias de tan solo cinco m del fondo marino. La caza se produce siempre a profundidades mayores de 200 m y principalmente entre 500 y 900 m. La alimentación bentopelágica se da a lo largo de toda la columna de agua (385-1326 m) y predomina a profundidades por debajo de la capa de reflexión profunda. La alimentación mesopelágica se da principalmente en los niveles medios e inferiores de esta capa, coincidiendo con la capa del mínimo de oxígeno, y se adapta solo parcialmente a las migraciones circadianas de ésta. De noche estos zifios comienzan a alimentarse a una profundidad media de 258 m (168-873) y de día a 479 m (276-589). ii) La estrategia de estos zifios parece dirigida a explotar presas profundas distribuidas en estratos verticales estables y posiblemente con una capacidad de movimiento limitada en relación a un depredador que respira aire. Ello les permite mantenerse dedicando tan solo un 18 % de su tiempo en la obtención de alimento, pero por otro lado, requiere de la captura de un gran número de presas por inmersión y por tanto implica realizar inmersiones de larga duración. En ellas estos cetáceos de mediano tamaño corporal desafían sus límites de buceo aeróbico y presumiblemente precisan de largos periodos de recuperación que representan en torno al 64 % del tiempo en su ciclo de buceo. iii) La comunicación mediada por vocalizaciones entre los zifios de Blainville se da exclusivamente a profundidad (> 170 m). Se han identificado dos tipos de sonidos aparentemente destinados a la comunicación social: ¿rasp¿, series rápidas de chasquidos de frecuencia modulada similares a los zumbidos pero con diferentes propiedades acústicas y contexto de emisión; y silbidos tonales cortos y con armónicos, con una frecuencia fundamental media de 12 kHz, que son emitidos a profundidades de hasta 900 m, las mayores registradas en cualquier animal. II. Se realizaron 1789 avistamientos de zifios desde tierra, cuya identificación específica fue confirmada en 859 casos desde una embarcación. La localización de los avistamientos fue utilizada para crear un modelo predictivo de la distribución de los zifios en superficie, en relación a la profundidad del fondo, utilizando un estimador de máxima verosimilitud. Los resultados muestran la preferencia de los zifios por distribuirse entre las cotas batimétricas de 500 y 1500 m, coincidiendo con el talud insular. III. La preferencia de los zifios por distribuirse en la zona del talud fue confirmada mediante un muestreo acústico estratificado. Se registraron 245 h de sonidos con sistemas autónomos de grabación DMON suspendidos a 200 m de profundidad desde boyas a la deriva, localizadas en cotas batimétricas entre 500 y 3000 m. La tasa de detección de chasquidos de zifios fue mayor sobre el talud respecto a la llanura abisal cercana. IV. La coincidencia de los resultados obtenidos con los métodos acústico y visual destaca la importancia del talud insular para la alimentación de los zifios en El Hierro. La consistencia de estos resultados en dos de las tres vertientes de la Isla justificó la extensión del modelo predictivo de distribución de las especies a todo el perímetro de El Hierro, que presenta unas características batimétricas similares, mediante el uso de sistemas de información geográfica. A ello se unió un modelado del alcance espacial de distintas fuentes de posible impacto antrópico, para diseñar con base científica una propuesta de Área Marina Protegida para zifios en El Hierro. El área propuesta se extiende hasta la cota batimétrica de 3000 m en torno a la Isla e incluye una zona de amortiguamiento hasta 50 nmi para fuentes intensas de sonido antrópico.
Resumo:
CONTENTS. (cont.) --The Christianity of the fourth Gospel, by the Rev. C. B. Hedrick.--Correctness, by the Rev. M. B. Stewart.--An optimistic realist, Ernst Zahn, by B. Q. Morgan.--The hermit story, as used by Voltaire and Mark Twain, by F. A. G. Cowper.--Thumbnail classics. Jack Harker at Yalevard, by P. Curtiss.--The man who heard everything, by W. Trumbull.--"Whiskey, bullets, and..."--The novelist takes to real estate, by R. Wright.