840 resultados para Training and testing


Relevância:

100.00% 100.00%

Publicador:

Resumo:

An important tool for the heart disease diagnosis is the analysis of electrocardiogram (ECG) signals, since the non-invasive nature and simplicity of the ECG exam. According to the application, ECG data analysis consists of steps such as preprocessing, segmentation, feature extraction and classification aiming to detect cardiac arrhythmias (i.e.; cardiac rhythm abnormalities). Aiming to made a fast and accurate cardiac arrhythmia signal classification process, we apply and analyze a recent and robust supervised graph-based pattern recognition technique, the optimum-path forest (OPF) classifier. To the best of our knowledge, it is the first time that OPF classifier is used to the ECG heartbeat signal classification task. We then compare the performance (in terms of training and testing time, accuracy, specificity, and sensitivity) of the OPF classifier to the ones of other three well-known expert system classifiers, i.e.; support vector machine (SVM), Bayesian and multilayer artificial neural network (MLP), using features extracted from six main approaches considered in literature for ECG arrhythmia analysis. In our experiments, we use the MIT-BIH Arrhythmia Database and the evaluation protocol recommended by The Association for the Advancement of Medical Instrumentation. A discussion on the obtained results shows that OPF classifier presents a robust performance, i.e.; there is no need for parameter setup, as well as a high accuracy at an extremely low computational cost. Moreover, in average, the OPF classifier yielded greater performance than the MLP and SVM classifiers in terms of classification time and accuracy, and to produce quite similar performance to the Bayesian classifier, showing to be a promising technique for ECG signal analysis. © 2012 Elsevier Ltd. All rights reserved.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

A aprendizagem complexa abrange o controle por relações abstratas após a exposição a relações diretamente treinadas. Neste trabalho, uma seqüência de experimentos investigou a aprendizagem de relações entre estímulos em dois macacos prego (Cebus apella) envolvendo o treino direto de relações de identidade, testes sucessivos de identidade generalizada, o treino direto de relações arbitrárias e teste de relações simétricas como indicação da formação de classes de equivalência. Três bases teóricas foram seguidas: 1) A formação de classes de equivalência é uma função básica de estímulo 2) A teoria da coerência de topografia de controle de estímulos, e 3) Uma versão do sistema personalizado de instrução como uma alternativa para estabelecer repertórios relacionais em organismos não-verbais. Os sujeitos apresentaram altos níveis de desempenho em discriminações condicionais de identidade e arbitrárias. Os sujeitos expostos a testes de identidade generalizada demonstraram essa relação abstrata; o sujeito exposto ao treino arbitrário apresentou resultados negativos no teste de desempenhos simétricos. A maioria dos problemas de aprendizagem de relações entre estímulos encontrados aqui com não-humanos parece similar aos problemas apresentados por indivíduos com desenvolvimento retardado. Os procedimentos de ensino para indivíduos com retardo foram suficientes para solucionar grande parte das deficiências de repertório de não-humanos, as quais geralmente são atribuídas a limitações da espécie.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Repertórios comportamentais complexos, tais como identidade generalizada e classes de equivalência, têm sido encontrados com relativa facilidade em sujeitos humanos ditos normais, assim como em crianças e adolescentes com déficit de aprendizagem, porém, com extrema dificuldade em sujeitos não-humanos. Uma das propriedades definidoras de equivalência mais difíceis de obter com não humanos é a simetria, provavelmente por envolver, além das reversões das funções de modelo e comparação dos estímulos, também mudanças na seqüência e na posição de apresentação dos estímulos. O insucesso na obtenção de identidade generalizada e formação de classes de equivalência em sujeitos não-humanos pode estar ligado à incoerência entre a Topografia de Controle de Estímulos planejada pelo experimentador e a desenvolvida pelos sujeitos, sugerindo a necessidade de desenvolvimento metodológico mais específico. O presente estudo buscou aplicar procedimentos experimentais de treino e teste para a obtenção de identidade generalizada e verificar a possibilidade de emergência de simetria após treino de pareamento arbitrário ao modelo, via procedimento de modelagem do estímulo modelo e na ausência de correlação entre as funções modelo e comparação dos estímulos e suas posições. Foi utilizado um macaco-prego (Cebus apella) sub-adulto, experimentalmente ingênuo. Foram realizados dois experimentos. No Experimento I, foram efetuados treinos de reversões de discriminações simples, treinos de relações condicionais em um procedimento de pareamento ao modelo por identidade e teste de identidade generalizada em extinção. Os resultados indicam que o procedimento foi eficiente para o treino de discriminações simples e reversões, assim como para a aquisição de relações condicionais de escolha por identidade ao modelo. O procedimento foi eficaz na seleção do comportamento de escolha de acordo com o modelo por identidade generalizada, uma vez que todos os resultados dos testes de identidade generalizada foram positivos. No Experimento II, foram efetuados treinos de pareamento ao modelo arbitrário AB, utilizando procedimento de modelagem do estímulo modelo em 8 passos, e um teste de simetria BA. Este experimento visou verificar se os elementos positivamente relacionados em discriminações condicionais (num treino AB, por exemplo) poderiam ser recombinados pelo sujeito sem treino adicional. A performance do sujeito no teste de simetria BA atingiu a precisão de 100% de acertos, mostrando que é possível obter, com sujeitos não humanos, a propriedade de simetria em relações condicionais arbitrárias. Os dados justificam que novos estudos sejam realizados a fim de contribuir para a especificação das condições necessárias para a obtenção de repertório complexo como a formação de classes de equivalência em sujeitos não humanos.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

É possível que organismos apresentem uma capacidade relacional básica. Sendo assim, relações de equivalência seriam geradas por contingências de reforçamento. Resultados inconsistentes obtidos em testes de formação de classes de equivalência seriam devido ao desenvolvimento de procedimentos experimentais insuficientes no sentido de gerar o desempenho planejado. Tomando como base a hipótese de que não apenas os estímulos antecedentes, mas também as respostas e estímulos reforçadores, se específicos para cada classe, tornam-se membros das mesmas, o presente trabalho avaliou o desempenho de um macaco-prego (Cebus apella), com história pré-experimental de discriminações condicionais de identidade e arbitrárias e uso de comparações vazias (máscaras), em testes de simetria BA após treino de discriminações condicionais com reforçamento específico, pelotas de alimento de sabor diferente para cada discriminação. Durante o treino foi usado o procedimento de máscara para garantir relações de controle coerentes com as planejadas. Após o treino, foi realizado o teste de simetria com reforçamento específico, cujos resultados foram inconsistentes com a formação de classes. É possível que o sujeito necessitasse de mais sessões de treino com reforçadores específicos e/ou que as similaridades entre os estímulos reforçadores de cada classe tenha gerado uma generalização entre eles, o que os tornaria não reforçadores específicos, mas sim, reforçadores comuns.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

A etiquetagem morfossintática é uma tarefa básica requerida por muitas aplicações de processamento de linguagem natural, tais como análise gramatical e tradução automática, e por aplicações de processamento de fala, por exemplo, síntese de fala. Essa tarefa consiste em etiquetar palavras em uma sentença com as suas categorias gramaticais. Apesar dessas aplicações requererem etiquetadores que demandem maior precisão, os etiquetadores do estado da arte ainda alcançam acurácia de 96 a 97%. Nesta tese, são investigados recursos de corpus e de software para o desenvolvimento de um etiquetador com acurácia superior à do estado da arte para o português brasileiro. Centrada em uma solução híbrida que combina etiquetagem probabilística com etiquetagem baseada em regras, a proposta de tese se concentra em um estudo exploratório sobre o método de etiquetagem, o tamanho, a qualidade, o conjunto de etiquetas e o gênero dos corpora de treinamento e teste, além de avaliar a desambiguização de palavras novas ou desconhecidas presentes nos textos a serem etiquetados. Quatro corpora foram usados nos experimentos: CETENFolha, Bosque CF 7.4, Mac-Morpho e Selva Científica. O modelo de etiquetagem proposto partiu do uso do método de aprendizado baseado em transformação(TBL) ao qual foram adicionadas três estratégias, combinadas em uma arquitetura que integra as saídas (textos etiquetados) de duas ferramentas de uso livre, o TreeTagger e o -TBL, com os módulos adicionados ao modelo. No modelo de etiquetador treinado com o corpus Mac-Morpho, de gênero jornalístico, foram obtidas taxas de acurácia de 98,05% na etiquetagem de textos do Mac-Morpho e 98,27% em textos do Bosque CF 7.4, ambos de gênero jornalístico. Avaliou-se também o desempenho do modelo de etiquetador híbrido proposto na etiquetagem de textos do corpus Selva Científica, de gênero científico. Foram identificadas necessidades de ajustes no etiquetador e nos corpora e, como resultado, foram alcançadas taxas de acurácia de 98,07% no Selva Científica, 98,06% no conjunto de teste do Mac-Morpho e 98,30% em textos do Bosque CF 7.4. Esses resultados são significativos, pois as taxas de acurácia alcançadas são superiores às do estado da arte, validando o modelo proposto em busca de um etiquetador morfossintático mais confiável.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

A dificuldade em documentar a formação de classes em não-humanos pode ser devida ao uso de procedimentos de treino e teste desenvolvidos no contexto da pesquisa com participantes humanos. Diferenças entre as situações de treino e de teste podem produzir a deterioração do desempenho nos testes. Este estudo teve como objetivo comparar, em macacos-prego (Cebus spp.), a curva de aquisição de relações condicionais simétricas com a curva de aquisição de relações condicionais não simétricas, a partir de linhas de base condicionais diferentes para cada tipo de treino. Essa comparação pode fornecer indícios de formação de classes sem a necessidade de testes formais previstos no modelo descritivo de equivalência de estímulos. Foram utilizados, como participantes, dois macacos prego machos Cebus spp. um jovem-adulto (M09) e um adulto (M12), ambos com história de treino de discriminações simples e condicionais. Foram utilizados seis pares de estímulos bidimensionais (A1-B1, A2-B2, A3-B3, A4-B4, A5-B5 e A6-B6). O procedimento foi composto por três fases: Fase 1, “preparatória”, de treino das discriminações condicionais A1-B1 e A2-B2 utilizando o procedimento de emparelhamento ao modelo arbitrário com atraso zero; Fase 2, “consistente” ou “simétrica”, de treino da discriminação condicional A3-B3 e A4-B4 seguida do treino da discriminação condicional consistente com o padrão de resposta bidirecional (B3-A3 e B4-A4); Fase 3, “inconsistente” ou “assimétrica”, de treino da discriminação condicional A5-B5 e A6-B6 seguido do treino da discriminação condicional inconsistente com o padrão bidirecional (B5-A6 e B6-A5). O Sujeito M12 concluiu todas as etapas do experimento. A análise comparativa das curvas de desempenho do sujeito M12 indica uma aquisição mais rápida quando as relações treinadas são simétricas, sugerindo que os eventos arbitrariamente relacionados compõem uma mesma classe. Tal resultado sugere que a análise comparativa entre as curvas de desempenho é um procedimento promissor para avaliar formação de classes em sujeitos não-humanos. O sujeito M09 foi retirado do experimento na Subfase 3.1, pois seu desempenho não alcançou o critério de aquisição. Os dados do sujeito M09 sugerem a necessidade de uma análise detalhada das relações de controle durante a tarefa de MTS possibilitando assim o refinamento do procedimento de treino de emparelhamento ao modelo arbitrário.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

A nivel mundial, el cáncer de mama es el tipo de cáncer más frecuente además de una de las principales causas de muerte entre la población femenina. Actualmente, el método más eficaz para detectar lesiones mamarias en una etapa temprana es la mamografía. Ésta contribuye decisivamente al diagnóstico precoz de esta enfermedad que, si se detecta a tiempo, tiene una probabilidad de curación muy alta. Uno de los principales y más frecuentes hallazgos en una mamografía, son las microcalcificaciones, las cuales son consideradas como un indicador importante de cáncer de mama. En el momento de analizar las mamografías, factores como la capacidad de visualización, la fatiga o la experiencia profesional del especialista radiólogo hacen que el riesgo de omitir ciertas lesiones presentes se vea incrementado. Para disminuir dicho riesgo es importante contar con diferentes alternativas como por ejemplo, una segunda opinión por otro especialista o un doble análisis por el mismo. En la primera opción se eleva el coste y en ambas se prolonga el tiempo del diagnóstico. Esto supone una gran motivación para el desarrollo de sistemas de apoyo o asistencia en la toma de decisiones. En este trabajo de tesis se propone, se desarrolla y se justifica un sistema capaz de detectar microcalcificaciones en regiones de interés extraídas de mamografías digitalizadas, para contribuir a la detección temprana del cáncer demama. Dicho sistema estará basado en técnicas de procesamiento de imagen digital, de reconocimiento de patrones y de inteligencia artificial. Para su desarrollo, se tienen en cuenta las siguientes consideraciones: 1. Con el objetivo de entrenar y probar el sistema propuesto, se creará una base de datos de imágenes, las cuales pertenecen a regiones de interés extraídas de mamografías digitalizadas. 2. Se propone la aplicación de la transformada Top-Hat, una técnica de procesamiento digital de imagen basada en operaciones de morfología matemática. La finalidad de aplicar esta técnica es la de mejorar el contraste entre las microcalcificaciones y el tejido presente en la imagen. 3. Se propone un algoritmo novel llamado sub-segmentación, el cual está basado en técnicas de reconocimiento de patrones aplicando un algoritmo de agrupamiento no supervisado, el PFCM (Possibilistic Fuzzy c-Means). El objetivo es encontrar las regiones correspondientes a las microcalcificaciones y diferenciarlas del tejido sano. Además, con la finalidad de mostrar las ventajas y desventajas del algoritmo propuesto, éste es comparado con dos algoritmos del mismo tipo: el k-means y el FCM (Fuzzy c-Means). Por otro lado, es importante destacar que en este trabajo por primera vez la sub-segmentación es utilizada para detectar regiones pertenecientes a microcalcificaciones en imágenes de mamografía. 4. Finalmente, se propone el uso de un clasificador basado en una red neuronal artificial, específicamente un MLP (Multi-layer Perceptron). El propósito del clasificador es discriminar de manera binaria los patrones creados a partir de la intensidad de niveles de gris de la imagen original. Dicha clasificación distingue entre microcalcificación y tejido sano. ABSTRACT Breast cancer is one of the leading causes of women mortality in the world and its early detection continues being a key piece to improve the prognosis and survival. Currently, the most reliable and practical method for early detection of breast cancer is mammography.The presence of microcalcifications has been considered as a very important indicator ofmalignant types of breast cancer and its detection and classification are important to prevent and treat the disease. However, the detection and classification of microcalcifications continue being a hard work due to that, in mammograms there is a poor contrast between microcalcifications and the tissue around them. Factors such as visualization, tiredness or insufficient experience of the specialist increase the risk of omit some present lesions. To reduce this risk, is important to have alternatives such as a second opinion or a double analysis for the same specialist. In the first option, the cost increases and diagnosis time also increases for both of them. This is the reason why there is a great motivation for development of help systems or assistance in the decision making process. This work presents, develops and justifies a system for the detection of microcalcifications in regions of interest extracted fromdigitizedmammographies to contribute to the early detection of breast cancer. This systemis based on image processing techniques, pattern recognition and artificial intelligence. For system development the following features are considered: With the aim of training and testing the system, an images database is created, belonging to a region of interest extracted from digitized mammograms. The application of the top-hat transformis proposed. This image processing technique is based on mathematical morphology operations. The aim of this technique is to improve the contrast betweenmicrocalcifications and tissue present in the image. A novel algorithm called sub-segmentation is proposed. The sub-segmentation is based on pattern recognition techniques applying a non-supervised clustering algorithm known as Possibilistic Fuzzy c-Means (PFCM). The aim is to find regions corresponding to the microcalcifications and distinguish them from the healthy tissue. Furthermore,with the aim of showing themain advantages and disadvantages this is compared with two algorithms of same type: the k-means and the fuzzy c-means (FCM). On the other hand, it is important to highlight in this work for the first time the sub-segmentation is used for microcalcifications detection. Finally, a classifier based on an artificial neural network such as Multi-layer Perceptron is used. The purpose of this classifier is to discriminate froma binary perspective the patterns built from gray level intensity of the original image. This classification distinguishes between microcalcifications and healthy tissue.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

This paper presents an effective decision making system for leak detection based on multiple generalized linear models and clustering techniques. The training data for the proposed decision system is obtained by setting up an experimental pipeline fully operational distribution system. The system is also equipped with data logging for three variables; namely, inlet pressure, outlet pressure, and outlet flow. The experimental setup is designed such that multi-operational conditions of the distribution system, including multi pressure and multi flow can be obtained. We then statistically tested and showed that pressure and flow variables can be used as signature of leak under the designed multi-operational conditions. It is then shown that the detection of leakages based on the training and testing of the proposed multi model decision system with pre data clustering, under multi operational conditions produces better recognition rates in comparison to the training based on the single model approach. This decision system is then equipped with the estimation of confidence limits and a method is proposed for using these confidence limits for obtaining more robust leakage recognition results.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

In this paper, we propose a speech recognition engine using hybrid model of Hidden Markov Model (HMM) and Gaussian Mixture Model (GMM). Both the models have been trained independently and the respective likelihood values have been considered jointly and input to a decision logic which provides net likelihood as the output. This hybrid model has been compared with the HMM model. Training and testing has been done by using a database of 20 Hindi words spoken by 80 different speakers. Recognition rates achieved by normal HMM are 83.5% and it gets increased to 85% by using the hybrid approach of HMM and GMM.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Ensemble Stream Modeling and Data-cleaning are sensor information processing systems have different training and testing methods by which their goals are cross-validated. This research examines a mechanism, which seeks to extract novel patterns by generating ensembles from data. The main goal of label-less stream processing is to process the sensed events to eliminate the noises that are uncorrelated, and choose the most likely model without over fitting thus obtaining higher model confidence. Higher quality streams can be realized by combining many short streams into an ensemble which has the desired quality. The framework for the investigation is an existing data mining tool. First, to accommodate feature extraction such as a bush or natural forest-fire event we make an assumption of the burnt area (BA*), sensed ground truth as our target variable obtained from logs. Even though this is an obvious model choice the results are disappointing. The reasons for this are two: One, the histogram of fire activity is highly skewed. Two, the measured sensor parameters are highly correlated. Since using non descriptive features does not yield good results, we resort to temporal features. By doing so we carefully eliminate the averaging effects; the resulting histogram is more satisfactory and conceptual knowledge is learned from sensor streams. Second is the process of feature induction by cross-validating attributes with single or multi-target variables to minimize training error. We use F-measure score, which combines precision and accuracy to determine the false alarm rate of fire events. The multi-target data-cleaning trees use information purity of the target leaf-nodes to learn higher order features. A sensitive variance measure such as ƒ-test is performed during each node's split to select the best attribute. Ensemble stream model approach proved to improve when using complicated features with a simpler tree classifier. The ensemble framework for data-cleaning and the enhancements to quantify quality of fitness (30% spatial, 10% temporal, and 90% mobility reduction) of sensor led to the formation of streams for sensor-enabled applications. Which further motivates the novelty of stream quality labeling and its importance in solving vast amounts of real-time mobile streams generated today.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

By proposing a numerical based method on PCA-ANFIS(Adaptive Neuro-Fuzzy Inference System), this paper is focusing on solving the problem of uncertain cycle of water injection in the oilfield. As the dimension of original data is reduced by PCA, ANFIS can be applied for training and testing the new data proposed by this paper. The correctness of PCA-ANFIS models are verified by the injection statistics data collected from 116 wells inside an oilfield, the average absolute error of testing is 1.80 months. With comparison by non-PCA based models which average error is 4.33 months largely ahead of PCA-ANFIS based models, it shows that the testing accuracy has been greatly enhanced by our approach. With the conclusion of the above testing, the PCA-ANFIS method is robust in predicting the effectiveness cycle of water injection which helps oilfield developers to design the water injection scheme.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Dissertação (mestrado)—Universidade de Brasília, Instituto de Psicologia, Departamento de Processos Psicológicos Básicos, Programa de Pós-Graduação em Ciências do Comportamento, 2016.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Ensemble Stream Modeling and Data-cleaning are sensor information processing systems have different training and testing methods by which their goals are cross-validated. This research examines a mechanism, which seeks to extract novel patterns by generating ensembles from data. The main goal of label-less stream processing is to process the sensed events to eliminate the noises that are uncorrelated, and choose the most likely model without over fitting thus obtaining higher model confidence. Higher quality streams can be realized by combining many short streams into an ensemble which has the desired quality. The framework for the investigation is an existing data mining tool. First, to accommodate feature extraction such as a bush or natural forest-fire event we make an assumption of the burnt area (BA*), sensed ground truth as our target variable obtained from logs. Even though this is an obvious model choice the results are disappointing. The reasons for this are two: One, the histogram of fire activity is highly skewed. Two, the measured sensor parameters are highly correlated. Since using non descriptive features does not yield good results, we resort to temporal features. By doing so we carefully eliminate the averaging effects; the resulting histogram is more satisfactory and conceptual knowledge is learned from sensor streams. Second is the process of feature induction by cross-validating attributes with single or multi-target variables to minimize training error. We use F-measure score, which combines precision and accuracy to determine the false alarm rate of fire events. The multi-target data-cleaning trees use information purity of the target leaf-nodes to learn higher order features. A sensitive variance measure such as f-test is performed during each node’s split to select the best attribute. Ensemble stream model approach proved to improve when using complicated features with a simpler tree classifier. The ensemble framework for data-cleaning and the enhancements to quantify quality of fitness (30% spatial, 10% temporal, and 90% mobility reduction) of sensor led to the formation of streams for sensor-enabled applications. Which further motivates the novelty of stream quality labeling and its importance in solving vast amounts of real-time mobile streams generated today.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

The aim of the present study was to examine the reliability of tethered swimming in the evaluation of age group swimmers. The sample was composed of 8 male national level swimmers with at least 4 years of experience in competitive swimming. Each swimmer performed two 30 second maximal intensity tethered swimming tests, on separate days. Individual force-time curves were registered to assess maximum force, mean force and the mean impulse of force. Both consistency and reliability were very strong, with Cronbach’s Alpha values ranging from 0.970 to 0.995. All the applied metrics presented a very high agreement between tests, with the mean impulse of force presenting the highest. These results indicate that tethered swimming can be used to evaluate age group swimmers. Furthermore, better comprehension of the swimmers ability to effectively exert force in the water can be obtained using the impulse of force. Key words: swimming, training and testing, propulsive force, front crawl.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

With the advent of new technologies it is increasingly easier to find data of different nature from even more accurate sensors that measure the most disparate physical quantities and with different methodologies. The collection of data thus becomes progressively important and takes the form of archiving, cataloging and online and offline consultation of information. Over time, the amount of data collected can become so relevant that it contains information that cannot be easily explored manually or with basic statistical techniques. The use of Big Data therefore becomes the object of more advanced investigation techniques, such as Machine Learning and Deep Learning. In this work some applications in the world of precision zootechnics and heat stress accused by dairy cows are described. Experimental Italian and German stables were involved for the training and testing of the Random Forest algorithm, obtaining a prediction of milk production depending on the microclimatic conditions of the previous days with satisfactory accuracy. Furthermore, in order to identify an objective method for identifying production drops, compared to the Wood model, typically used as an analytical model of the lactation curve, a Robust Statistics technique was used. Its application on some sample lactations and the results obtained allow us to be confident about the use of this method in the future.