953 resultados para Semi-supervised classification
Resumo:
Luokittelujärjestelmää suunniteltaessa tarkoituksena on rakentaa systeemi, joka pystyy ratkaisemaan mahdollisimman tarkasti tutkittavan ongelma-alueen. Hahmontunnistuksessa tunnistusjärjestelmän ydin on luokitin. Luokittelun sovellusaluekenttä on varsin laaja. Luokitinta tarvitaan mm. hahmontunnistusjärjestelmissä, joista kuvankäsittely toimii hyvänä esimerkkinä. Myös lääketieteen parissa tarkkaa luokittelua tarvitaan paljon. Esimerkiksi potilaan oireiden diagnosointiin tarvitaan luokitin, joka pystyy mittaustuloksista päättelemään mahdollisimman tarkasti, onko potilaalla kyseinen oire vai ei. Väitöskirjassa on tehty similaarisuusmittoihin perustuva luokitin ja sen toimintaa on tarkasteltu mm. lääketieteen paristatulevilla data-aineistoilla, joissa luokittelutehtävänä on tunnistaa potilaan oireen laatu. Väitöskirjassa esitetyn luokittimen etuna on sen yksinkertainen rakenne, josta johtuen se on helppo tehdä sekä ymmärtää. Toinen etu on luokittimentarkkuus. Luokitin saadaan luokittelemaan useita eri ongelmia hyvin tarkasti. Tämä on tärkeää varsinkin lääketieteen parissa, missä jo pieni tarkkuuden parannus luokittelutuloksessa on erittäin tärkeää. Väitöskirjassa ontutkittu useita eri mittoja, joilla voidaan mitata samankaltaisuutta. Mitoille löytyy myös useita parametreja, joille voidaan etsiä juuri kyseiseen luokitteluongelmaan sopivat arvot. Tämä parametrien optimointi ongelma-alueeseen sopivaksi voidaan suorittaa mm. evoluutionääri- algoritmeja käyttäen. Kyseisessä työssä tähän on käytetty geneettistä algoritmia ja differentiaali-evoluutioalgoritmia. Luokittimen etuna on sen joustavuus. Ongelma-alueelle on helppo vaihtaa similaarisuusmitta, jos kyseinen mitta ei ole sopiva tutkittavaan ongelma-alueeseen. Myös eri mittojen parametrien optimointi voi parantaa tuloksia huomattavasti. Kun käytetään eri esikäsittelymenetelmiä ennen luokittelua, tuloksia pystytään parantamaan.
Resumo:
A study was carried out at Embrapa Semi-Árido, Petrolina-PE, Brazil, aiming to understand the gas exchange process of the umbu tree (Spondias tuberosa Arr. Cam.) in the dry and rainy seasons. Stomatal conductance, transpiration, photosynthesis and internal CO2 concentration were obtained with a portable infrared gas analyzer (IRGA). During the dry season the umbu tree showed a much lower stomatal conductance early in the morning, as soon as the vapor pressure deficit increased, apparently affecting CO2 assimilation more than transpiration. The highest values were detected around 6:00 am but decreased to the lowest points between 10:00 am and 2:00 pm. During the rainy season, however, stomatal conductance, transpiration and photosynthesis were significantly higher, reaching the highest values between 8:00 and 10:00 am and the lowest around 2:00 pm. It was also observed at 4:00 pm, mainly during the rainy season, an increase on these variables indicating that the umbu tree exhibits a two-picked daily course of gas exchange.
Resumo:
Background: Development of three classification trees (CT) based on the CART (Classification and Regression Trees), CHAID (Chi-Square Automatic Interaction Detection) and C4.5 methodologies for the calculation of probability of hospital mortality; the comparison of the results with the APACHE II, SAPS II and MPM II-24 scores, and with a model based on multiple logistic regression (LR). Methods: Retrospective study of 2864 patients. Random partition (70:30) into a Development Set (DS) n = 1808 and Validation Set (VS) n = 808. Their properties of discrimination are compared with the ROC curve (AUC CI 95%), Percent of correct classification (PCC CI 95%); and the calibration with the Calibration Curve and the Standardized Mortality Ratio (SMR CI 95%). Results: CTs are produced with a different selection of variables and decision rules: CART (5 variables and 8 decision rules), CHAID (7 variables and 15 rules) and C4.5 (6 variables and 10 rules). The common variables were: inotropic therapy, Glasgow, age, (A-a)O2 gradient and antecedent of chronic illness. In VS: all the models achieved acceptable discrimination with AUC above 0.7. CT: CART (0.75(0.71-0.81)), CHAID (0.76(0.72-0.79)) and C4.5 (0.76(0.73-0.80)). PCC: CART (72(69- 75)), CHAID (72(69-75)) and C4.5 (76(73-79)). Calibration (SMR) better in the CT: CART (1.04(0.95-1.31)), CHAID (1.06(0.97-1.15) and C4.5 (1.08(0.98-1.16)). Conclusion: With different methodologies of CTs, trees are generated with different selection of variables and decision rules. The CTs are easy to interpret, and they stratify the risk of hospital mortality. The CTs should be taken into account for the classification of the prognosis of critically ill patients.
Resumo:
Near-infrared spectroscopy (NIRS) was used to analyse the crude protein content of dried and milled samples of wheat and to discriminate samples according to their stage of growth. A calibration set of 72 samples from three growth stages of wheat (tillering, heading and harvest) and a validation set of 28 samples was collected for this purpose. Principal components analysis (PCA) of the calibration set discriminated groups of samples according to the growth stage of the wheat. Based on these differences, a classification procedure (SIMCA) showed a very accurate classification of the validation set samples : all of them were successfully classified in each group using this procedure when both the residual and the leverage were used in the classification criteria. Looking only at the residuals all the samples were also correctly classified except one of tillering stage that was assigned to both tillering and heading stages. Finally, the determination of the crude protein content of these samples was considered in two ways: building up a global model for all the growth stages, and building up local models for each stage, separately. The best prediction results for crude protein were obtained using a global model for samples in the two first growth stages (tillering and heading), and using a local model for the harvest stage samples.
Resumo:
O uso da irrigação nas regiões semi-áridas do Nordeste brasileiro tem viabilizado o cultivo comercial de inúmeras fruteiras, tais como a uva, a manga, a goiaba, o coco e a banana. Outras espécies, como o pomelo, ou grapefruit, vêm sendo ainda objeto de estudos e avaliações. Uma coleção formada de 06 variedades de pomelos (Citrus paradisi), de polpas com coloração rosa-avermelhada ('Marsh Foster', 'Star Ruby', 'Rio Red' e 'Red Blush') e amarelada ('Triumph' e 'Marsh Foster Nucelar'), foi implantada em 1993 na Estação Experimental de Ibimirim, localizada no município de Ibimirim, no Vale do Rio Moxotó - região semi-árida de Pernambuco. Contando com cinco plantas por parcela, a coleção foi conduzida sob irrigação localizada e as avaliações realizadas durante três anos (2000 a 2002). Os resultados demostraram alta variabilidade na produção de frutos, tendo a variedade 'Marsh Foster Nucelar' alcançado a produção média de 135,0 kg/planta, enquanto a 'Star Ruby' atingiu apenas 31,0 kg/planta. O peso médio dos frutos variou de 285,5g ('Red Blush') até um máximo de 401,6g na variedade 'Triumph'. O volume de suco extraído, os sólidos solúveis totais (SST), a acidez total titulável (ATT) e a relação SSS/ATT também apresentaram mudanças entre as variedades estudadas.
Resumo:
En este artículo se pretende analizar la prensa de la ciudad de Lleida durante el Trienio Liberal. Para ello se ha iniciado el texto introduciendo un contexto histórico marcado por la contrarrevolución realista destinada a acabar con el gobierno liberal. Para a continuación esbozar una breve caracterización de la prensa en el Trienio Liberal. Finalmente se estudian de una manera pormenorizada los ocho números del Semi-Semanario Ilerdense (1822), el único periódico editado y publicado en Lleida a lo largo del período liberal, el cual se identificó por su carácter liberal exaltado.
Resumo:
Many classification systems rely on clustering techniques in which a collection of training examples is provided as an input, and a number of clusters c1,...cm modelling some concept C results as an output, such that every cluster ci is labelled as positive or negative. Given a new, unlabelled instance enew, the above classification is used to determine to which particular cluster ci this new instance belongs. In such a setting clusters can overlap, and a new unlabelled instance can be assigned to more than one cluster with conflicting labels. In the literature, such a case is usually solved non-deterministically by making a random choice. This paper presents a novel, hybrid approach to solve this situation by combining a neural network for classification along with a defeasible argumentation framework which models preference criteria for performing clustering.
Resumo:
O objetivo do trabalho foi verificar o efeito do ácido indolbutírico (AIB) no enraizamento de estacas do cacaueiro. O delineamento experimental foi o inteiramente casualizado, em esquema fatorial 3 x 5 x 2, envolvendo 3 clones (Cepec 2008, CCN 51 e TSH 1188), 5 concentrações de ácido indolbutírico AIB (0; 1.000; 3.000; 6.000 e 9.000 mg kg-1), duas épocas do ano (verão e inverno),, cinco repetições e 10 estacas por parcela. A avaliação do experimento foi realizada 120 dias após o plantio e analisadas as seguintes variáveis: percentagem de sobrevivência (SOB), número de brotações (NB), matéria seca das brotações (MSB), percentagem de estacas enraizadas (ENR), número de raízes (NR) e matéria seca de raízes (MSR). Os fatores época do ano e concentração de AIB apresentaram efeito significativo para as variáveis estudadas quando isolados e em interação com os clones. Os dados obtidos possibilitaram concluir que o valor médio da concentração ideal de AIB (CI) foi de 4.169 mg kg-1 e 3.985 mg kg-1 no verão e inverno, respectivamente. Verificou-se que os clones apresentam diferentes respostas em relação à CI de AIB e época do ano. De modo geral, as CIs no verão foram maiores que no inverno. Os resultados mostraram que a época de plantio e a concentração de AIB influenciaram de maneira mais expressiva na sobrevivência e enraizamento das estacas dos clones Cepec 2008 e CCN 51 e em menor intensidade no clone TSH 1188. Existe uma concentração ideal de AIB para cada um dos clones estudados.
Resumo:
El empleo de isótopos estables en el ámbito de la ecología forestal ha ido creciendo progresivamente en las últimas dos décadas. Cabe esperar que esta tendencia se mantenga en el futuro, ya que éstos aportan una visión integradora de cómo las plantas, hoy y en el pasado, han interaccionado con el medio así como con otros organismos. Su implementación es particularmente relevante en climas secos debido a la fuerte limitación de recursos que en ellos acontece. Tras una breve introducción sobre las bases teóricas de los isótopos estables en fisiología vegetal, esta revisión destaca, sobre diferentes escalas espaciales y temporales, los últimos avances en ecología forestal empleando esta metodología y con un énfasis especial en los sistemas áridos y semiáridos.