909 resultados para classification and regression trees


Relevância:

100.00% 100.00%

Publicador:

Resumo:

In adults with non-promyelocytic acute myeloid leukemia (AML), high-dose cytarabine consolidation therapy has been shown to influence survival in selected patients, although the appropriate doses and schemes have not been defined. We evaluated survival after calculating the actual dose of cytarabine that patients received for consolidation therapy and divided them into 3 groups according to dose. We conducted a single-center, retrospective study involving 311 non-promyelocytic AML patients with a median age of 36 years (16-79 years) who received curative treatment between 1978 and 2007. The 131 patients who received cytarabine consolidation were assigned to study groups by their cytarabine dose protocol. Group 1 (n=69) received <1.5 g/m2 every 12 h on 3 alternate days for up to 4 cycles. The remaining patients received high-dose cytarabine (≥1.5 g/m2 every 12 h on 3 alternate days for up to 4 cycles). The actual dose received during the entire consolidation period in these patients was calculated, allowing us to divide these patients into 2 additional groups. Group 2 (n=27) received an intermediate-high-dose (<27 g/m2), and group 3 (n=35) received a very-high-dose (≥27 g/m2). Among the 311 patients receiving curative treatment, the 5-year survival rate was 20.2% (63 patients). The cytarabine consolidation dose was an independent determinant of survival in multivariate analysis; age, karyotype, induction protocol, French-American-British classification, and de novo leukemia were not. Comparisons showed that the risk of death was higher in the intermediate-high-dose group 2 (hazard ratio [HR]=4.51; 95% confidence interval [CI]: 1.81-11.21) and the low-dose group 1 (HR=4.43; 95% CI: 1.97-9.96) than in the very-high-dose group 3, with no significant difference between those two groups. Our findings indicated that very-high-dose cytarabine during consolidation in adults with non-promyelocytic AML may improve survival.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

The subject of the thesis is automatic sentence compression with machine learning, so that the compressed sentences remain both grammatical and retain their essential meaning. There are multiple possible uses for the compression of natural language sentences. In this thesis the focus is generation of television program subtitles, which often are compressed version of the original script of the program. The main part of the thesis consists of machine learning experiments for automatic sentence compression using different approaches to the problem. The machine learning methods used for this work are linear-chain conditional random fields and support vector machines. Also we take a look which automatic text analysis methods provide useful features for the task. The data used for machine learning is supplied by Lingsoft Inc. and consists of subtitles in both compressed an uncompressed form. The models are compared to a baseline system and comparisons are made both automatically and also using human evaluation, because of the potentially subjective nature of the output. The best result is achieved using a CRF - sequence classification using a rich feature set. All text analysis methods help classification and most useful method is morphological analysis. Tutkielman aihe on suomenkielisten lauseiden automaattinen tiivistäminen koneellisesti, niin että lyhennetyt lauseet säilyttävät olennaisen informaationsa ja pysyvät kieliopillisina. Luonnollisen kielen lauseiden tiivistämiselle on monta käyttötarkoitusta, mutta tässä tutkielmassa aihetta lähestytään television ohjelmien tekstittämisen kautta, johon käytännössä kuuluu alkuperäisen tekstin lyhentäminen televisioruudulle paremmin sopivaksi. Tutkielmassa kokeillaan erilaisia koneoppimismenetelmiä tekstin automaatiseen lyhentämiseen ja tarkastellaan miten hyvin erilaiset luonnollisen kielen analyysimenetelmät tuottavat informaatiota, joka auttaa näitä menetelmiä lyhentämään lauseita. Lisäksi tarkastellaan minkälainen lähestymistapa tuottaa parhaan lopputuloksen. Käytetyt koneoppimismenetelmät ovat tukivektorikone ja lineaarisen sekvenssin mallinen CRF. Koneoppimisen tukena käytetään tekstityksiä niiden eri käsittelyvaiheissa, jotka on saatu Lingsoft OY:ltä. Luotuja malleja vertaillaan Lopulta mallien lopputuloksia evaluoidaan automaattisesti ja koska teksti lopputuksena on jossain määrin subjektiivinen myös ihmisarviointiin perustuen. Vertailukohtana toimii kirjallisuudesta poimittu menetelmä. Tutkielman tuloksena paras lopputulos saadaan aikaan käyttäen CRF sekvenssi-luokittelijaa laajalla piirrejoukolla. Kaikki kokeillut teksin analyysimenetelmät auttavat luokittelussa, joista tärkeimmän panoksen antaa morfologinen analyysi.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

AbstractOptimization of microwave drying conditions of Luvhele and Mabonde banana varieties were studied using response surface methodology. The drying was performed using a central composite rotatable design for two variables: microwave power level (100, 200 and 300 W) and drying time (40, 26, and 12 min.) for Luvhele; (100, 200 and 300 W) and (42, 27, and 12 min) for Mabonde. The colour and texture (hardness) data were analyzed using ANOVA and regression analysis. The fitness of the models obtained was good as the lack of fit for each of the models was not significant. The coefficient of determination R2 of the models was relatively high, hence the models obtained for the responses were adequate and acceptable. Drying conditions of 178.76 W, 12 min. drying time were found optimum for product quality at a desirability of 0.91 for Luvhele; while 127.67 W, 12 min. with a desirability of 0.86 was predicted for Mabonde. The result of this study could be used as a standard for microwave processing of Luvhele and Mabondebanana varieties.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Kirjallisuusarvostelu

Relevância:

100.00% 100.00%

Publicador:

Resumo:

The impermeability of seed coat to water is common mechanism in Fabaceae seeds. Treatments to overcome hardseededness include scarification with sulphuric acid, scarification on abrasive surface and soaking in water among others. The objective of this study was to identify an effective method to overcome dormancy in Dinizia excelsa seeds. A pre-test (untreated seed) and three experiments were carried out: immersion of seeds in acid sulphuric for 10, 20, 30, 40, 50 and 60min (experiment 1); scarification on abrasive surface at the positions distal end, near of the mycrophyle and on the lateral tissue and tegument clipping at 1mm of the distal end, near of the mycrophyle and on the lateral tissue (experiment 2); scarification on abrasive surface and immersion in water for 0, 12, 24 and 48h (experiment 3). The experimental design was completely with four replications of 50 seeds for each treatment. The statistical analysis was carried out by ANOVA and regression analysis. Seedlings emergence on untreated seeds started on the 8th day after sowing and reached 52.5% on the 1,709th day. In general, the treatments to overcome dormancy increase emergence. Emergence was higher for seeds treated with sulphuric acid for 20 and 30min with emergence of 93.6% and 86.6%, respectively. For seeds scarified on abrasive surface higher emergences were recorded for scarification on distal end, near of the mycrophyle and on the lateral, 82.7%, 74.3% and 75.7%, respectively. Seeds scarified manually showed higher emergence when not immersed in water (75%), or when immersed for 12 and 24h (75%, 73.6% and 65.6%, respectively). Immersion seeds in sulphuric acid for 20 and 30min and scarification on abrasive surface of distal end are effective to overcome dormancy in D. excelsa.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

This study examined the use of human resource management (HRM) practices with volunteers in Canadian Community Sport Organizations (CSOs). Using the Volunteer Management Inventory (VMI; Cuskelly, Taylor, Hoye & Darcy, 2006), 219 leaders of associations in basketball, curling, ice hockey, skating, skiing, swimming, and volleyball participated in this study and identified current trends in HRM practices and perceived issues in the retention of volunteers. Data collected was analyzed using mean and descriptive statistics, T-tests, ANOVAs, and regression analyses. Results indicate that there is a varying use of HRM practices amongst the organizations, and also a significant correlation between the use of HRM practices and the retention of volunteers, particularly board members. Implications and future research directions are discussed regarding how HRM practices and principles may be applied to CSOs.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

The aim of this thesis is to price options on equity index futures with an application to standard options on S&P 500 futures traded on the Chicago Mercantile Exchange. Our methodology is based on stochastic dynamic programming, which can accommodate European as well as American options. The model accommodates dividends from the underlying asset. It also captures the optimal exercise strategy and the fair value of the option. This approach is an alternative to available numerical pricing methods such as binomial trees, finite differences, and ad-hoc numerical approximation techniques. Our numerical and empirical investigations demonstrate convergence, robustness, and efficiency. We use this methodology to value exchange-listed options. The European option premiums thus obtained are compared to Black's closed-form formula. They are accurate to four digits. The American option premiums also have a similar level of accuracy compared to premiums obtained using finite differences and binomial trees with a large number of time steps. The proposed model accounts for deterministic, seasonally varying dividend yield. In pricing futures options, we discover that what matters is the sum of the dividend yields over the life of the futures contract and not their distribution.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

A landscape photograph of a lake and surrounding trees.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Ce texte propose des méthodes d’inférence exactes (tests et régions de confiance) sur des modèles de régression linéaires avec erreurs autocorrélées suivant un processus autorégressif d’ordre deux [AR(2)], qui peut être non stationnaire. L’approche proposée est une généralisation de celle décrite dans Dufour (1990) pour un modèle de régression avec erreurs AR(1) et comporte trois étapes. Premièrement, on construit une région de confiance exacte pour le vecteur des coefficients du processus autorégressif (φ). Cette région est obtenue par inversion de tests d’indépendance des erreurs sur une forme transformée du modèle contre des alternatives de dépendance aux délais un et deux. Deuxièmement, en exploitant la dualité entre tests et régions de confiance (inversion de tests), on détermine une région de confiance conjointe pour le vecteur φ et un vecteur d’intérêt M de combinaisons linéaires des coefficients de régression du modèle. Troisièmement, par une méthode de projection, on obtient des intervalles de confiance «marginaux» ainsi que des tests à bornes exacts pour les composantes de M. Ces méthodes sont appliquées à des modèles du stock de monnaie (M2) et du niveau des prix (indice implicite du PNB) américains

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Le rôle important joué par la mitochondrie dans la cellule eucaryote est admis depuis longtemps. Cependant, la composition exacte des mitochondries, ainsi que les processus biologiques qui sy déroulent restent encore largement inconnus. Deux facteurs principaux permettent dexpliquer pourquoi létude des mitochondries progresse si lentement : le manque defficacité des méthodes didentification des protéines mitochondriales et le manque de précision dans lannotation de ces protéines. En conséquence, nous avons développé un nouvel outil informatique, YimLoc, qui permet de prédire avec succès les protéines mitochondriales à partir des séquences génomiques. Cet outil intègre plusieurs indicateurs existants, et sa performance est supérieure à celle des indicateurs considérés individuellement. Nous avons analysé environ 60 génomes fongiques avec YimLoc afin de lever la controverse concernant la localisation de la bêta-oxydation dans ces organismes. Contrairement à ce qui était généralement admis, nos résultats montrent que la plupart des groupes de Fungi possèdent une bêta-oxydation mitochondriale. Ce travail met également en évidence la diversité des processus de bêta-oxydation chez les champignons, en corrélation avec leur utilisation des acides gras comme source dénergie et de carbone. De plus, nous avons étudié le composant clef de la voie de bêta-oxydation mitochondriale, lacyl-CoA déshydrogénase (ACAD), dans 250 espèces, couvrant les 3 domaines de la vie, en combinant la prédiction de la localisation subcellulaire avec la classification en sous-familles et linférence phylogénétique. Notre étude suggère que les gènes ACAD font partie dune ancienne famille qui a adopté des stratégies évolutionnaires innovatrices afin de générer un large ensemble denzymes susceptibles dutiliser la plupart des acides gras et des acides aminés. Finalement, afin de permettre la prédiction de protéines mitochondriales à partir de données autres que les séquences génomiques, nous avons développé le logiciel TESTLoc qui utilise comme données des Expressed Sequence Tags (ESTs). La performance de TESTLoc est significativement supérieure à celle de tout autre outil de prédiction connu. En plus de fournir deux nouveaux outils de prédiction de la localisation subcellulaire utilisant différents types de données, nos travaux démontrent comment lassociation de la prédiction de la localisation subcellulaire à dautres méthodes danalyse in silico permet daméliorer la connaissance des protéines mitochondriales. De plus, ces travaux proposent des hypothèses claires et faciles à vérifier par des expériences, ce qui présente un grand potentiel pour faire progresser nos connaissances des métabolismes mitochondriaux.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Alors que dans les sociétés de l’Afrique de l’Ouest, le mariage représente traditionnellement le point de départ de la séquence des événements démographiques associés à la formation de la famille, aujourd’hui cette séquence s’est complexifiée. Suite à l’effritement des modes traditionnels du passage à l’âge adulte, les jeunes citadins reportent leur mariage, le contexte de l’initiation sexuelle est plus fréquemment prénuptial et le nombre de naissances hors mariage semble augmenter. Peu d’études se sont penchées sur l’analyse de la séquence de ces événements sous l’angle du parcours individuel. L’objectif central de ce mémoire est d’explorer, de décrire et d’expliquer les changements survenus dans les parcours d’entrée en vie féconde des femmes durant leur jeunesse en utilisant comme unité d’analyse l’entièreté des parcours. Utilisant les données EDS du Burkina Faso, nous synthétisons en parcours, sous forme des séquences d’épisodes, les calendriers du premier rapport sexuel, de la première union et de la première naissance. Avec l’analyse séquentielle, nous identifions quatre catégories de parcours : nuptial, sexualité prénuptiale, maternité prénuptiale et célibataires. La méthode permet également une catégorisation plus fine des parcours et une visualisation de modèles de transitions. Nous analysons ensuite l’association entre les caractéristiques individuelles et les parcours suivis grâce à des modèles multinomiaux. Nos résultats confirment l’augmentation des parcours non nuptiaux auprès des jeunes. De plus, ils montrent qu’un niveau de scolarité plus élevé augmente la probabilité de suivre un parcours non-traditionnel, notamment chez les femmes urbaines, le milieu de socialisation à l’enfance ayant aussi un effet sur le choix du parcours.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

La psychopathie et le trouble de personnalité antisociale sont deux syndromes reliés qui ont été identifiés comme prédicteurs importants de comportements violents et de criminalité. Cependant, la recherche indique que les facteurs de la psychopathie centrés sur la personnalité ne sont pas des prédicteurs fiables de récidive violente chez les personnes atteintes de maladies mentales. Toutefois, peu d’études se sont centrées sur l’identification des facteurs associés au patron des antécédents criminels. Les 96 hommes de l’étude ont été déclarés non criminellement responsables en raison de troubles mentaux. Ils ont été évalués quant au trouble de la personnalité antisociale ainsi qu’à la psychopathie. Les dossiers criminels de la Gendarmerie Royale du Canada ont également été consultés afin de reconstituer l’histoire criminelle. Les résultats suggèrent que ni les traits de personnalité antisociaux, ni les facteurs de la psychopathie ne démontrent une validité prédictive incrémentielle les uns sur les autres quant au nombre ou à la sévérité des délits. La présence d’un grand nombre de traits antisociaux est associée à un plus grand nombre et à une plus importante sévérité d’actes criminels non-violents. Les résultats sont discutés en termes de l’utilité d’une classification du trouble de personnalité antisociale, et de la pertinence du construit de la psychopathie pour les personnes atteintes de maladies mentales graves.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

La représentation d'une surface, son lissage et son utilisation pour l'identification, la comparaison, la classification, et l'étude des variations de volume, de courbure ou de topologie sont omniprésentes dans l'aire de la numérisation. Parmi les méthodes mathématiques, nous avons retenu les transformations difféomorphiques d'un pattern de référence. Il y a un grand intérêt théorique et numérique à approcher un difféomorphisme arbitraire par des difféomorphismes engendrés par des champs de vitesses. Sur le plan théorique la question est : "est-ce que le sous-groupe de difféomorphismes engendrés par des champs de vitesses est dense dans le groupe plus large de Micheletti pour la métrique de Courant ?" Malgré quelques progrès réalisés ici, cette question demeure ouverte. Les pistes empruntées ont alors convergé vers le sous-groupe de Azencott et de Trouvé et sa métrique dans le cadre de l'imagerie. Elle correspond à une notion de géodésique entre deux difféomorphismes dans leur sous-groupe. L'optimisation est utilisée pour obtenir un système d'équations état adjoint caractérisant la solution optimale du problème d'identification à partir des observations. Cette approche est adaptée à l'identification de surfaces obtenues par un numériseur tel que, par exemple, le scan d'un visage. Ce problème est beaucoup plus difficile que celui d'imagerie. On doit alors introduire un système de référence courbe et une surface à facettes pour les calculs. On donne la formulation du problème d'identification et du calcul du changement de volume par rapport à un scan de référence.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

L’apprentissage machine est un vaste domaine où l’on cherche à apprendre les paramètres de modèles à partir de données concrètes. Ce sera pour effectuer des tâches demandant des aptitudes attribuées à l’intelligence humaine, comme la capacité à traiter des don- nées de haute dimensionnalité présentant beaucoup de variations. Les réseaux de neu- rones artificiels sont un exemple de tels modèles. Dans certains réseaux de neurones dits profonds, des concepts "abstraits" sont appris automatiquement. Les travaux présentés ici prennent leur inspiration de réseaux de neurones profonds, de réseaux récurrents et de neuroscience du système visuel. Nos tâches de test sont la classification et le débruitement d’images quasi binaires. On permettra une rétroac- tion où des représentations de haut niveau (plus "abstraites") influencent des représentations à bas niveau. Cette influence s’effectuera au cours de ce qu’on nomme relaxation, des itérations où les différents niveaux (ou couches) du modèle s’interinfluencent. Nous présentons deux familles d’architectures, l’une, l’architecture complètement connectée, pouvant en principe traiter des données générales et une autre, l’architecture convolutionnelle, plus spécifiquement adaptée aux images. Dans tous les cas, les données utilisées sont des images, principalement des images de chiffres manuscrits. Dans un type d’expérience, nous cherchons à reconstruire des données qui ont été corrompues. On a pu y observer le phénomène d’influence décrit précédemment en comparant le résultat avec et sans la relaxation. On note aussi certains gains numériques et visuels en terme de performance de reconstruction en ajoutant l’influence des couches supérieures. Dans un autre type de tâche, la classification, peu de gains ont été observés. On a tout de même pu constater que dans certains cas la relaxation aiderait à apprendre des représentations utiles pour classifier des images corrompues. L’architecture convolutionnelle développée, plus incertaine au départ, permet malgré tout d’obtenir des reconstructions numériquement et visuellement semblables à celles obtenues avec l’autre architecture, même si sa connectivité est contrainte.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Le béluga du Saint-Laurent est une espèce menacée au Canada et protégée par la Loi sur les espèces en péril du Canada. La détermination des fonctions biologiques de ses habitats essentiels est nécessaire afin d’assurer le rétablissement de la population. Parcs Canada a entamé en 2009 un suivi des proies du béluga dans deux de ses aires de fréquentation intensive situées dans le Parc marin du Saguenay–Saint-Laurent : l’embouchure de la rivière Saguenay et la baie Sainte-Marguerite. L’étude de l’abondance et de la distribution des proies est réalisée par sondage hydroacoustique le long de transects à l’aide d’un échosondeur multifréquences. Un protocole d’observations systématiques du béluga est mené simultanément aux sondages hydroacoustiques à partir de sites terrestres. Le premier objectif de cette étude est de développer la méthodologie concernant le traitement, la classification et la cartographie des données hydroacoustiques échantillonnées. L’objectif principal consiste à déterminer si l’abondance et la distribution des proies pélagiques ont une influence sur l’utilisation de ces deux habitats par le béluga. La cartographie de la biomasse relative de poissons a été réalisée pour la couche de surface, la couche en profondeur et pour l’ensemble de la colonne d’eau par krigeage ordinaire pour les deux habitats pour les 29 transects. À la baie Sainte-Marguerite, le nombre de bélugas observés augmente avec la biomasse relative des proies en surface et en profondeur. À l’embouchure de la rivière Saguenay, les résultats n’ont pas été concluants. Les résultats suggèrent que l’alimentation pourrait être l’une des fonctions biologiques de la baie Sainte-Marguerite.