6 resultados para Divergence time estimates
em Université de Montréal, Canada
Resumo:
La phylogénie moléculaire fournit un outil complémentaire aux études paléontologiques et géologiques en permettant la construction des relations phylogénétiques entre espèces ainsi que l’estimation du temps de leur divergence. Cependant lorsqu’un arbre phylogénétique est inféré, les chercheurs se focalisent surtout sur la topologie, c'est-à-dire l’ordre de branchement relatif des différents nœuds. Les longueurs des branches de cette phylogénie sont souvent considérées comme des sous-produits, des paramètres de nuisances apportant peu d’information. Elles constituent cependant l’information primaire pour réaliser des datations moléculaires. Or la saturation, la présence de substitutions multiples à une même position, est un artefact qui conduit à une sous-estimation systématique des longueurs de branche. Nous avons décidé d’estimer l‘influence de la saturation et son impact sur l’estimation de l’âge de divergence. Nous avons choisi d’étudier le génome mitochondrial des mammifères qui est supposé avoir un niveau élevé de saturation et qui est disponible pour de nombreuses espèces. De plus, les relations phylogénétiques des mammifères sont connues, ce qui nous a permis de fixer la topologie, contrôlant ainsi un des paramètres influant la longueur des branches. Nous avons utilisé principalement deux méthodes pour améliorer la détection des substitutions multiples : (i) l’augmentation du nombre d’espèces afin de briser les plus longues branches de l’arbre et (ii) des modèles d’évolution des séquences plus ou moins réalistes. Les résultats montrèrent que la sous-estimation des longueurs de branche était très importante (jusqu'à un facteur de 3) et que l’utilisation d'un grand nombre d’espèces est un facteur qui influence beaucoup plus la détection de substitutions multiples que l’amélioration des modèles d’évolutions de séquences. Cela suggère que même les modèles d’évolution les plus complexes disponibles actuellement, (exemple: modèle CAT+Covarion, qui prend en compte l’hétérogénéité des processus de substitution entre positions et des vitesses d’évolution au cours du temps) sont encore loin de capter toute la complexité des processus biologiques. Malgré l’importance de la sous-estimation des longueurs de branche, l’impact sur les datations est apparu être relativement faible, car la sous-estimation est plus ou moins homothétique. Cela est particulièrement vrai pour les modèles d’évolution. Cependant, comme les substitutions multiples sont le plus efficacement détectées en brisant les branches en fragments les plus courts possibles via l’ajout d’espèces, se pose le problème du biais dans l’échantillonnage taxonomique, biais dû à l‘extinction pendant l’histoire de la vie sur terre. Comme ce biais entraine une sous-estimation non-homothétique, nous considérons qu’il est indispensable d’améliorer les modèles d’évolution des séquences et proposons que le protocole élaboré dans ce travail permettra d’évaluer leur efficacité vis-à-vis de la saturation.
Resumo:
This study was undertaken to provide first-time estimates for the seroprevalence of parvovirus B19 infection among daycare educators in Montre´ al, Canada, and to identify factors associated with seropositivity. A cross-sectional design was used. Directors and educators from 81 daycare centres (DCCs) were surveyed about DCC and personal characteristics respectively, and serum samples from 477 female educators were tested for parvovirus B19 IgG antibodies. The seroprevalence of parvovirus B19 was 70%. Parvovirus B19 seropositivity was significantly associated with age and with working experience in DCCs, but the latter association was restricted to educators aged less than 40 years. In conclusion, working as a daycare educator appears to be associated with increased risk of acquiring parvovirus B19 infection, but this finding will require further investigation. Because of the large proportion of educators susceptible to acquiring parvovirus B19 infection, our findings also highlight the need for preventive measures.
Resumo:
Bauhinia s.l. est le plus vaste genre de la tribu des Cercideae (Ceasalpinioideae, Leguminoseae), avec plus de 300 espèces. Il présente une distribution pantropicale et une grande variabilité morphologique. Ces deux caractéristiques ont limité les études taxonomiques sur le genre complet, résultant en plusieurs études taxonomiques de certains groupes seulement. En 1987, Wunderlin et al. proposent une vaste révision taxonomique de la tribu des Cercideae, basée sur des données morphologiques, et divisent le genre Bauhinia en quatre sous-genres. En 2005, Lewis et Forest publient une nouvelle classification préliminaire basée sur des données moléculaires, mais sur un échantillonnage taxonomique restreint. Leurs conclusions remettent en question le monophylétisme du genre Bauhinia et suggèrent plutôt la reconnaissance de huit genres au sein du grade Bauhinia s.l. Afin de vérifier les hypothèses de Lewis et Forest, et obtenir une vision plus claire de l’histroire de Bauhinia s.l., nous avons séquencé deux régions chloroplastiques (trnL-trnF et matK-trnK) et deux régions nucléaires (Leafy et Legcyc) pour un vaste échantillonnage représentatif des Cercideae. Une première phylogénie de la tribu a tout d’abord été réalisée à partir des séquences de trnL-trnF seulement et a confirmé le non-monoplylétisme de Bauhinia s.l., avec l’inclusion du genre Brenierea, traditionnellement reconnu comme genre frère de Bauhinia s.l. Afin de ne pas limiter notre vision de l’histoire évolutive des Cercideae à un seul type de données moléculaires et à une seule région, une nouvelle série d’analyse a été effectuée, incluant toutes les séquences chloroplastiques et nucléaires. Une phylogénie individuelle a été reconstruite pour chacune des régions du génome, et un arbre d’espèce ainsi qu’un arbre de supermatrice ont été reconstruits. Bien que certaines contradictions apparaissent entre les phylogénies, les grandes lignes de l’histoire des Cercideae ont été résolues. Bauhinia s.l. est divisée en deux lignées : les groupes Phanera et Bauhinia. Le groupe Bauhinia est constitué des genres Bauhinia s.s., Piliostigma et Brenierea. Le groupe Phanera est constitué des genres Gigasiphon, Tylosema, Lysiphyllum, Barklya, Phanera et Schnella. Les genres Cercis, Adenolobus et Griffonia sont les groupes-frères du clade Bauhinia s.l. Au minimum un événement de duplication de Legcyc a été mis en évidence pour la totalité de la tribu des Cercideae, excepté Cercis, mais plusieurs évènements sont suggérés à la fois par Legcyc et Leafy. Finalement, la datation et la reconstruction des aires ancestrales de la tribu ont été effectuées. La tribu est datée de 49,7 Ma et est originaire des régions tempérées de l’hémisphère nord, probablement autour de la mer de Thétys. La tribu s’est ensuite dispersée vers les régions tropicales sèches de l’Afrique, où la séparation des groupes Bauhinia et Phanera a eu lieu. Ces deux groupes se sont ensuite dispersés en parallèle vers l’Asie du sud-est au début du Miocène. À la même période, une dispersion depuis l’Afrique de Bauhinia s.s. a permis la diversification des espèces américaines de ce genre, alors que le genre Schnella (seul genre américain du groupe Phanera) est passé par l’Australie afin de rejoindre le continent américain. Cette dispersion vers l’Australie sera également à l’origine des genres Lysiphyllum et Barklya
Resumo:
Between 1700 and 1850, per-capita income doubled in Europe while falling in the rest of Eurasia. Neither geography nor economic institutions can explain this sudden divergence. Here the consequences of differences in communications technology are examined. For the first time, there appeared in Europe a combination of a standardized medium (national vernaculars with a phonetic alphabet) and a non-standardized message (competing religious, political and scientific ideas). The result was an unprecedented fall in the cost of combining ideas and burst of productivity-raising innovation. Elsewhere, decreasing standardization of the medium and increasing standardization of the message blocked innovation.
Resumo:
Contexte. Les études cas-témoins sont très fréquemment utilisées par les épidémiologistes pour évaluer l’impact de certaines expositions sur une maladie particulière. Ces expositions peuvent être représentées par plusieurs variables dépendant du temps, et de nouvelles méthodes sont nécessaires pour estimer de manière précise leurs effets. En effet, la régression logistique qui est la méthode conventionnelle pour analyser les données cas-témoins ne tient pas directement compte des changements de valeurs des covariables au cours du temps. Par opposition, les méthodes d’analyse des données de survie telles que le modèle de Cox à risques instantanés proportionnels peuvent directement incorporer des covariables dépendant du temps représentant les histoires individuelles d’exposition. Cependant, cela nécessite de manipuler les ensembles de sujets à risque avec précaution à cause du sur-échantillonnage des cas, en comparaison avec les témoins, dans les études cas-témoins. Comme montré dans une étude de simulation précédente, la définition optimale des ensembles de sujets à risque pour l’analyse des données cas-témoins reste encore à être élucidée, et à être étudiée dans le cas des variables dépendant du temps. Objectif: L’objectif général est de proposer et d’étudier de nouvelles versions du modèle de Cox pour estimer l’impact d’expositions variant dans le temps dans les études cas-témoins, et de les appliquer à des données réelles cas-témoins sur le cancer du poumon et le tabac. Méthodes. J’ai identifié de nouvelles définitions d’ensemble de sujets à risque, potentiellement optimales (le Weighted Cox model and le Simple weighted Cox model), dans lesquelles différentes pondérations ont été affectées aux cas et aux témoins, afin de refléter les proportions de cas et de non cas dans la population source. Les propriétés des estimateurs des effets d’exposition ont été étudiées par simulation. Différents aspects d’exposition ont été générés (intensité, durée, valeur cumulée d’exposition). Les données cas-témoins générées ont été ensuite analysées avec différentes versions du modèle de Cox, incluant les définitions anciennes et nouvelles des ensembles de sujets à risque, ainsi qu’avec la régression logistique conventionnelle, à des fins de comparaison. Les différents modèles de régression ont ensuite été appliqués sur des données réelles cas-témoins sur le cancer du poumon. Les estimations des effets de différentes variables de tabac, obtenues avec les différentes méthodes, ont été comparées entre elles, et comparées aux résultats des simulations. Résultats. Les résultats des simulations montrent que les estimations des nouveaux modèles de Cox pondérés proposés, surtout celles du Weighted Cox model, sont bien moins biaisées que les estimations des modèles de Cox existants qui incluent ou excluent simplement les futurs cas de chaque ensemble de sujets à risque. De plus, les estimations du Weighted Cox model étaient légèrement, mais systématiquement, moins biaisées que celles de la régression logistique. L’application aux données réelles montre de plus grandes différences entre les estimations de la régression logistique et des modèles de Cox pondérés, pour quelques variables de tabac dépendant du temps. Conclusions. Les résultats suggèrent que le nouveau modèle de Cox pondéré propose pourrait être une alternative intéressante au modèle de régression logistique, pour estimer les effets d’expositions dépendant du temps dans les études cas-témoins
Inference for nonparametric high-frequency estimators with an application to time variation in betas
Resumo:
We consider the problem of conducting inference on nonparametric high-frequency estimators without knowing their asymptotic variances. We prove that a multivariate subsampling method achieves this goal under general conditions that were not previously available in the literature. We suggest a procedure for a data-driven choice of the bandwidth parameters. Our simulation study indicates that the subsampling method is much more robust than the plug-in method based on the asymptotic expression for the variance. Importantly, the subsampling method reliably estimates the variability of the Two Scale estimator even when its parameters are chosen to minimize the finite sample Mean Squared Error; in contrast, the plugin estimator substantially underestimates the sampling uncertainty. By construction, the subsampling method delivers estimates of the variance-covariance matrices that are always positive semi-definite. We use the subsampling method to study the dynamics of financial betas of six stocks on the NYSE. We document significant variation in betas within year 2006, and find that tick data captures more variation in betas than the data sampled at moderate frequencies such as every five or twenty minutes. To capture this variation we estimate a simple dynamic model for betas. The variance estimation is also important for the correction of the errors-in-variables bias in such models. We find that the bias corrections are substantial, and that betas are more persistent than the naive estimators would lead one to believe.