9 resultados para Analyse non paramétrique
em Université Laval Mémoires et thèses électroniques
Resumo:
L’un des problèmes importants en apprentissage automatique est de déterminer la complexité du modèle à apprendre. Une trop grande complexité mène au surapprentissage, ce qui correspond à trouver des structures qui n’existent pas réellement dans les données, tandis qu’une trop faible complexité mène au sous-apprentissage, c’est-à-dire que l’expressivité du modèle est insuffisante pour capturer l’ensemble des structures présentes dans les données. Pour certains modèles probabilistes, la complexité du modèle se traduit par l’introduction d’une ou plusieurs variables cachées dont le rôle est d’expliquer le processus génératif des données. Il existe diverses approches permettant d’identifier le nombre approprié de variables cachées d’un modèle. Cette thèse s’intéresse aux méthodes Bayésiennes nonparamétriques permettant de déterminer le nombre de variables cachées à utiliser ainsi que leur dimensionnalité. La popularisation des statistiques Bayésiennes nonparamétriques au sein de la communauté de l’apprentissage automatique est assez récente. Leur principal attrait vient du fait qu’elles offrent des modèles hautement flexibles et dont la complexité s’ajuste proportionnellement à la quantité de données disponibles. Au cours des dernières années, la recherche sur les méthodes d’apprentissage Bayésiennes nonparamétriques a porté sur trois aspects principaux : la construction de nouveaux modèles, le développement d’algorithmes d’inférence et les applications. Cette thèse présente nos contributions à ces trois sujets de recherches dans le contexte d’apprentissage de modèles à variables cachées. Dans un premier temps, nous introduisons le Pitman-Yor process mixture of Gaussians, un modèle permettant l’apprentissage de mélanges infinis de Gaussiennes. Nous présentons aussi un algorithme d’inférence permettant de découvrir les composantes cachées du modèle que nous évaluons sur deux applications concrètes de robotique. Nos résultats démontrent que l’approche proposée surpasse en performance et en flexibilité les approches classiques d’apprentissage. Dans un deuxième temps, nous proposons l’extended cascading Indian buffet process, un modèle servant de distribution de probabilité a priori sur l’espace des graphes dirigés acycliques. Dans le contexte de réseaux Bayésien, ce prior permet d’identifier à la fois la présence de variables cachées et la structure du réseau parmi celles-ci. Un algorithme d’inférence Monte Carlo par chaîne de Markov est utilisé pour l’évaluation sur des problèmes d’identification de structures et d’estimation de densités. Dans un dernier temps, nous proposons le Indian chefs process, un modèle plus général que l’extended cascading Indian buffet process servant à l’apprentissage de graphes et d’ordres. L’avantage du nouveau modèle est qu’il admet les connections entres les variables observables et qu’il prend en compte l’ordre des variables. Nous présentons un algorithme d’inférence Monte Carlo par chaîne de Markov avec saut réversible permettant l’apprentissage conjoint de graphes et d’ordres. L’évaluation est faite sur des problèmes d’estimations de densité et de test d’indépendance. Ce modèle est le premier modèle Bayésien nonparamétrique permettant d’apprendre des réseaux Bayésiens disposant d’une structure complètement arbitraire.
Resumo:
Les méthodes classiques d’analyse de survie notamment la méthode non paramétrique de Kaplan et Meier (1958) supposent l’indépendance entre les variables d’intérêt et de censure. Mais, cette hypothèse d’indépendance n’étant pas toujours soutenable, plusieurs auteurs ont élaboré des méthodes pour prendre en compte la dépendance. La plupart de ces méthodes émettent des hypothèses sur cette dépendance. Dans ce mémoire, nous avons proposé une méthode d’estimation de la dépendance en présence de censure dépendante qui utilise le copula-graphic estimator pour les copules archimédiennes (Rivest etWells, 2001) et suppose la connaissance de la distribution de la variable de censure. Nous avons ensuite étudié la consistance de cet estimateur à travers des simulations avant de l’appliquer sur un jeu de données réelles.
Resumo:
L’immunopathogenèse de l’infection au VIH-1 est principalement causée par la déplétion des LT CD4 (lymphocytes T-CD4). Cette mort des LT CD4 dépend de plusieurs facteurs comme la lyse des LT CD4 infectés et la présence de vésicules extracellulaires et d’exosomes libérées par les cellules dendritiques et les LT CD4 infectés au VIH-1. L’analyse protéomique des exosomes issus des cellules dendritiques mises en culture avec le VIH-1 a révélé la présence de molécules pro-apoptotiques comme le Dap-3 (Death Associated Protein 3). Nous avons proposé comme hypothèse que le Dap-3 puisse être contenu dans d’autres types de vésicules extracellulaires et que le Dap-3 vésiculaire contribue à la déplétion des LT CD4. Après avoir optimisé l’immunobuvardage avec l’anti-Dap-3, nous avons déterminé la présence de Dap-3 dans les vésicules extracellulaires issues des cellules RAJI-CD4-DCIR infectées au VIH-1. L’utilisation de gradients de vélocité nous a permis d’observer la présence de Dap-3 dans les fractions du gradient contenant les exosomes issus des cellules RAJI-CD4-DCIR infectées, mais également dans d’autres fractions du gradient de vélocité encore non caractérisées. Chez les patients, nous avons montré une hétérogénéité des vésicules extracellulaires dans les fractions du gradient de vélocité issues des plasmas des patients VIH-1+. Ces résultats indiquent la présence de plusieurs populations de vésicules extracellulaires séparées par la méthode du gradient de vélocité. Enfin, la transfection des cellules RAJI-CD4-DCIR et des cellules dendritiques a été mise au point avec les ARN anti-sens de Dap-3 afin de produire éventuellement des vésicules Dap-3 négatives. Ce projet de recherche aura permis de valider les outils nécessaires à la poursuite de l’étude du rôle de Dap-3 dans la pathogenèse de l’infection au VIH-1.
Resumo:
Objectifs : Dans plusieurs pays la couverture vaccinale contre les virus du papillome humain (VPH) est associée aux déterminants sociaux des comportements sexuels et la participation au dépistage du cancer du col utérin. Ces vaccins protègent uniquement contre certains types de VPH, donc leur impact futur sur les VPH nonvaccinaux demeure incertain. L’hétérogénéité comportementale entre individus et biologique entre types de VPH affectera l’efficacité populationnelle de la vaccination contre les VPH. Les objectifs spécifiques de cette thèse étaient 1) de modéliser comment une couverture vaccinale inégale entre filles préadolescentes qui différeront selon leur activité sexuelle et leur participation au dépistage du cancer du col affectera l’efficacité populationnelle de la vaccination, 2) faire une synthèse et comparer les estimés d’efficacité croisée des vaccins contre les VPH dans des populations ADN-négatives aux VPH et 3) d’identifier, avec la modélisation, les devis d’étude épidémiologique qui réduisent les biais dans l’estimation des interactions biologiques entre types de VPH. Méthode : Nous avons utilisé des modèles de transmission dynamique et une revue systématique de la littérature pour répondre aux objectifs. 1) Nous avons modélisé une couverture vaccinale inégale entre filles qui différeront selon leur activité sexuelle et leur participation au dépistage, et examiné les changements postvaccination dans l’inégalité dans la prévalence des VPH et l’incidence des carcinomes malpighien (SCC) du col de l’utérus entre femmes ayant différents comportements. 2) Nous avons effectué une revue systématique et méta-analyse des efficacités croisées des vaccins contre les VPH estimées dans des populations ADNnégatives aux VPH. 3) Nous avons développé des modèles de transmission dynamique et d’interaction de deux types de VPH pour simuler les études épidémiologiques d’interactions entre les VPH. Résultats : Pour l’objectif 1), notre modèle de transmission prédit que l’efficacité populationnelle du vaccin dépendra de la distribution du vaccin dans la population. Après la vaccination, les inégalités absolues dans l’incidence de l’infection et des SCC entre groupes de femmes qui diffèrent selon leur activité sexuelle et leur participation au dépistage devraient diminuer. Inversement, les inégalités relatives pourraient augmenter si les femmes plus sexuellement actives et celles qui ne se font jamais dépister ont une couverture vaccinale moins élevée que les autres. Le taux d’incidence des SCC demeurera élevé chez les femmes qui ne sont jamais dépistées après la vaccination. L’efficacité croisée vaccinale et les interactions biologiques entre VPH ne sont pas encore assez bien caractérisées pour pouvoir prédire l’impact du vaccin sur les types de VPH nonvaccinaux. Pour l’objectif 2), notre méta-analyse des essais cliniques des vaccins suggère que le vaccin bivalent a une efficacité croisée significativement plus élevée que le quadrivalent contre les infections persistantes et lésions précancéreuses avec les VPH-31, 33 et 45. Les essais cliniques plus longs estiment une efficacité croisée plus faible. La modélisation des études épidémiologiques d’interactions pour l’objectif 3) montre que l’estimation des interactions biologiques entre types de VPH dans les études épidémiologiques est systématiquement biaisée par la corrélation entre le temps à risque d’infection avec un type de VPH et le temps à risque d’infection avec d’autres types de VPH. L’ajustement pour des marqueurs d’activité sexuelle ne réussit pas à contrôler ce biais. Une mesure valide des interactions biologiques entre types de VPH peut être obtenue uniquement avec des études épidémiologiques prospectives qui restreignent les analyses à des individus susceptibles ayant des partenaires sexuels infectés. Conclusion : L’hétérogénéité comportementale entre individus et l’hétérogénéité biologique entre VPH affecteront l’efficacité populationnelle du vaccin contre les VPH. Dans les contextes où les déterminants sociaux des comportements sexuels et la participation au dépistage sont aussi associés à la couverture vaccinale chez les préadolescentes, l’inégalité relative dans l’incidence des SCC risque d’augmenter. Ces comportements demeureront des facteurs de risque importants du cancer du col à l’avenir. L’effet à long terme du vaccin sur les types de VPH non-vaccinaux demeure incertain. Quoique nos résultats suggèrent que les vaccins offrent une efficacité croisée contre certains types de VPH, celle-ci pourrait diminuer après quelques années. Des interactions compétitives entre VPH pourraient exister malgré les associations observées entre les incidences des infections VPH, donc une augmentation post-vaccination de la prévalence des VPH non-vaccinaux demeure possible. Des devis d’analyse plus complexes sont nécessaires pour mesurer de façon valide les interactions biologiques entre les VPH dans les études épidémiologiques.
Resumo:
Ce mémoire de maîtrise présente les résultats de l’analyse ergonomique centrée sur l’activité de quatre préposées aux bénéficiaires (PAB) travaillant dans trois centres d’hébergement et de soins de longue durée (CHSLD) et ayant reçu la formation à l’approche relationnelle de soins (ARS). L’hypothèse spécifique de ce projet est que des facteurs de l’environnement de travail des PAB influencent la mise en œuvre des principes enseignés lors de la formation à l’ARS. Pour ce faire, une étude de cas en profondeur par observation in situ a été réalisée auprès de quatre PAB. 44 soins d’hygiène en ont été extraits, puis analysés à l’aide d’une grille d’objectivation de l’ARS. Des entretiens post-soin semi structurés ont été réalisés avec chaque PAB, afin de recueillir leur perception du soin réalisé. Des entretiens d’autoconfrontation ont complété l’étude. Les résultats montrent que les éléments de l’ARS les plus souvent mis en œuvre sont principalement reliés à la création de la bulle relationnelle et la communication alors que ceux qui sont les moins souvent mis en œuvre concernent le toucher et le maintien des capacités du résident. La connaissance préalable du résident ressort comme un facteur-clé facilitant la mise en œuvre de l’ARS. Les PAB se soucient toujours de l’environnement physique, mais elles le perçoivent comme un facteur nuisible à l’ARS, dont elles doivent se préoccuper continuellement. Les contraintes temporelles perçues constituent pour certaines une entrave à la mise en œuvre de l’ARS, alors que pour celles qui ont intégré l’ARS dans leur quotidien, elle leur permet de gagner du temps. Notre étude comporte toutefois certaines limites. Ainsi, certains éléments de la grille n’ont pu être évalués étant donné le non accès aux dossiers des résidents. La grille d’objectivation et le questionnaire post-soin se sont parfois avérés imprécis; les verbalisations des PAB ont alors permis d’éclaircir les résultats bruts. Les outils pourraient être plus sensibles à la mise en œuvre de l’ARS dans le travail réel.
Resumo:
Le cancer de la vessie est le 5e plus répandu au Canada. Les tumeurs vésicales non-infiltrant le muscle (TVNIM) représentent 70-75% des tumeurs au premier diagnostic. Après une résection transurétrale de tumeur de vessie (RTUTV), 60-70 % des patients souffriront de récidive et 10-20 % de progression vers l’infiltration du muscle (TVIM). Présentement, l’évaluation du risque de récidive ou de progression pour sélectionner le traitement approprié est basée sur les caractéristiques cliniques et pathologiques. La gestion des TVNIM à haut risque est l’un des aspects les plus difficiles à gérer pour un uro-oncologue et il est bien connu que l’issue clinique peut varier significativement entre des patients ayant une tumeur de même stade. Il serait donc important de détecter les tumeurs les plus susceptibles de récidiver et de progresser pour ajuster le traitement en conséquence. L’objectif de mon projet était d’analyser la valeur pronostique du contexte immunologique des TVNIM pour prédire leurs probabilités de récidive ou de progression vers l’infiltration du muscle. Mon premier volet consistait à évaluer la valeur pronostique de l’infiltration des cellules immunes, telles que les cellules dendritiques infiltrant les tumeurs (TIDC), les cellules T infiltrant les tumeurs (TIL) et les macrophages associés aux tumeurs (TAM) dans une cohorte de 106 TVNIM initiales. Les données d’infiltration des TIDC et des TIL dans les TVNIM démontrent leur importance dans l’évolution des patients atteints du cancer de la vessie et pourraient aider à identifier les TVNIM à haut risque. Mon deuxième volet consistait à caractériser un profil d’expression génique associé aux immunités innée et adaptative dans une série de 22 TVNIM. Cependant, le faible nombre de tumeurs disponibles a empêché d’obtenir une conclusion. Notre étude a permis de confirmer que la composition et le phénotype des cellules immunes infiltrant les TVNIM ont un impact sur l’évolution de ces tumeurs.
Resumo:
Ma thèse s’intéresse aux politiques de santé conçues pour encourager l’offre de services de santé. L’accessibilité aux services de santé est un problème majeur qui mine le système de santé de la plupart des pays industrialisés. Au Québec, le temps médian d’attente entre une recommandation du médecin généraliste et un rendez-vous avec un médecin spécialiste était de 7,3 semaines en 2012, contre 2,9 semaines en 1993, et ceci malgré l’augmentation du nombre de médecins sur cette même période. Pour les décideurs politiques observant l’augmentation du temps d’attente pour des soins de santé, il est important de comprendre la structure de l’offre de travail des médecins et comment celle-ci affecte l’offre des services de santé. Dans ce contexte, je considère deux principales politiques. En premier lieu, j’estime comment les médecins réagissent aux incitatifs monétaires et j’utilise les paramètres estimés pour examiner comment les politiques de compensation peuvent être utilisées pour déterminer l’offre de services de santé de court terme. En second lieu, j’examine comment la productivité des médecins est affectée par leur expérience, à travers le mécanisme du "learning-by-doing", et j’utilise les paramètres estimés pour trouver le nombre de médecins inexpérimentés que l’on doit recruter pour remplacer un médecin expérimenté qui va à la retraite afin de garder l’offre des services de santé constant. Ma thèse développe et applique des méthodes économique et statistique afin de mesurer la réaction des médecins face aux incitatifs monétaires et estimer leur profil de productivité (en mesurant la variation de la productivité des médecins tout le long de leur carrière) en utilisant à la fois des données de panel sur les médecins québécois, provenant d’enquêtes et de l’administration. Les données contiennent des informations sur l’offre de travail de chaque médecin, les différents types de services offerts ainsi que leurs prix. Ces données couvrent une période pendant laquelle le gouvernement du Québec a changé les prix relatifs des services de santé. J’ai utilisé une approche basée sur la modélisation pour développer et estimer un modèle structurel d’offre de travail en permettant au médecin d’être multitâche. Dans mon modèle les médecins choisissent le nombre d’heures travaillées ainsi que l’allocation de ces heures à travers les différents services offerts, de plus les prix des services leurs sont imposés par le gouvernement. Le modèle génère une équation de revenu qui dépend des heures travaillées et d’un indice de prix représentant le rendement marginal des heures travaillées lorsque celles-ci sont allouées de façon optimale à travers les différents services. L’indice de prix dépend des prix des services offerts et des paramètres de la technologie de production des services qui déterminent comment les médecins réagissent aux changements des prix relatifs. J’ai appliqué le modèle aux données de panel sur la rémunération des médecins au Québec fusionnées à celles sur l’utilisation du temps de ces mêmes médecins. J’utilise le modèle pour examiner deux dimensions de l’offre des services de santé. En premierlieu, j’analyse l’utilisation des incitatifs monétaires pour amener les médecins à modifier leur production des différents services. Bien que les études antérieures ont souvent cherché à comparer le comportement des médecins à travers les différents systèmes de compensation,il y a relativement peu d’informations sur comment les médecins réagissent aux changementsdes prix des services de santé. Des débats actuels dans les milieux de politiques de santé au Canada se sont intéressés à l’importance des effets de revenu dans la détermination de la réponse des médecins face à l’augmentation des prix des services de santé. Mon travail contribue à alimenter ce débat en identifiant et en estimant les effets de substitution et de revenu résultant des changements des prix relatifs des services de santé. En second lieu, j’analyse comment l’expérience affecte la productivité des médecins. Cela a une importante implication sur le recrutement des médecins afin de satisfaire la demande croissante due à une population vieillissante, en particulier lorsque les médecins les plus expérimentés (les plus productifs) vont à la retraite. Dans le premier essai, j’ai estimé la fonction de revenu conditionnellement aux heures travaillées, en utilisant la méthode des variables instrumentales afin de contrôler pour une éventuelle endogeneité des heures travaillées. Comme instruments j’ai utilisé les variables indicatrices des âges des médecins, le taux marginal de taxation, le rendement sur le marché boursier, le carré et le cube de ce rendement. Je montre que cela donne la borne inférieure de l’élasticité-prix direct, permettant ainsi de tester si les médecins réagissent aux incitatifs monétaires. Les résultats montrent que les bornes inférieures des élasticités-prix de l’offre de services sont significativement positives, suggérant que les médecins répondent aux incitatifs. Un changement des prix relatifs conduit les médecins à allouer plus d’heures de travail au service dont le prix a augmenté. Dans le deuxième essai, j’estime le modèle en entier, de façon inconditionnelle aux heures travaillées, en analysant les variations des heures travaillées par les médecins, le volume des services offerts et le revenu des médecins. Pour ce faire, j’ai utilisé l’estimateur de la méthode des moments simulés. Les résultats montrent que les élasticités-prix direct de substitution sont élevées et significativement positives, représentant une tendance des médecins à accroitre le volume du service dont le prix a connu la plus forte augmentation. Les élasticitésprix croisées de substitution sont également élevées mais négatives. Par ailleurs, il existe un effet de revenu associé à l’augmentation des tarifs. J’ai utilisé les paramètres estimés du modèle structurel pour simuler une hausse générale de prix des services de 32%. Les résultats montrent que les médecins devraient réduire le nombre total d’heures travaillées (élasticité moyenne de -0,02) ainsi que les heures cliniques travaillées (élasticité moyenne de -0.07). Ils devraient aussi réduire le volume de services offerts (élasticité moyenne de -0.05). Troisièmement, j’ai exploité le lien naturel existant entre le revenu d’un médecin payé à l’acte et sa productivité afin d’établir le profil de productivité des médecins. Pour ce faire, j’ai modifié la spécification du modèle pour prendre en compte la relation entre la productivité d’un médecin et son expérience. J’estime l’équation de revenu en utilisant des données de panel asymétrique et en corrigeant le caractère non-aléatoire des observations manquantes à l’aide d’un modèle de sélection. Les résultats suggèrent que le profil de productivité est une fonction croissante et concave de l’expérience. Par ailleurs, ce profil est robuste à l’utilisation de l’expérience effective (la quantité de service produit) comme variable de contrôle et aussi à la suppression d’hypothèse paramétrique. De plus, si l’expérience du médecin augmente d’une année, il augmente la production de services de 1003 dollar CAN. J’ai utilisé les paramètres estimés du modèle pour calculer le ratio de remplacement : le nombre de médecins inexpérimentés qu’il faut pour remplacer un médecin expérimenté. Ce ratio de remplacement est de 1,2.
Resumo:
Les enjeux hydrologiques modernes, de prévisions ou liés aux changements climatiques, forcent l’exploration de nouvelles approches en modélisation afin de combler les lacunes actuelles et d’améliorer l’évaluation des incertitudes. L’approche abordée dans ce mémoire est celle du multimodèle (MM). L’innovation se trouve dans la construction du multimodèle présenté dans cette étude : plutôt que de caler individuellement des modèles et d’utiliser leur combinaison, un calage collectif est réalisé sur la moyenne des 12 modèles globaux conceptuels sélectionnés. Un des défis soulevés par cette approche novatrice est le grand nombre de paramètres (82) qui complexifie le calage et l’utilisation, en plus d’entraîner des problèmes potentiels d’équifinalité. La solution proposée dans ce mémoire est une analyse de sensibilité qui permettra de fixer les paramètres peu influents et d’ainsi réduire le nombre de paramètres total à caler. Une procédure d’optimisation avec calage et validation permet ensuite d’évaluer les performances du multimodèle et de sa version réduite en plus d’en améliorer la compréhension. L’analyse de sensibilité est réalisée avec la méthode de Morris, qui permet de présenter une version du MM à 51 paramètres (MM51) tout aussi performante que le MM original à 82 paramètres et présentant une diminution des problèmes potentiels d’équifinalité. Les résultats du calage et de la validation avec le « Split-Sample Test » (SST) du MM sont comparés avec les 12 modèles calés individuellement. Il ressort de cette analyse que les modèles individuels, composant le MM, présentent de moins bonnes performances que ceux calés indépendamment. Cette baisse de performances individuelles, nécessaire pour obtenir de bonnes performances globales du MM, s’accompagne d’une hausse de la diversité des sorties des modèles du MM. Cette dernière est particulièrement requise pour les applications hydrologiques nécessitant une évaluation des incertitudes. Tous ces résultats mènent à une amélioration de la compréhension du multimodèle et à son optimisation, ce qui facilite non seulement son calage, mais également son utilisation potentielle en contexte opérationnel.
Resumo:
Ce mémoire analyse le processus de romanisation et de colonisation de Xanten-Vetera, une région frontalière de l’Empire romain située en basse Rhénanie dans la province romaine de Germania inferior. À l’intérieur d’un cadre temporel inclus entre les conquêtes de Jules César et le milieu du second siècle apr. J.-C., l’étude cherche à comprendre et à restituer la présence militaire ainsi que le développement des peuplades civiles sur place, du fait des transferts de population et de l’immigration gallo-romaine. Le processus de romanisation est analysé en tenant compte des réalités ethnographiques, sociales et culturelles et selon les théories les plus actuelles de la recherche moderne sur ce sujet. Comme il s’agit d’une agglomération située sur une voie fluviale en périphérie de l’Empire, le concept de « frontière » y est évalué afin d’estimer si Xanten-Vetera constituait une zone de convergence ou de divergence par rapport à l’espace rhénan. Dans un deuxième temps, cette recherche analyse le contexte militaire et social durant lequel l’empereur Trajan prit la décision d’octroyer le statut de colonie à ce territoire qui devint la Colonia Ulpia Traiana. Cette démarche qui se veut régionale souligne la nature particulière de l’histoire de Xanten-Vetera sous le Haut Empire ; les migrations et les tragédies à l’intérieur de cet espace géographique ont façonné un endroit au destin unique en Germanie et dans l’Empire romain. Enfin, ce travail fournit un exemple pertinent de l’évolution des motivations qui ont guidé les politiques coloniales sous les Julio-Claudiens, les Flaviens et les Antonins et suggère l’essor des groupes de pression non militaires dans ce contexte.