19 resultados para Classification, Markov chain Monte Carlo, k-nearest neighbours

em Université de Montréal, Canada


Relevância:

100.00% 100.00%

Publicador:

Resumo:

Lapprentissage supervis de rseaux hirarchiques grande chelle connat prsentement un succs fulgurant. Malgr cette effervescence, lapprentissage non-supervis reprsente toujours, selon plusieurs chercheurs, un lment cl de lIntelligence Artificielle, o les agents doivent apprendre partir dun nombre potentiellement limit de donnes. Cette thse sinscrit dans cette pense et aborde divers sujets de recherche lis au problme destimation de densit par lentremise des machines de Boltzmann (BM), modles graphiques probabilistes au coeur de lapprentissage profond. Nos contributions touchent les domaines de lchantillonnage, lestimation de fonctions de partition, loptimisation ainsi que lapprentissage de reprsentations invariantes. Cette thse dbute par lexposition dun nouvel algorithme d'chantillonnage adaptatif, qui ajuste (de fa con automatique) la temprature des chanes de Markov sous simulation, afin de maintenir une vitesse de convergence leve tout au long de lapprentissage. Lorsquutilis dans le contexte de lapprentissage par maximum de vraisemblance stochastique (SML), notre algorithme engendre une robustesse accrue face la slection du taux dapprentissage, ainsi quune meilleure vitesse de convergence. Nos rsultats sont prsent es dans le domaine des BMs, mais la mthode est gnrale et applicable lapprentissage de tout modle probabiliste exploitant lchantillonnage par chanes de Markov. Tandis que le gradient du maximum de vraisemblance peut-tre approxim par chantillonnage, lvaluation de la log-vraisemblance ncessite un estim de la fonction de partition. Contrairement aux approches traditionnelles qui considrent un modle donn comme une bote noire, nous proposons plutt dexploiter la dynamique de lapprentissage en estimant les changements successifs de log-partition encourus chaque mise jour des paramtres. Le problme destimation est reformul comme un problme dinfrence similaire au filtre de Kalman, mais sur un graphe bi-dimensionnel, o les dimensions correspondent aux axes du temps et au paramtre de temprature. Sur le thme de loptimisation, nous prsentons galement un algorithme permettant dappliquer, de manire efficace, le gradient naturel des machines de Boltzmann comportant des milliers dunits. Jusqu prsent, son adoption tait limite par son haut cot computationel ainsi que sa demande en mmoire. Notre algorithme, Metric-Free Natural Gradient (MFNG), permet dviter le calcul explicite de la matrice dinformation de Fisher (et son inverse) en exploitant un solveur linaire combin un produit matrice-vecteur efficace. Lalgorithme est prometteur: en terme du nombre dvaluations de fonctions, MFNG converge plus rapidement que SML. Son implmentation demeure malheureusement inefficace en temps de calcul. Ces travaux explorent galement les mcanismes sous-jacents lapprentissage de reprsentations invariantes. cette fin, nous utilisons la famille de machines de Boltzmann restreintes spike & slab (ssRBM), que nous modifions afin de pouvoir modliser des distributions binaires et parcimonieuses. Les variables latentes binaires de la ssRBM peuvent tre rendues invariantes un sous-espace vectoriel, en associant chacune delles, un vecteur de variables latentes continues (dnommes slabs). Ceci se traduit par une invariance accrue au niveau de la reprsentation et un meilleur taux de classification lorsque peu de donnes tiquetes sont disponibles. Nous terminons cette thse sur un sujet ambitieux: lapprentissage de reprsentations pouvant sparer les facteurs de variations prsents dans le signal dentre. Nous proposons une solution base de ssRBM bilinaire (avec deux groupes de facteurs latents) et formulons le problme comme lun de pooling dans des sous-espaces vectoriels complmentaires.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Affiliation: Claudia Kleinman, Nicolas Rodrigue & Herv Philippe : Dpartement de biochimie, Facult de mdecine, Universit de Montral

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Les squences protiques naturelles sont le rsultat net de linteraction entre les mcanismes de mutation, de slection naturelle et de drive stochastique au cours des temps volutifs. Les modles probabilistes dvolution molculaire qui tiennent compte de ces diffrents facteurs ont t substantiellement amliors au cours des dernires annes. En particulier, ont t proposs des modles incorporant explicitement la structure des protines et les interdpendances entre sites, ainsi que les outils statistiques pour valuer la performance de ces modles. Toutefois, en dpit des avances significatives dans cette direction, seules des reprsentations trs simplifies de la structure protique ont t utilises jusqu prsent. Dans ce contexte, le sujet gnral de cette thse est la modlisation de la structure tridimensionnelle des protines, en tenant compte des limitations pratiques imposes par lutilisation de mthodes phylogntiques trs gourmandes en temps de calcul. Dans un premier temps, une mthode statistique gnrale est prsente, visant optimiser les paramtres dun potentiel statistique (qui est une pseudo-nergie mesurant la compatibilit squence-structure). La forme fonctionnelle du potentiel est par la suite raffine, en augmentant le niveau de dtails dans la description structurale sans alourdir les cots computationnels. Plusieurs lments structuraux sont explors : interactions entre pairs de rsidus, accessibilit au solvant, conformation de la chane principale et flexibilit. Les potentiels sont ensuite inclus dans un modle dvolution et leur performance est value en termes dajustement statistique des donnes relles, et contraste avec des modles dvolution standards. Finalement, le nouveau modle structurellement contraint ainsi obtenu est utilis pour mieux comprendre les relations entre niveau dexpression des gnes et slection et conservation de leur squence protique.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

La mthode que nous prsentons pour modliser des donnes dites de "comptage" ou donnes de Poisson est base sur la procdure nomme Modlisation multi-niveau et interactive de la rgression de Poisson (PRIMM) dveloppe par Christiansen et Morris (1997). Dans la mthode PRIMM, la rgression de Poisson ne comprend que des effets fixes tandis que notre modle intgre en plus des effets alatoires. De mme que Christiansen et Morris (1997), le modle tudi consiste faire de l'infrence base sur des approximations analytiques des distributions a posteriori des paramtres, vitant ainsi d'utiliser des mthodes computationnelles comme les mthodes de Monte Carlo par chanes de Markov (MCMC). Les approximations sont bases sur la mthode de Laplace et la thorie asymptotique lie l'approximation normale pour les lois a posteriori. L'estimation des paramtres de la rgression de Poisson est faite par la maximisation de leur densit a posteriori via l'algorithme de Newton-Raphson. Cette tude dtermine galement les deux premiers moments a posteriori des paramtres de la loi de Poisson dont la distribution a posteriori de chacun d'eux est approximativement une loi gamma. Des applications sur deux exemples de donnes ont permis de vrifier que ce modle peut tre considr dans une certaine mesure comme une gnralisation de la mthode PRIMM. En effet, le modle s'applique aussi bien aux donnes de Poisson non stratifies qu'aux donnes stratifies; et dans ce dernier cas, il comporte non seulement des effets fixes mais aussi des effets alatoires lis aux strates. Enfin, le modle est appliqu aux donnes relatives plusieurs types d'effets indsirables observs chez les participants d'un essai clinique impliquant un vaccin quadrivalent contre la rougeole, les oreillons, la rub\'eole et la varicelle. La rgression de Poisson comprend l'effet fixe correspondant la variable traitement/contrle, ainsi que des effets alatoires lis aux systmes biologiques du corps humain auxquels sont attribus les effets indsirables considrs.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Dans ce mmoire, nous cherchons modliser des tables deux entres monotones en lignes et/ou en colonnes, pour une ventuelle application sur les tables de mortalit. Nous adoptons une approche baysienne non paramtrique et reprsentons la forme fonctionnelle des donnes par splines bidimensionnelles. Lobjectif consiste condenser une table de mortalit, cest--dire de rduire lespace dentreposage de la table en minimisant la perte dinformation. De mme, nous dsirons tudier le temps ncessaire pour reconstituer la table. Lapproximation doit conserver les mmes proprits que la table de rfrence, en particulier la monotonie des donnes. Nous travaillons avec une base de fonctions splines monotones afin dimposer plus facilement la monotonie au modle. En effet, la structure flexible des splines et leurs drives faciles manipuler favorisent limposition de contraintes sur le modle dsir. Aprs un rappel sur la modlisation unidimensionnelle de fonctions monotones, nous gnralisons lapproche au cas bidimensionnel. Nous dcrivons lintgration des contraintes de monotonie dans le modle a priori sous lapproche hirarchique baysienne. Ensuite, nous indiquons comment obtenir un estimateur a posteriori laide des mthodes de Monte Carlo par chanes de Markov. Finalement, nous tudions le comportement de notre estimateur en modlisant une table de la loi normale ainsi quune table t de distribution de Student. Lestimation de nos donnes dintrt, soit la table de mortalit, sensuit afin dvaluer lamlioration de leur accessibilit.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Les mthodes de Monte Carlo par chane de Markov (MCMC) sont des outils trs populaires pour lchantillonnage de lois de probabilit complexes et/ou en grandes dimensions. tant donn leur facilit dapplication, ces mthodes sont largement rpandues dans plusieurs communauts scientifiques et bien certainement en statistique, particulirement en analyse baysienne. Depuis lapparition de la premire mthode MCMC en 1953, le nombre de ces algorithmes a considrablement augment et ce sujet continue dtre une aire de recherche active. Un nouvel algorithme MCMC avec ajustement directionnel a t rcemment dvelopp par Bdard et al. (IJSS, 9 :2008) et certaines de ses proprits restent partiellement mconnues. Lobjectif de ce mmoire est de tenter dtablir limpact dun paramtre cl de cette mthode sur la performance globale de lapproche. Un second objectif est de comparer cet algorithme dautres mthodes MCMC plus versatiles afin de juger de sa performance de faon relative.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Ma thse est compose de trois chapitres relis l'estimation des modles espace-tat et volatilit stochastique. Dans le premire article, nous dveloppons une procdure de lissage de l'tat, avec efficacit computationnelle, dans un modle espace-tat linaire et gaussien. Nous montrons comment exploiter la structure particulire des modles espace-tat pour tirer les tats latents efficacement. Nous analysons l'efficacit computationnelle des mthodes bases sur le filtre de Kalman, l'algorithme facteur de Cholesky et notre nouvelle mthode utilisant le compte d'oprations et d'expriences de calcul. Nous montrons que pour de nombreux cas importants, notre mthode est plus efficace. Les gains sont particulirement grands pour les cas o la dimension des variables observes est grande ou dans les cas o il faut faire des tirages rpts des tats pour les mmes valeurs de paramtres. Comme application, on considre un modle multivari de Poisson avec le temps des intensits variables, lequel est utilis pour analyser le compte de donnes des transactions sur les marchs financires. Dans le deuxime chapitre, nous proposons une nouvelle technique pour analyser des modles multivaris volatilit stochastique. La mthode propose est base sur le tirage efficace de la volatilit de son densit conditionnelle sachant les paramtres et les donnes. Notre mthodologie s'applique aux modles avec plusieurs types de dpendance dans la coupe transversale. Nous pouvons modeler des matrices de corrlation conditionnelles variant dans le temps en incorporant des facteurs dans l'quation de rendements, o les facteurs sont des processus de volatilit stochastique indpendants. Nous pouvons incorporer des copules pour permettre la dpendance conditionnelle des rendements sachant la volatilit, permettant avoir diffrent lois marginaux de Student avec des degrs de libert spcifiques pour capturer l'htrognit des rendements. On tire la volatilit comme un bloc dans la dimension du temps et un la fois dans la dimension de la coupe transversale. Nous appliquons la mthode introduite par McCausland (2012) pour obtenir une bonne approximation de la distribution conditionnelle posteriori de la volatilit d'un rendement sachant les volatilits d'autres rendements, les paramtres et les corrlations dynamiques. Le modle est valu en utilisant des donnes relles pour dix taux de change. Nous rapportons des rsultats pour des modles univaris de volatilit stochastique et deux modles multivaris. Dans le troisime chapitre, nous valuons l'information contribue par des variations de volatilite ralise l'valuation et prvision de la volatilit quand des prix sont mesurs avec et sans erreur. Nous utilisons de modles de volatilit stochastique. Nous considrons le point de vue d'un investisseur pour qui la volatilit est une variable latent inconnu et la volatilit ralise est une quantit d'chantillon qui contient des informations sur lui. Nous employons des mthodes baysiennes de Monte Carlo par chane de Markov pour estimer les modles, qui permettent la formulation, non seulement des densits a posteriori de la volatilit, mais aussi les densits prdictives de la volatilit future. Nous comparons les prvisions de volatilit et les taux de succs des prvisions qui emploient et n'emploient pas l'information contenue dans la volatilit ralise. Cette approche se distingue de celles existantes dans la littrature empirique en ce sens que ces dernires se limitent le plus souvent documenter la capacit de la volatilit ralise se prvoir elle-mme. Nous prsentons des applications empiriques en utilisant les rendements journaliers des indices et de taux de change. Les diffrents modles concurrents sont appliqus la seconde moiti de 2008, une priode marquante dans la rcente crise financire.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Les modles pharmacocintiques base physiologique (PBPK) permettent de simuler la dose interne de substances chimiques sur la base de paramtres spcifiques lespce et la substance. Les modles de relation quantitative structure-proprit (QSPR) existants permettent destimer les paramtres spcifiques au produit (coefficients de partage (PC) et constantes de mtabolisme) mais leur domaine dapplication est limit par leur manque de considration de la variabilit de leurs paramtres dentre ainsi que par leur domaine dapplication restreint (c. d., substances contenant CH3, CH2, CH, C, C=C, H, Cl, F, Br, cycle benznique et H sur le cycle benznique). Lobjectif de cette tude est de dvelopper de nouvelles connaissances et des outils afin dlargir le domaine dapplication des modles QSPR-PBPK pour prdire la toxicocintique de substances organiques inhales chez lhumain. Dabord, un algorithme mcaniste unifi a t dvelopp partir de modles existants pour prdire les PC de 142 mdicaments et polluants environnementaux aux niveaux macro (tissu et sang) et micro (cellule et fluides biologiques) partir de la composition du tissu et du sang et de proprits physicochimiques. Lalgorithme rsultant a t appliqu pour prdire les PC tissu:sang, tissu:plasma et tissu:air du muscle (n = 174), du foie (n = 139) et du tissu adipeux (n = 141) du rat pour des mdicaments acides, basiques et neutres ainsi que pour des ctones, esters dactate, thers, alcools, hydrocarbures aliphatiques et aromatiques. Un modle de relation quantitative proprit-proprit (QPPR) a t dvelopp pour la clairance intrinsque (CLint) in vivo (calcule comme le ratio du Vmax (mol/h/kg poids de rat) sur le Km (M)), de substrats du CYP2E1 (n = 26) en fonction du PC n octanol:eau, du PC sang:eau et du potentiel dionisation). Les prdictions du QPPR, reprsentes par les limites infrieures et suprieures de lintervalle de confiance 95% la moyenne, furent ensuite intgres dans un modle PBPK humain. Subsquemment, lalgorithme de PC et le QPPR pour la CLint furent intgrs avec des modles QSPR pour les PC hmoglobine:eau et huile:air pour simuler la pharmacocintique et la dosimtrie cellulaire dinhalation de composs organiques volatiles (COV) (benzne, 1,2-dichlorothane, dichloromthane, m-xylne, tolune, styrne, 1,1,1 trichlorothane et 1,2,4 trimethylbenzne) avec un modle PBPK chez le rat. Finalement, la variabilit de paramtres de composition des tissus et du sang de lalgorithme pour les PC tissu:air chez le rat et sang:air chez lhumain a t caractrise par des simulations Monte Carlo par chane de Markov (MCMC). Les distributions rsultantes ont t utilises pour conduire des simulations Monte Carlo pour prdire des PC tissu:sang et sang:air. Les distributions de PC, avec celles des paramtres physiologiques et du contenu en cytochrome P450 CYP2E1, ont t incorpores dans un modle PBPK pour caractriser la variabilit de la toxicocintique sanguine de quatre COV (benzne, chloroforme, styrne et trichlorothylne) par simulation Monte Carlo. Globalement, les approches quantitatives mises en uvre pour les PC et la CLint dans cette tude ont permis lutilisation de descripteurs molculaires gnriques plutt que de fragments molculaires spcifiques pour prdire la pharmacocintique de substances organiques chez lhumain. La prsente tude a, pour la premire fois, caractris la variabilit des paramtres biologiques des algorithmes de PC pour tendre laptitude des modles PBPK prdire les distributions, pour la population, de doses internes de substances organiques avant de faire des tests chez lanimal ou lhumain.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Les mthodes de Monte Carlo par chanes de Markov (MCCM) sont des mthodes servant chantillonner partir de distributions de probabilit. Ces techniques se basent sur le parcours de chanes de Markov ayant pour lois stationnaires les distributions chantillonner. tant donn leur facilit dapplication, elles constituent une des approches les plus utilises dans la communaut statistique, et tout particulirement en analyse baysienne. Ce sont des outils trs populaires pour lchantillonnage de lois de probabilit complexes et/ou en grandes dimensions. Depuis lapparition de la premire mthode MCCM en 1953 (la mthode de Metropolis, voir [10]), lintrt pour ces mthodes, ainsi que lventail dalgorithmes disponibles ne cessent de saccrotre dune anne lautre. Bien que lalgorithme Metropolis-Hastings (voir [8]) puisse tre considr comme lun des algorithmes de Monte Carlo par chanes de Markov les plus gnraux, il est aussi lun des plus simples comprendre et expliquer, ce qui en fait un algorithme idal pour dbuter. Il a t sujet de dveloppement par plusieurs chercheurs. Lalgorithme Metropolis essais multiples (MTM), introduit dans la littrature statistique par [9], est considr comme un dveloppement intressant dans ce domaine, mais malheureusement son implmentation est trs coteuse (en termes de temps). Rcemment, un nouvel algorithme a t dvelopp par [1]. Il sagit de lalgorithme Metropolis essais multiples revisit (MTM revisit), qui dfinit la mthode MTM standard mentionne prcdemment dans le cadre de lalgorithme Metropolis-Hastings sur un espace tendu. Lobjectif de ce travail est, en premier lieu, de prsenter les mthodes MCCM, et par la suite dtudier et danalyser les algorithmes Metropolis-Hastings ainsi que le MTM standard afin de permettre aux lecteurs une meilleure comprhension de limplmentation de ces mthodes. Un deuxime objectif est dtudier les perspectives ainsi que les inconvnients de lalgorithme MTM revisit afin de voir sil rpond aux attentes de la communaut statistique. Enfin, nous tentons de combattre le problme de sdentarit de lalgorithme MTM revisit, ce qui donne lieu un tout nouvel algorithme. Ce nouvel algorithme performe bien lorsque le nombre de candidats gnrs chaque itrations est petit, mais sa performance se dgrade mesure que ce nombre de candidats crot.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Cette thse, compose de quatre articles scientifiques, porte sur les mthodes numriques atomistiques et leur application des systmes semi-conducteurs nanostructurs. Nous introduisons les mthodes acclres conues pour traiter les vnements activs, faisant un survol des dveloppements du domaine. Suit notre premier article, qui traite en dtail de la technique d'activation-relaxation cintique (ART-cintique), un algorithme Monte Carlo cintique hors-rseau autodidacte bas sur la technique de l'activation-relaxation nouveau (ARTn), dont le dveloppement ouvre la voie au traitement exact des interactions lastiques tout en permettant la simulation de matriaux sur des plages de temps pouvant atteindre la seconde. Ce dveloppement algorithmique, combin des donnes exprimentales rcentes, ouvre la voie au second article. On y explique le relchement de chaleur par le silicium cristallin suite son implantation ionique avec des ions de Si 3 keV. Grce nos simulations par ART-cintique et l'analyse de donnes obtenues par nanocalorimtrie, nous montrons que la relaxation est dcrite par un nouveau modle en deux temps: "rinitialiser et relaxer" ("Replenish-and-Relax"). Ce modle, assez gnral, peut potentiellement expliquer la relaxation dans d'autres matriaux dsordonns. Par la suite, nous poussons l'analyse plus loin. Le troisime article offre une analyse pousse des mcanismes atomistiques responsables de la relaxation lors du recuit. Nous montrons que les interactions lastiques entre des dfauts ponctuels et des petits complexes de dfauts contrlent la relaxation, en net contraste avec la littrature qui postule que des "poches amorphes" jouent ce rle. Nous tudions aussi certains sous-aspects de la croissance de botes quantiques de Ge sur Si (001). En effet, aprs une courte mise en contexte et une introduction mthodologique supplmentaire, le quatrime article dcrit la structure de la couche de mouillage lors du dpt de Ge sur Si (001) l'aide d'une implmentation QM/MM du code BigDFT-ART. Nous caractrisons la structure de la reconstruction 2xN de la surface et abaissons le seuil de la temprature ncessaire pour la diffusion du Ge en sous-couche prdit thoriquement par plus de 100 K.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Thse numrise par la Direction des bibliothques de l'Universit de Montral.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Rapport de recherche

Relevância:

100.00% 100.00%

Publicador:

Resumo:

The technique of Monte Carlo (MC) tests [Dwass (1957), Barnard (1963)] provides an attractive method of building exact tests from statistics whose finite sample distribution is intractable but can be simulated (provided it does not involve nuisance parameters). We extend this method in two ways: first, by allowing for MC tests based on exchangeable possibly discrete test statistics; second, by generalizing the method to statistics whose null distributions involve nuisance parameters (maximized MC tests, MMC). Simplified asymptotically justified versions of the MMC method are also proposed and it is shown that they provide a simple way of improving standard asymptotics and dealing with nonstandard asymptotics (e.g., unit root asymptotics). Parametric bootstrap tests may be interpreted as a simplified version of the MMC method (without the general validity properties of the latter).

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Mmoire numris par la Division de la gestion de documents et des archives de l'Universit de Montral

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Cette thse prsente des mthodes de traitement de donnes de comptage en particulier et des donnes discrtes en gnral. Il s'inscrit dans le cadre d'un projet stratgique du CRNSG, nomm CC-Bio, dont l'objectif est d'valuer l'impact des changements climatiques sur la rpartition des espces animales et vgtales. Aprs une brve introduction aux notions de biogographie et aux modles linaires mixtes gnraliss aux chapitres 1 et 2 respectivement, ma thse s'articulera autour de trois ides majeures. Premirement, nous introduisons au chapitre 3 une nouvelle forme de distribution dont les composantes ont pour distributions marginales des lois de Poisson ou des lois de Skellam. Cette nouvelle spcification permet d'incorporer de l'information pertinente sur la nature des corrlations entre toutes les composantes. De plus, nous prsentons certaines proprits de ladite distribution. Contrairement la distribution multidimensionnelle de Poisson qu'elle gnralise, celle-ci permet de traiter les variables avec des corrlations positives et/ou ngatives. Une simulation permet d'illustrer les mthodes d'estimation dans le cas bidimensionnel. Les rsultats obtenus par les mthodes baysiennes par les chanes de Markov par Monte Carlo (CMMC) indiquent un biais relatif assez faible de moins de 5% pour les coefficients de rgression des moyennes contrairement ceux du terme de covariance qui semblent un peu plus volatils. Deuximement, le chapitre 4 prsente une extension de la rgression multidimensionnelle de Poisson avec des effets alatoires ayant une densit gamma. En effet, conscients du fait que les donnes d'abondance des espces prsentent une forte dispersion, ce qui rendrait fallacieux les estimateurs et carts types obtenus, nous privilgions une approche base sur l'intgration par Monte Carlo grce l'chantillonnage prfrentiel. L'approche demeure la mme qu'au chapitre prcdent, c'est--dire que l'ide est de simuler des variables latentes indpendantes et de se retrouver dans le cadre d'un modle linaire mixte gnralis (GLMM) conventionnel avec des effets alatoires de densit gamma. Mme si l'hypothse d'une connaissance a priori des paramtres de dispersion semble trop forte, une analyse de sensibilit base sur la qualit de l'ajustement permet de dmontrer la robustesse de notre mthode. Troisimement, dans le dernier chapitre, nous nous intressons la dfinition et la construction d'une mesure de concordance donc de corrlation pour les donnes augmentes en zro par la modlisation de copules gaussiennes. Contrairement au tau de Kendall dont les valeurs se situent dans un intervalle dont les bornes varient selon la frquence d'observations d'galit entre les paires, cette mesure a pour avantage de prendre ses valeurs sur (-1;1). Initialement introduite pour modliser les corrlations entre des variables continues, son extension au cas discret implique certaines restrictions. En effet, la nouvelle mesure pourrait tre interprte comme la corrlation entre les variables alatoires continues dont la discrtisation constitue nos observations discrtes non ngatives. Deux mthodes d'estimation des modles augments en zro seront prsentes dans les contextes frquentiste et baysien bases respectivement sur le maximum de vraisemblance et l'intgration de Gauss-Hermite. Enfin, une tude de simulation permet de montrer la robustesse et les limites de notre approche.