900 resultados para repeated sequences


Relevância:

20.00% 20.00%

Publicador:

Resumo:

The neuropeptide Th1RFamide with the sequence Phe-Met-Arg-Phe-amide was originally isolated in the clam Macrocallista nimbosa (price and Greenberg, 1977). Since its discovery, a large family ofFl\1RFamide-related peptides termed FaRPs have been found to be present in all major animal phyla with functions ranging from modulation of neuronal activity to alteration of muscular contractions. However, little is known about the genetics encoding these peptides, especially in invertebrates. As FaRP-encoding genes have yet to be investigated in the invertebrate Malacostracean subphylum, the isolation and characterization ofFaRP-encoding DNA and mRNA was pursued in this project. The immediate aims of this thesis were: (1) to amplify mRNA sequences of Procambarus clarkii using a degenerate oligonucleotide primer deduced from the common amino acid sequence ofisolated Procambarus FaRPS, (2) to determine if these amplification products encode FaRP gene sequences, and (3) to create a selective cDNA library of sequences recognized by the degenerate oligonucleotide primer. The polymerase chain reaction - rapid amplification of cDNA ends (PCR-RACE) is a procedure in which a single gene-specific primer is used in conjunction with a generalized 3' or 5' primer to amplify copies ofthe region between a single point in the transcript and the 3' or 5' end of cDNA of interest (Frohman et aI., 1988). PCRRACE reactions were optimized with respect to primers used, buffer composition, cycle number, nature ofgenetic substrate to be amplified, annealing, extension and denaturation temperatures and times, and use of reamplification procedures. Amplification products were cloned into plasmid vectors and recombinant products were isolated, as were the recombinant plaques formed in the selective cDNA library. Labeled amplification products were hybridized to recombinant bacteriophage to determine ligated amplification product presence. When sequenced, the five isolated PCR-RACE amplification products were determined not to possess FaRP-encoding sequences. The 200bp, 450bp, and 1500bp sequences showed homology to the Caenorhabditis elegans cosmid K09A11, which encodes for cytochrome P450; transfer-RNA; transposase; and tRNA-Tyr, while the 500bp and 750bp sequences showed homology with the complete genome of the Vaccinia virus. Under the employed amplification conditions the degenerate oligonucleotide primer was observed to bind to and to amplify sequences with either 9 or 10bp of 17bp identity. The selective cDNA library was obselVed to be of extremely low titre. When library titre was increased, white. plaques were isolated. Amplification analysis of eight isolated Agt11 sequences from these plaques indicated an absence of an insertion sequence. The degenerate 17 base oligonucleotide primer synthesized from the common amino acid sequence ofisolated Procambarus FaRPs was thus determined to be non-specific in its binding under the conditions required for its use, and to be insufficient for the isolation and identification ofFaRP-encoding sequences. A more specific primer oflonger sequence, lower degeneracy, and higher melting temperature (TJ is recommended for further investigation into the FaRP-encoding genes of Procambarlls clarkii.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

The phosphonium salt room temperature ionic liquid tetradecyltrihexylphosphonium chloride (THPC) has been employed as an efficient reusable media for the palladium catalyzed Suzuki cross-coupling reaction of aryl halides, including aryl chlorides, under mild conditions. The cross-coupling reactions were found to proceed in THPC containing small amounts ofwater and toluene (single phase) using potassium phosphate and 1% Pd2(dba)3'CHCI3. Variously substituted iodobenzenes, including electron rich derivatives, reacted efficiently in THPC with a variety of arylboronic acids and were all complete within 1 hour at 50°C. The corresponding aryl bromides also reacted under these conditions with the addition of a catalytic amount of triphenylphosphine that allowed for complete conversion and high isolated yields. The reactions involving aryl chlorides were considerably slower, although the addition of triphenylphosphine and heating at 70°C allowed high conversion of electron deficient derivatives. Addition of water and hexane to the reaction products results in a triphasic system, from which the catalyst was then recycled by removing the top (hexanes) and bottom (aqueous) layers and adding the reagents to the ionic liquid which was heated again at 50°C; resulting in complete turnover of iodobenzene. Repetition of this procedure gave the biphenyl product in 82-97% yield (repeated five times) for both the initial and recycled reaction sequences. IL ESTERIFICATIONREACTION A new class oftrialkylphosphorane has been prepared through reaction of a trialkylphosphine with 2-chlorodimethylmalonate in the presence oftriethylamine. These new reagents promote the condensation reaction of carboxylic acids with alcohols to provide esters along with trialkylphosphine oxide and dimethylmalonate. The condensation reaction of chiral secondary alcohols can be controlled to give either high levels of inversion or retention through a subtle interplay involving basicity of the reaction media, solvent, and tuning the electronic and steric nature of the carboxylic acid and stenc nature of the phosphorane employed. A coherent mechanism is postulated to explain these observations involving reaction via an initial acyloxyphosphonium ion.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

One of the most challenging tasks for a synthetic organic chemist today, is the development of chemo, regio, and stereoselective methodologies toward the total synthesis of macromolecules. r . The objective of my thesis was to develop methodologies towards this end. The first part of my project was to develop highly functionalized chirons from D-glucose, a cheap, chiral starting material, to be utilized in this capacity. The second part of the project dealt with modifying the carbon-carbon bond forming Suzuki reaction, which is utilized quite often as a means of combining molecular sub units in total synthesis applications. As previously stated the first area of the project was to develop high value chirons from D-glucose, but the mechanism of their formation was also investigated. The free radical initiated oxidative fragmentation of benzylidene acetals was investigated through the use of several test-case substrates in order to unravel the possible mechanistic pathways. This was performed by reacting the different acetals with N-bromosuccinimide and benzoyl peroxide in chlorobenzene at 70^C in all cases. Of the three mechanistic pathways discussed in the literature, it was determined, from the various reaction products obtained, that the fragmentation of the initial benzylic radical does not occur spontaneously but rather, oxidation proceeds to give the benzyl bromide, which then fragments via a polar pathway. It was also discovered that the regioselectivity of the fragmentation step could be altered through incorporation of an allylic system into the benzylidene acetal. This allows for the acquisition of a new set of densely functionalized. chiral, valuable synthetic intermediates in only a few steps and in high yields from a-Dglucose. The second part of the project was the utilization of the phosphonium salt room temperature ionic liquid tetradecyltrihexylphosphonium chloride (THPC) as an efficient reusable medium for the palladium catalyzed Suzuki cross-coupling reaction of aryl halides, including aryl chlorides, under mild conditions. The cross-coupling reactions were found to proceed in THPC containing small amounts of water and toluene using potassium phosphate and 1% Pd2(dba)3. Variously substituted iodobenzenes, including electron rich derivatives, reacted efficiently in THPC with a variety of arylboronic acids and afforded complete conversion within 1 hour at 50 ^C. The corresponding aryl bromides also reacted under these conditions with the addition of a catalytic amount of triphenylphosphine that allowed for complete conversion and high isolated yields. The reactions involving aryl chlorides were considerably slower, although the addition of triphenylphosphine and heating at 70 ^C allowed high conversion of electron deficient derivatives. Addition of water and hexane to the reaction products results in a triphasic system in which the top hexane phase contained the biaryl products, the palladium catalyst remained fully dissolved in the central THPC layer, while the inorganic salts were extracted into the lower aqueous phase. The catalyst was then recycled by removing the top and bottom layers and adding the reagents to the ionic liquid which was heated again at 50 ^C; resulting in complete turnover of iodobenzene. Repetition of this procedure gave the biphenyl product in 82-97% yield (repeated five times) for both the initial and recycled reaction sequences.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

One of the main objectives of the mid-Atlantic transect is to improve dating resolution of sequences and unconfonnity surfaces. Dinoflagellate cysts from two Ocean Drilling Program boreholes, the onshore Leg 174AX Ocean View Site and Leg 174A continental shelf Site 1071, are used to provide age estimates for sequences and unconfonnities fonned on the New Jersey continental margin during the Miocene epoch. Despite the occasional lack of dinocysts in barren and oxidized sections, dinocyst biochronology still offers greater age control than that provided by other microfossils in marginal marine environments. An early Miocene to late Miocene chronology based on ages detennined for the two study sites is presented. In addition, .palynofacies are used to unravel the systems tract character of the Miocene sequences and provide insight into the effects of taphonomy and preservation of palynomorphs in marginal marine and shelf environments under different ~ea level conditions. More precise placement of maximum flooding surfaces is possible through the identification of condensed sections and palynofacies shifts can also reveal subaerially exposed sections and surfaces not apparent in seismic or lithological analyses. The problems with the application of the pollen record in the interpretation of Miocene climate are also discussed. Palynomorphs provide evidence for a second-order lowering of sea level during the Miocene, onto which higher order sea level fluctuations are super-imposed. Correlation of sequences and unconfonnities is attempted between onshore boreholes and from the onshore Ocean View borehole to offshore Site 1071.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

The ease of production and manipulation has made plasmid DNA a prime target for its use in gene transfer technologies such as gene therapy and DNA vaccines. The major drawback of plasmid however is its stability within mammalian cells. Plasmid DNA is usually lost by cellular mechanisms or as a result of mitosis by simple dilution. This study set out to search for mammalian genomic DNA sequences that would enhance the stability of plasmid DNA in mammalian cells.Creating a plasmid based genomic DNA library, we were able to screen the human genome by transfecting the library into Human Embryonic Kidney (HEK 293) Cells. Cells that contained plasmid DNA were selected, using G418 for 14 days. The resulting population was then screened for the presence of biologically active plasmid DNA using the process of transformation as a detector.A commercially available plasmid DNA isolation kit was modified to extract plasmid DNA from mammalian cells. The standardized protocol had a detection limit of -0.6 plasmids per cell in one million cells. This allowed for the detection of 45 plasmids that were maintained for 32 days in the HEK 293 cells. Sequencing of selected inserts revealed a significantly higher thymine content in comparison to the human genome. Sequences with high A/T content have been associated with Scaffold/Matrix Attachment Region (S/MAR) sequences in mammalian cells. Therefore, association with the nuclear matrix might be required for the stability of plasmids in mammalian cells.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Children were afforded the opportunity to control the order of repetitions for three novel spatiotemporal sequences. The following was predicted: a) children and adults in the self-regulated (SELF) groups would produce faster movement (MT) and reaction times (R T) and greater recall success (RS) during retention compared to the age-matched yoked (YOKE) groups; b) children would choose to switch sequences less often than adults; c) adults would produce faster MT and RT and greater RS than the children during acquisition and retention, independent of experimental group. During acquisition, no effects were seen for RS, however for MT and RT there was a main effect for age as well as block. During retention a main effect for practice condition was seen for RS and failed to reach statistical significance for MT and RT, thus partially supporting our first and second hypotheses. The third hypothesis was not supported.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

CD4+ T lymphocytes play an important role in CD8+ T cell-mediated responses against tumors. Considering that about 20% of melanomas express major histocompatibility complex (MHC) class II, it is plausible that concomitant antigenic presentation by MHC class I and class II complexes shapes positive (helper T cells) or negative (regulatory T cells) anti-tumor responses. Interestingly, gp100, a melanoma antigen, can be presented by both MHC class I and class II when expressed endogenously, suggesting that it can reach endosomal/MHC class II compartments (MIIC). Here, we demonstrated that the gp100 putative amino-terminal signal sequence and the last 70 residues in carboxy-terminus, are essential for MIIC localization and MHC class II presentation. Confocal microscopy analyses confirmed that gp100 was localized in LAMP-1+ endosomal/MIIC. Gp100-targeting sequences were characterized by deleting different sections in the carboxy-terminus (residues 590 to 661). Transfection in 293T cells, expressing MHC class I and class II molecules, revealed that specific deletions in carboxy-terminus resulted in decreased MHC class II presentation, without effects on MHC class I presentation, suggesting a role in MIIC trafficking for these deleted sections. Then, we used these gp100-targeting sequences to mobilize the green fluorescent protein (GFP) to endosomal compartments, and to allow MHC class II and class I presentation of minimal endogenous epitopes. Thus, we concluded that these specific sequences are MIIC targeting motifs. Consequently, these sequences could be included in expression cassettes for endogenously expressed tumor or viral antigens to promote MHC class II and class I presentation and optimize in vivo T cell responses, or as an in vitro tool for characterization of new MHC class II epitopes.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Affiliation: Département de Biochimie, Université de Montréal

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Les molécules classiques du complexe majeur d’histocompatibilité de classe II (CMHII) sont des glycoprotéines de surface spécialisées dans la présentation de peptides, principalement dérivés de pathogènes extracellulaires, aux récepteurs des lymphocytes T CD4+ afin d’initier la réponse immunitaire adaptative. Elles sont encodées, avec celles du CMH de classe I, par les gènes les plus polymorphiques identifiés jusqu’à maintenant, avec plusieurs loci et une grande diversité allélique à chacun d’eux. De plus, le polymorphisme des gènes du CMHII n’est pas limité qu’aux séquences codantes. Il est également observé dans les promoteurs où on a démontré ses effets sur le niveau d’expression des gènes. La variation de la régulation d’un gène est considérée comme un facteur important et pour laquelle des modifications morphologiques, physiologiques et comportementales sont observées chez tous les organismes. Des séquences d’ADN répétées impliquées dans cette régulation ont été identifiées dans les régions non-codantes des génomes. D’un autre côté, la sélection par les pathogènes permettrait l’évolution et le maintien du polymorphisme des gènes du CMH chez les vertébrés. À ce sujet, plusieurs études ont montré l’implication de différents allèles du CMH dans la résistance ou la susceptibilité aux maladies. Cette étude avait pour objectifs de caractériser le polymorphisme du gène MHIIb chez l’omble de fontaine (Salvelinus fontinalis) et de documenter ses effets au niveau de la survie conférée par des allèles et/ou génotypes particuliers lors d’une infection, ainsi que sur la variation du niveau d’expression du gène dans différentes conditions. Dans une première partie, nous avons identifié un total de 6 allèles du gène MHIIb, désignés Safo-DAB*0101 à Safo-DAB*0601, qui montrent une grande similarité avec les séquences codantes provenant de poissons téléostéens et de l’humain. L’analyse des séquences du domaine b1 a permis de détecter l’effet d’une pression sélective positive pour maintenir le polymorphisme dans cette région de la molécule. Quatre de ces allèles ont été testés lors d’une expérience d’infection avec le pathogène Aeromonas salmonicida afin d’évaluer l’effet qu’ils pouvaient avoir sur la survie des poissons. Nous avons trouvé que l’allèle DAB*0101 était significativement associé à la résistance à la furonculose. En plus d’avoir été identifié chez les individus homozygotes pour cet allèle, l’effet a également été remarqué au niveau de la survie les poissons de génotype DAB*0101/*0201. À l’opposé, les facteurs de risque élevé obtenus pour les génotypes DAB*0201/*0301 et DAB*0301/*0401 suggèrent plutôt une association à la susceptibilité. Étant donné la faible fréquence à laquelle l’allèle DAB*0101 a été retrouvé dans la population, le modèle de la sélection dépendante de la fréquence pourrait expliquer l’avantage conféré par ce dernier et souligne l’importance de ce mécanisme pour le maintien du polymorphisme du gène MHIIb chez l’omble de fontaine. Dans une seconde partie, nous avons rapporté la présence d’un minisatellite polymorphique formé d’un motif de 32 nucléotides dans le second intron du gène MHIIb, et pour lequel un nombre exclusif de répétitions du motif a été associé à chaque allèle (69, 27, 20, 40, 19 et 25 répétitions pour les allèles DAB*0101 à DAB*0601 respectivement). L’expression relative de quatre allèles a été évaluée dans des poissons hétérozygotes aux températures de 6 ºC et 18 ºC. Les résultats indiquent que les allèles possédant un long minisatellite montrent une réduction de l’expression du gène d’un facteur 1,67 à 2,56 par rapport aux allèles qui en contiennent un court. De même, des allèles qui incluent des minisatellites de tailles similaires n’affichent pas de différence significative au niveau de l’abondance du transcrit aux deux températures. De plus, l’effet répressif associé aux longs minisatellites est amplifié à la température de 18 ºC dans des poissons de trois génotypes différents. Nous avons finalement observé une augmentation significative par un facteur 2,08 de l’expression totale du gène MHIIb à la température de 6 ºC. Ces résultats appuient l’implication des séquences d’ADN répétées dans la régulation de l’activité transcriptionnelle d’un gène et suggèrent qu’un minisatellite sensible aux différences de températures pourrait être soumis aux forces sélectives et jouer un rôle important dans l’expression de gènes et l’évolution des organismes poïkilothermes.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Plusieurs articles scientifiques et manuels de référence en médecine comportementale distinguent l'hyperactivité ou hyperkinésie de l’activité excessive en évaluant la réponse physiologique et comportementale des chiens suite à l’administration per os de 0.2 à 1.0 mg/kg de dextroamphétamine. Selon ces références, le chien atteint d’un syndrome hyperactif ou hyperkinésie, répondra de façon paradoxale à cette médication par une diminution de l’activité motrice accompagnée d’une réduction minimale de 15% de la fréquence respiratoire et de la fréquence cardiaque. L’objectif de la présente étude était de mesurer la variation de la température corporelle, de la fréquence cardiaque, de l’activité motrice et de différents comportements spécifiques chez un groupe de Beagles ayant reçu de la dextroamphétamine. La fiabilité d'un accéléromètre comme mesure objective d’activité motrice a aussi été évaluée. Dans le cadre de cette étude croisée contrôlée par placebo, douze Beagles de la colonie de recherche âgés entre 13 et 20 mois ont reçu une dose orale de 0.2 mg/kg de dextroamphétamine. Le moniteur cardiaque Polar® et un accéléromètre Actical® ont été utilisés pour enregistrer la fréquence cardiaque et l’activité motrice avant et après l’administration de la médication. La durée de chacun des comportements spécifiques a été compilée à l’aide du logiciel Noldus® et la température corporelle a été prise par thermomètre rectal. Le modèle équilibré de mesures répétées indique que les sujets ayant reçu la dextroamphétamine montrent une réduction significative (p = 0.044) de leur fréquence cardiaque comparativement aux chiens ayant reçu le placebo. Aucune variation significative n'a été observée concernant la température corporelle, l'activité motrice, et les autres comportements (léchage des babines, halètements, et bâillements) suite à l’administration de la dextroamphétamine. Une corrélation significative, linéaire et positive (p < 0,0001) entre les périodes de mouvements observées (vidéo) et les mesures d’activité enregistrées par l’accéléromètre a été observée. Les résultats de cette étude indiquent que les Beagles peuvent afficher des effets paradoxaux dans les 90 minutes suivant l’administration per os de dextroamphétamine à raison de 0.2 mg/kg.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Les dinoflagellés sont des eucaryotes unicellulaires que l’on retrouve autant en eau douce qu’en milieu marin. Ils sont particulièrement connus pour causer des fleurs d’algues toxiques nommées ‘marée-rouge’, ainsi que pour leur symbiose avec les coraux et pour leur importante contribution à la fixation du carbone dans les océans. Au point de vue moléculaire, ils sont aussi connus pour leur caractéristiques nucléaires uniques, car on retrouve généralement une quantité immense d’ADN dans leurs chromosomes et ceux-ci sont empaquetés et condensés sous une forme cristalline liquide au lieu de nucléosomes. Les gènes encodés par le noyau sont souvent présents en multiples copies et arrangés en tandem et aucun élément de régulation transcriptionnelle, y compris la boite TATA, n’a encore été observé. L’organisation unique de la chromatine des dinoflagellés suggère que différentes stratégies sont nécessaires pour contrôler l’expression des gènes de ces organismes. Dans cette étude, j’ai abordé ce problème en utilisant le dinoflagellé photosynthétique Lingulodinium polyedrum comme modèle. L. polyedrum est d’un intérêt particulier, car il a plusieurs rythmes circadiens (journalier). À ce jour, toutes les études sur l’expression des gènes lors des changements circadiens ont démontrées une régulation à un niveau traductionnel. Pour mes recherches, j’ai utilisé les approches transcriptomique, protéomique et phosphoprotéomique ainsi que des études biochimiques pour donner un aperçu de la mécanique de la régulation des gènes des dinoflagellés, ceci en mettant l’accent sur l’importance de la phosphorylation du système circadien de L. polyedrum. L’absence des protéines histones et des nucléosomes est une particularité des dinoflagellés. En utilisant la technologie RNA-Seq, j’ai trouvé des séquences complètes encodant des histones et des enzymes modifiant les histones. L polyedrum exprime donc des séquences conservées codantes pour les histones, mais le niveau d’expression protéique est plus faible que les limites de détection par immunodétection de type Western. Les données de séquençage RNA-Seq ont également été utilisées pour générer un transcriptome, qui est une liste des gènes exprimés par L. polyedrum. Une recherche par homologie de séquences a d’abord été effectuée pour classifier les transcrits en diverses catégories (Gene Ontology; GO). Cette analyse a révélé une faible abondance des facteurs de transcription et une surprenante prédominance, parmi ceux-ci, des séquences à domaine Cold Shock. Chez L. polyedrum, plusieurs gènes sont répétés en tandem. Un alignement des séquences obtenues par RNA-Seq avec les copies génomiques de gènes organisés en tandem a été réalisé pour examiner la présence de transcrits polycistroniques, une hypothèse formulée pour expliquer le manque d’élément promoteur dans la région intergénique de la séquence de ces gènes. Cette analyse a également démontré une très haute conservation des séquences codantes des gènes organisés en tandem. Le transcriptome a également été utilisé pour aider à l’identification de protéines après leur séquençage par spectrométrie de masse, et une fraction enrichie en phosphoprotéines a été déterminée comme particulièrement bien adapté aux approches d’analyse à haut débit. La comparaison des phosphoprotéomes provenant de deux périodes différentes de la journée a révélée qu’une grande partie des protéines pour lesquelles l’état de phosphorylation varie avec le temps est reliées aux catégories de liaison à l’ARN et de la traduction. Le transcriptome a aussi été utilisé pour définir le spectre des kinases présentes chez L. polyedrum, qui a ensuite été utilisé pour classifier les différents peptides phosphorylés qui sont potentiellement les cibles de ces kinases. Plusieurs peptides identifiés comme étant phosphorylés par la Casein Kinase 2 (CK2), une kinase connue pour être impliquée dans l’horloge circadienne des eucaryotes, proviennent de diverses protéines de liaison à l’ARN. Pour évaluer la possibilité que quelques-unes des multiples protéines à domaine Cold Shock identifiées dans le transcriptome puissent moduler l’expression des gènes de L. polyedrum, tel qu’observé chez plusieurs autres systèmes procaryotiques et eucaryotiques, la réponse des cellules à des températures froides a été examinée. Les températures froides ont permis d’induire rapidement un enkystement, condition dans laquelle ces cellules deviennent métaboliquement inactives afin de résister aux conditions environnementales défavorables. Les changements dans le profil des phosphoprotéines seraient le facteur majeur causant la formation de kystes. Les phosphosites prédits pour être phosphorylés par la CK2 sont la classe la plus fortement réduite dans les kystes, une découverte intéressante, car le rythme de la bioluminescence confirme que l’horloge a été arrêtée dans le kyste.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Cette thèse étudie des modèles de séquences de haute dimension basés sur des réseaux de neurones récurrents (RNN) et leur application à la musique et à la parole. Bien qu'en principe les RNN puissent représenter les dépendances à long terme et la dynamique temporelle complexe propres aux séquences d'intérêt comme la vidéo, l'audio et la langue naturelle, ceux-ci n'ont pas été utilisés à leur plein potentiel depuis leur introduction par Rumelhart et al. (1986a) en raison de la difficulté de les entraîner efficacement par descente de gradient. Récemment, l'application fructueuse de l'optimisation Hessian-free et d'autres techniques d'entraînement avancées ont entraîné la recrudescence de leur utilisation dans plusieurs systèmes de l'état de l'art. Le travail de cette thèse prend part à ce développement. L'idée centrale consiste à exploiter la flexibilité des RNN pour apprendre une description probabiliste de séquences de symboles, c'est-à-dire une information de haut niveau associée aux signaux observés, qui en retour pourra servir d'à priori pour améliorer la précision de la recherche d'information. Par exemple, en modélisant l'évolution de groupes de notes dans la musique polyphonique, d'accords dans une progression harmonique, de phonèmes dans un énoncé oral ou encore de sources individuelles dans un mélange audio, nous pouvons améliorer significativement les méthodes de transcription polyphonique, de reconnaissance d'accords, de reconnaissance de la parole et de séparation de sources audio respectivement. L'application pratique de nos modèles à ces tâches est détaillée dans les quatre derniers articles présentés dans cette thèse. Dans le premier article, nous remplaçons la couche de sortie d'un RNN par des machines de Boltzmann restreintes conditionnelles pour décrire des distributions de sortie multimodales beaucoup plus riches. Dans le deuxième article, nous évaluons et proposons des méthodes avancées pour entraîner les RNN. Dans les quatre derniers articles, nous examinons différentes façons de combiner nos modèles symboliques à des réseaux profonds et à la factorisation matricielle non-négative, notamment par des produits d'experts, des architectures entrée/sortie et des cadres génératifs généralisant les modèles de Markov cachés. Nous proposons et analysons également des méthodes d'inférence efficaces pour ces modèles, telles la recherche vorace chronologique, la recherche en faisceau à haute dimension, la recherche en faisceau élagué et la descente de gradient. Finalement, nous abordons les questions de l'étiquette biaisée, du maître imposant, du lissage temporel, de la régularisation et du pré-entraînement.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Knowledge discovery in databases is the non-trivial process of identifying valid, novel potentially useful and ultimately understandable patterns from data. The term Data mining refers to the process which does the exploratory analysis on the data and builds some model on the data. To infer patterns from data, data mining involves different approaches like association rule mining, classification techniques or clustering techniques. Among the many data mining techniques, clustering plays a major role, since it helps to group the related data for assessing properties and drawing conclusions. Most of the clustering algorithms act on a dataset with uniform format, since the similarity or dissimilarity between the data points is a significant factor in finding out the clusters. If a dataset consists of mixed attributes, i.e. a combination of numerical and categorical variables, a preferred approach is to convert different formats into a uniform format. The research study explores the various techniques to convert the mixed data sets to a numerical equivalent, so as to make it equipped for applying the statistical and similar algorithms. The results of clustering mixed category data after conversion to numeric data type have been demonstrated using a crime data set. The thesis also proposes an extension to the well known algorithm for handling mixed data types, to deal with data sets having only categorical data. The proposed conversion has been validated on a data set corresponding to breast cancer. Moreover, another issue with the clustering process is the visualization of output. Different geometric techniques like scatter plot, or projection plots are available, but none of the techniques display the result projecting the whole database but rather demonstrate attribute-pair wise analysis

Relevância:

20.00% 20.00%

Publicador:

Resumo:

The classical methods of analysing time series by Box-Jenkins approach assume that the observed series uctuates around changing levels with constant variance. That is, the time series is assumed to be of homoscedastic nature. However, the nancial time series exhibits the presence of heteroscedasticity in the sense that, it possesses non-constant conditional variance given the past observations. So, the analysis of nancial time series, requires the modelling of such variances, which may depend on some time dependent factors or its own past values. This lead to introduction of several classes of models to study the behaviour of nancial time series. See Taylor (1986), Tsay (2005), Rachev et al. (2007). The class of models, used to describe the evolution of conditional variances is referred to as stochastic volatility modelsThe stochastic models available to analyse the conditional variances, are based on either normal or log-normal distributions. One of the objectives of the present study is to explore the possibility of employing some non-Gaussian distributions to model the volatility sequences and then study the behaviour of the resulting return series. This lead us to work on the related problem of statistical inference, which is the main contribution of the thesis

Relevância:

20.00% 20.00%

Publicador:

Resumo:

In this work, we present a generic formula for the polynomial solution families of the well-known differential equation of hypergeometric type s(x)y"n(x) + t(x)y'n(x) - lnyn(x) = 0 and show that all the three classical orthogonal polynomial families as well as three finite orthogonal polynomial families, extracted from this equation, can be identified as special cases of this derived polynomial sequence. Some general properties of this sequence are also given.