938 resultados para Linear Attention,Conditional Language Model,Natural Language Generation,FLAX,Rare diseases


Relevância:

100.00% 100.00%

Publicador:

Resumo:

A model of the cognitive process of natural language processing has been developed using the formalism of generalized nets. Following this stage-simulating model, the treatment of information inevitably includes phases, which require joint operations in two knowledge spaces – language and semantics. In order to examine and formalize the relations between the language and the semantic levels of treatment, the language is presented as an information system, conceived on the bases of human cognitive resources, semantic primitives, semantic operators and language rules and data. This approach is applied for modeling a specific grammatical rule – the secondary predication in Russian. Grammatical rules of the language space are expressed as operators in the semantic space. Examples from the linguistics domain are treated and several conclusions for the semantics of the modeled rule are made. The results of applying the information system approach to the language turn up to be consistent with the stages of treatment modeled with the generalized net.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Thesis (Ph.D.)--University of Washington, 2016-08

Relevância:

100.00% 100.00%

Publicador:

Resumo:

The present paper presents an application that composes formal poetry in Spanish in a semiautomatic interactive fashion. JASPER is a forward reasoning rule-based system that obtains from the user an intended message, the desired metric, a choice of vocabulary, and a corpus of verses; and, by intelligent adaptation of selected examples from this corpus using the given words, carries out a prose-to-poetry translation of the given message. In the composition process, JASPER combines natural language generation and a set of construction heuristics obtained from formal literature on Spanish poetry.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Il lavoro di tesi presentato è nato da una collaborazione con il Politecnico di Macao, i referenti sono: Prof. Rita Tse, Prof. Marcus Im e Prof. Su-Kit Tang. L'obiettivo consiste nella creazione di un modello di traduzione automatica italiano-cinese e nell'osservarne il comportamento, al fine di determinare se sia o meno possibile l'impresa. Il trattato approfondisce l'argomento noto come Neural Language Processing (NLP), rientrando dunque nell'ambito delle traduzioni automatiche. Sono servizi che, attraverso l'ausilio dell'intelligenza artificiale sono in grado di elaborare il linguaggio naturale, per poi interpretarlo e tradurlo. NLP è una branca dell'informatica che unisce: computer science, intelligenza artificiale e studio di lingue. Dal punto di vista della ricerca, le più grandi sfide in questo ambito coinvolgono: il riconoscimento vocale (speech-recognition), comprensione del testo (natural-language understanding) e infine la generazione automatica di testo (natural-language generation). Lo stato dell'arte attuale è stato definito dall'articolo "Attention is all you need" \cite{vaswani2017attention}, presentato nel 2017 a partire da una collaborazione di ricercatori della Cornell University.\\ I modelli di traduzione automatica più noti ed utilizzati al momento sono i Neural Machine Translators (NMT), ovvero modelli che attraverso le reti neurali artificiali profonde, sono in grado effettuare traduzioni o predizioni. La qualità delle traduzioni è particolarmente buona, tanto da arrivare quasi a raggiungere la qualità di una traduzione umana. Il lavoro infatti si concentrerà largamente sullo studio e utilizzo di NMT, allo scopo di proporre un modello funzionale e che sia in grado di performare al meglio nelle traduzioni da italiano a cinese e viceversa.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Negli ultimi quattro anni la summarization astrattiva è stata protagonista di una evoluzione senza precedenti dettata da nuovi language model neurali, architetture transformer-based, elevati spazi dimensionali, ampi dataset e innovativi task di pre-training. In questo contesto, le strategie di decoding convertono le distribuzioni di probabilità predette da un modello in un testo artificiale, il quale viene composto in modo auto regressivo. Nonostante il loro cruciale impatto sulla qualità dei riassunti inferiti, il ruolo delle strategie di decoding è frequentemente trascurato e sottovalutato. Di fronte all'elevato numero di tecniche e iperparametri, i ricercatori necessitano di operare scelte consapevoli per ottenere risultati più affini agli obiettivi di generazione. Questa tesi propone il primo studio altamente comprensivo sull'efficacia ed efficienza delle strategie di decoding in task di short, long e multi-document abstractive summarization. Diversamente dalle pubblicazioni disponibili in letteratura, la valutazione quantitativa comprende 5 metriche automatiche, analisi temporali e carbon footprint. I risultati ottenuti dimostrano come non vi sia una strategia di decoding dominante, ma come ciascuna possieda delle caratteristiche adatte a task e dataset specifici. I contributi proposti hanno l'obiettivo di neutralizzare il gap di conoscenza attuale e stimolare lo sviluppo di nuove tecniche di decoding.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Ever since the appearance of the ARCH model [Engle(1982a)], an impressive array of variance specifications belonging to the same class of models has emerged [i.e. Bollerslev's (1986) GARCH; Nelson's (1990) EGARCH]. This recent domain has achieved very successful developments. Nevertheless, several empirical studies seem to show that the performance of such models is not always appropriate [Boulier(1992)]. In this paper we propose a new specification: the Quadratic Moving Average Conditional heteroskedasticity model. Its statistical properties, such as the kurtosis and the symmetry, as well as two estimators (Method of Moments and Maximum Likelihood) are studied. Two statistical tests are presented, the first one tests for homoskedasticity and the second one, discriminates between ARCH and QMACH specification. A Monte Carlo study is presented in order to illustrate some of the theoretical results. An empirical study is undertaken for the DM-US exchange rate.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Cette thèse présente le résultat de plusieurs années de recherche dans le domaine de la génération automatique de résumés. Trois contributions majeures, présentées sous la forme d'articles publiés ou soumis pour publication, en forment le coeur. Elles retracent un cheminement qui part des méthodes par extraction en résumé jusqu'aux méthodes par abstraction. L'expérience HexTac, sujet du premier article, a d'abord été menée pour évaluer le niveau de performance des êtres humains dans la rédaction de résumés par extraction de phrases. Les résultats montrent un écart important entre la performance humaine sous la contrainte d'extraire des phrases du texte source par rapport à la rédaction de résumés sans contrainte. Cette limite à la rédaction de résumés par extraction de phrases, observée empiriquement, démontre l'intérêt de développer d'autres approches automatiques pour le résumé. Nous avons ensuite développé un premier système selon l'approche Fully Abstractive Summarization, qui se situe dans la catégorie des approches semi-extractives, comme la compression de phrases et la fusion de phrases. Le développement et l'évaluation du système, décrits dans le second article, ont permis de constater le grand défi de générer un résumé facile à lire sans faire de l'extraction de phrases. Dans cette approche, le niveau de compréhension du contenu du texte source demeure insuffisant pour guider le processus de sélection du contenu pour le résumé, comme dans les approches par extraction de phrases. Enfin, l'approche par abstraction basée sur des connaissances nommée K-BABS est proposée dans un troisième article. Un repérage des éléments d'information pertinents est effectué, menant directement à la génération de phrases pour le résumé. Cette approche a été implémentée dans le système ABSUM, qui produit des résumés très courts mais riches en contenu. Ils ont été évalués selon les standards d'aujourd'hui et cette évaluation montre que des résumés hybrides formés à la fois de la sortie d'ABSUM et de phrases extraites ont un contenu informatif significativement plus élevé qu'un système provenant de l'état de l'art en extraction de phrases.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Site web associé au mémoire: http://daou.st/JSreal

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)

Relevância:

100.00% 100.00%

Publicador:

Resumo:

ABSTRACT: Increasing restrictions on the use of artificial pigments in the food industry, imposed by the international market, have increased the importance of raw materials containing natural pigments. Of those natural substances with potential applications turmeric rhizomes (Curcuma longa L), are one of the most important natural sources of yellow coloring. Three different pigments (curcumin, desmetoxycurcumin, and bis-desmetoxycurcumin) constitute the curcuminoids. These pigments are largely used in the food industry as substitutes for synthetic dyes like tartrazin. Extraction of curcuminoids from tumeric rhizomes with supercritical CO2 can be applied as an alternative method to obtain curcuminoids, as natural pigments are in general unstable, and hence degrade when submitted to extraction with organic solvents at high temperatures. Extraction experiments were carried out in a supercritical extraction pilot plant at pressures between 25 and 30 MPa and a temperature of 318 K. The influence of drying pretreatment on extraction yield was evaluated by analyzing the mass transfer kinetics and the content of curcuminoids in the extracts during the course of extraction. The chemical identification of curcuminoids in both the extract and the residual solid was performed by spectrophotometry. Mass transfer within the solid matrix was described by a linear first-order desorption model, while that in the gas phase was described by a convective mass transfer model. Experimental results showed that the concentration profile for curcuminoids during the supercritical extraction process was higher when the turmeric rhizomes were submitted to a drying pretreatment at 343 K.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Questa tesi di carattere antropologico in ambito dottorale riguarda i rituali comunitari nelle comunità indigene messicane. Il principale oggetto della ricerca è il rituale della pioggia o di Petición de Lluvia, caratterizzato sia dal sacrificio animale che da una specifica relazione di causa-effetto con l’ambiente circostante. La ricerca etnografica è cominciata dall’ipotesi di voler verificare la persistenza nel tempo, e dunque nell’attualità, di procedure cerimoniali non appartenenti, almeno nella loro forma più lineare, alla religione cattolico-cristiana. Il luogo nel quale è avvenuta tale ricerca è la regione La Montaña di Guerrero, situata nel Messico sud-occidentale, e più precisamente la zona in cui vivono le comunità di etnia Nahua di San Pedro Petlacala, Acuilpa, e Xalpatláhuac che si trovano nelle vicinanze della cittadina di Tlapa de Comonfort. In un contesto ambientale profondamente rurale come quello della Montaña di Guerrero, la persistenza dei rituali evidenzia come le risorse naturali e gli agenti atmosferici - pioggia, vento, nubi - continuino a rappresentare gli elementi centrali che condizionano le variabili economiche di sussistenza e della riproduzione sociale. Il rituale di Petición de Lluvia rappresenta il momento di congiunzione tra la stagione secca e quella piovosa, tra la semina ed il raccolto del mais. Definito come una pratica religiosa nella quale il gruppo si identifica e partecipa con varie donazioni (ofrenda o deposito rituale), suddivisibili in alimenti/oggetti/preghiere ed azioni rituali, la cerimonia esprime l’auspicio di piogge abbondanti, con le quali irrigare i campi e continuare le attività umane. Il destinatario dell’offerta è la stessa divinità della pioggia, Tlaloc per le antiche civiltà mesoamericane, invocato sotto le mentite spoglie del santo patrono del 25 aprile, San Marcos. Il rituale è contraddistinto per tutta la sua durata dalla presenza del principale specialista religioso, sacerdote in lingua spagnola oppure «Tlahmáquetl» in lingua náhuatl.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

BACKGROUND: Patients with apparent complete recovery from thrombotic thrombocytopenic purpura (TTP) often complain of problems with memory, concentration, and fatigue. STUDY DESIGN AND METHODS: Twenty-four patients who were enrolled in the Oklahoma TTP-HUS Registry for their initial episode of TTP, 1995-2006, and who had ADAMTS13 activity of less than 10 percent were evaluated for a broad range of cognitive functions 0.1 to 10.6 years (median, 4.0 years) after their most recent episode. At the time of their evaluation, they had normal physical and Mini-Mental State Examinations and no evidence of TTP. RESULTS: The patients, as a group, performed significantly worse on 4 of the 11 cognitive domains tested than standardized US data from neurologically normal individuals adjusted for age, sex, and education (p < 0.05). These four domains measured complex attention and concentration skills, information processing speed, rapid language generation, and rote memorization. Twenty-one (88%) patients performed below expectations on at least 1 of the 11 domains. No clear patterns were observed between cognitive test results and patients' characteristics or features of the preceding TTP, including age, occurrence of severe neurologic abnormalities, multiple episodes, and interval from an acute episode. CONCLUSION: Patients who have recovered from TTP may have persistent cognitive abnormalities. The abnormalities observed in these patients are characteristic of disorders associated with diffuse subcortical microvascular disease. Studies of larger patient groups will be required to confirm these preliminary observations and to determine patient characteristics that may contribute to persistent cognitive abnormalities.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

In the context of the Semantic Web, natural language descriptions associated with ontologies have proven to be of major importance not only to support ontology developers and adopters, but also to assist in tasks such as ontology mapping, information extraction, or natural language generation. In the state-of-the-art we find some attempts to provide guidelines for URI local names in English, and also some disagreement on the use of URIs for describing ontology elements. When trying to extrapolate these ideas to a multilingual scenario, some of these approaches fail to provide a valid solution. On the basis of some real experiences in the translation of ontologies from English into Spanish, we provide a preliminary set of guidelines for naming and labeling ontologies in a multilingual scenario.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Effective data summarization methods that use AI techniques can help humans understand large sets of data. In this paper, we describe a knowledge-based method for automatically generating summaries of geospatial and temporal data, i.e. data with geographical and temporal references. The method is useful for summarizing data streams, such as GPS traces and traffic information, that are becoming more prevalent with the increasing use of sensors in computing devices. The method presented here is an initial architecture for our ongoing research in this domain. In this paper we describe the data representations we have designed for our method, our implementations of components to perform data abstraction and natural language generation. We also discuss evaluation results that show the ability of our method to generate certain types of geospatial and temporal descriptions.