15 resultados para Parallel corpora


Relevância:

70.00% 70.00%

Publicador:

Resumo:

Trabalho apresentado no âmbito do Mestrado em Engenharia Informática, como requisito parcial para obtenção do grau de Mestre em Engenharia Informática

Relevância:

20.00% 20.00%

Publicador:

Resumo:

The automatic acquisition of lexical associations from corpora is a crucial issue for Natural Language Processing. A lexical association is a recurrent combination of words that co-occur together more often than expected by chance in a given domain. In fact, lexical associations define linguistic phenomena such as idiomes, collocations or compound words. Due to the fact that the sense of a lexical association is not compositionnal, their identification is fundamental for the realization of analysis and synthesis that take into account all the subtilities of the language. In this report, we introduce a new statistically-based architecture that extracts from naturally occurring texts contiguous and non contiguous. For that purpose, three new concepts have been defined : the positional N-gram models, the Mutual Expectation and the GenLocalMaxs algorithm. Thus, the initial text is fisrtly transformed in a set of positionnal N-grams i.e ordered vectors of simple lexical units. Then, an association measure, the Mutual Expectation, evaluates the degree of cohesion of each positional N-grams based on the identification of local maximum values of Mutual Expectation. Great efforts have also been carried out to evaluate our metodology. For that purpose, we have proposed the normalisation of five well-known association measures and shown that both the Mutual Expectation and the GenLocalMaxs algorithm evidence significant improvements comparing to existent metodologies.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Dissertação apresentada para obtenção do Grau de Doutor em Informática Pela Universidade Nova de Lisboa, Faculdade de Ciências e Tecnologia

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Dissertação apresentada para a obtenção do Grau de Doutor em Informática pela Universidade Nova de Lisboa, Faculdade de Ciências e Tecnologia.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

IEEE International Symposium on Circuits and Systems, pp. 724 – 727, Seattle, EUA

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Dissertação para obtenção do Grau de Mestre em Engenharia Informática

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Dissertação para obtenção do Grau de Mestre em Engenharia Informática

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Dissertação para obtenção do Grau de Mestre em Engenharia Biomédica

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Trabalho de Projecto apresentado para cumprimento dos requisitos necessários à obtenção do grau de Mestre em Didáctica Do Inglês

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Tese apresentada para cumprimento dos requisitos necessários à obtenção do grau de Doutor em Linguística – Lexicologia, Lexicografia e Terminologia e e Tese apresentada para cumprimento dos requisitos necessários à obtenção do grau de Doutor em Filologia e Língua Portugesa na Faculdade de Filosofia Letras e Ciências Humanas da Universidade de São Paulo

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Dissertação para obtenção do Grau de Mestre em Engenharia Informática

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Breast cancer is the most common cancer among women, being a major public health problem. Worldwide, X-ray mammography is the current gold-standard for medical imaging of breast cancer. However, it has associated some well-known limitations. The false-negative rates, up to 66% in symptomatic women, and the false-positive rates, up to 60%, are a continued source of concern and debate. These drawbacks prompt the development of other imaging techniques for breast cancer detection, in which Digital Breast Tomosynthesis (DBT) is included. DBT is a 3D radiographic technique that reduces the obscuring effect of tissue overlap and appears to address both issues of false-negative and false-positive rates. The 3D images in DBT are only achieved through image reconstruction methods. These methods play an important role in a clinical setting since there is a need to implement a reconstruction process that is both accurate and fast. This dissertation deals with the optimization of iterative algorithms, with parallel computing through an implementation on Graphics Processing Units (GPUs) to make the 3D reconstruction faster using Compute Unified Device Architecture (CUDA). Iterative algorithms have shown to produce the highest quality DBT images, but since they are computationally intensive, their clinical use is currently rejected. These algorithms have the potential to reduce patient dose in DBT scans. A method of integrating CUDA in Interactive Data Language (IDL) is proposed in order to accelerate the DBT image reconstructions. This method has never been attempted before for DBT. In this work the system matrix calculation, the most computationally expensive part of iterative algorithms, is accelerated. A speedup of 1.6 is achieved proving the fact that GPUs can accelerate the IDL implementation.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

The business sphere is a multilingual world where foreign language communication skills are crucial in international relations. It makes employers look for business professionals who have a high level of linguistic competences. Language proficiency increases the chances of negotiation among partners. There are mainly two obstacles that make barriers in formal communication in a foreign language: lack of knowledge of specific linguistic structures or terminology and frequent transitions from one language to another. This paper contributes to the quest for quick access to a wide range of English, Spanish and Russian online databases that provide authentic language samples. Their application may improve communication skills and facilitate preparation for business discourse.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Combinatorial Optimization Problems occur in a wide variety of contexts and generally are NP-hard problems. At a corporate level solving this problems is of great importance since they contribute to the optimization of operational costs. In this thesis we propose to solve the Public Transport Bus Assignment problem considering an heterogeneous fleet and line exchanges, a variant of the Multi-Depot Vehicle Scheduling Problem in which additional constraints are enforced to model a real life scenario. The number of constraints involved and the large number of variables makes impracticable solving to optimality using complete search techniques. Therefore, we explore metaheuristics, that sacrifice optimality to produce solutions in feasible time. More concretely, we focus on the development of algorithms based on a sophisticated metaheuristic, Ant-Colony Optimization (ACO), which is based on a stochastic learning mechanism. For complex problems with a considerable number of constraints, sophisticated metaheuristics may fail to produce quality solutions in a reasonable amount of time. Thus, we developed parallel shared-memory (SM) synchronous ACO algorithms, however, synchronism originates the straggler problem. Therefore, we proposed three SM asynchronous algorithms that break the original algorithm semantics and differ on the degree of concurrency allowed while manipulating the learned information. Our results show that our sequential ACO algorithms produced better solutions than a Restarts metaheuristic, the ACO algorithms were able to learn and better solutions were achieved by increasing the amount of cooperation (number of search agents). Regarding parallel algorithms, our asynchronous ACO algorithms outperformed synchronous ones in terms of speedup and solution quality, achieving speedups of 17.6x. The cooperation scheme imposed by asynchronism also achieved a better learning rate than the original one.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Considerando a língua como um produto da sociedade, mas também como um meio fundamental para o estabelecimento de relações entre os homens, procuramos perceber o seu lugar na sociedade globalizada, com o objectivo de desenvolver uma metodologia de análise terminológica que contribua para uma maior qualidade da comunicação especializada na sociedade em rede. Este trabalho está organizado em duas partes, sendo a primeira dedicada à reflexão sobre o papel da língua na sociedade em rede, focando questões essenciais em torno da tensão existente entre o multilinguismo e a hegemonia do inglês enquanto lingua franca, sobretudo no espaço europeu. Interessa-nos, por um lado, reflectir sobre a definição de políticas linguísticas, concretamente na Europa multilingue dos 28, e, por outro, salientar o papel preponderante que a língua tem na transmissão do conhecimento. A segunda parte deste trabalho concretiza a investigação efectuada na primeira com base na análise do relato financeiro, um domínio do saber que não só é inerentemente multilingue ¾ porque a sua aplicação é transnacional ¾ mas também reflecte a tensão identificada na primeira parte, na medida em que o inglês assume, no mundo dos negócios em geral e nos mercados financeiros em particular, o papel hegemónico de lingua franca. A abordagem terminológica que defendemos é semasiológica para fins onomasiológicos, pelo que partimos da análise do texto de especialidade, organizado em corpora de especialidade. Discutimos subsequentemente os resultados da nossa análise com os especialistas que os irão validar e cuja colaboração em diversos vi momentos do processo de análise terminológica e conceptual é fundamental para garantir a qualidade dos recursos terminológicos produzidos. Nesta óptica, exploramos um corpus de textos legislativos no âmbito do Sistema de Normalização Contabilística (SNC), de modo a delinearmos uma metodologia de trabalho que, no futuro, conduzirá à construção de uma base de dados terminológica do relato financeiro. Concomitantemente, efectuamos também um estudo sobre a Estrutura Conceptual do SNC, para o qual elaboramos uma comparação ao nível da tradução especializada no relato financeiro, com base num corpus paralelo composto pela legislação contabilística internacional endossada pela União Europeia. Utilizamos o corpus paralelo constituído por textos redigidos originalmente em inglês e traduzidos para português, em articulação com o corpus de especialidade criado com a legislação relativa ao normativo contabilístico português, para testar uma metodologia de extracção de equivalentes. Defendemos, por fim, que a harmonização no relato financeiro para além de se reger por políticas contabilísticas comuns, deve ter subjacentes questões terminológicas. É necessário, portanto, harmonizar a terminologia do relato financeiro, possibilitando aos especialistas uma comunicação em português isenta da interferência do inglês herdado das normas internacionais, através dos dois processos que identificamos: a tradução e a adaptação das Normas Internacionais de Contabilidade.