2 resultados para Rapid evolution

em Repositório Institucional da Universidade de Aveiro - Portugal


Relevância:

60.00% 60.00%

Publicador:

Resumo:

The rapid evolution and proliferation of a world-wide computerized network, the Internet, resulted in an overwhelming and constantly growing amount of publicly available data and information, a fact that was also verified in biomedicine. However, the lack of structure of textual data inhibits its direct processing by computational solutions. Information extraction is the task of text mining that intends to automatically collect information from unstructured text data sources. The goal of the work described in this thesis was to build innovative solutions for biomedical information extraction from scientific literature, through the development of simple software artifacts for developers and biocurators, delivering more accurate, usable and faster results. We started by tackling named entity recognition - a crucial initial task - with the development of Gimli, a machine-learning-based solution that follows an incremental approach to optimize extracted linguistic characteristics for each concept type. Afterwards, Totum was built to harmonize concept names provided by heterogeneous systems, delivering a robust solution with improved performance results. Such approach takes advantage of heterogenous corpora to deliver cross-corpus harmonization that is not constrained to specific characteristics. Since previous solutions do not provide links to knowledge bases, Neji was built to streamline the development of complex and custom solutions for biomedical concept name recognition and normalization. This was achieved through a modular and flexible framework focused on speed and performance, integrating a large amount of processing modules optimized for the biomedical domain. To offer on-demand heterogenous biomedical concept identification, we developed BeCAS, a web application, service and widget. We also tackled relation mining by developing TrigNER, a machine-learning-based solution for biomedical event trigger recognition, which applies an automatic algorithm to obtain the best linguistic features and model parameters for each event type. Finally, in order to assist biocurators, Egas was developed to support rapid, interactive and real-time collaborative curation of biomedical documents, through manual and automatic in-line annotation of concepts and relations. Overall, the research work presented in this thesis contributed to a more accurate update of current biomedical knowledge bases, towards improved hypothesis generation and knowledge discovery.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

No actual cenário de perda acelerada de biodiversidade, o nosso conhecimento dos ecossistemas marinhos, apesar da sua extensão e complexidade, continua muito inferior ao dos ecossistemas terrestres. A classe Malacostraca (Arthropoda, Crustacea), um grupo dos mais representativos nos ecossistemas marinhos, apresenta um elevado nível de diversidade morfológica e ecológica, mas difícil sua identificação ao nível de espécie requer frequentemente a ajuda de especialistas em taxonomia. A utilização recente do “barcoding” (código de barras do ADN), revelou ser um método rápido e eficaz para a identificação de espécies em diversos grupos de metazoários, incluindo os Malacostraca. No âmbito desta tese foi construída uma base de dados de código de barras de ADN envolvendo 132 espécies de Malacostraca vários locais de amostragem no Atlântico Nordeste e Mediterrâneo. As sequências de ADN mitocondrial provenientes de 601 espécimes formaram, em 95% dos casos, grupos congruentes com as identificações baseadas em características morfológicas. No entanto, foi detectado polimorfismo em seis casos e a divergência intra-específica foi elevada em exemplares pertencentes a duas espécies morfológicas, sugerindo, neste caso, a ocorrência de especiação críptica. Este estudo confirma a utilidade do código de barras de ADN para a identificação de Malacostraca marinhos. Apesar do sucesso obtido, este método apresenta alguns problemas, como por exemplo a possível amplificação de pseudogenes. A ocorrência de pseudogenes e as possíveisabordagens para a detecção e resolução deste tipo de problemas são discutidas com base em casos de estudo: análises dos códigos de barras ADN na espécie Goneplax rhomboides (Crustacea, Decapoda). A análise dos códigos de barras ADN revelou ainda grupos prioritários de decápodes para estudos taxonómicos e sistemáticos, nomeadamente os decápodes dos géneros Plesionika e Pagurus. Neste âmbito são discutidas as relações filogenéticas entre espécies seleccionadas dos géneros Plesionika e Pagurus. Este trabalho aponta para várias questões no âmbito da biodiversidade e evolução molecular da classe Malacostraca que carecem de um maior esclarecimento, podendo ser considerado como a base para estudo futuros. Análises filogenéticas adicionais integrando dados morfológicos e moleculares de um maior número de espécies e de famílias deverão certamente conduzir a uma melhor avaliação da biodiversidade e da evolução dentro da classe.