137 resultados para Bioinformática


Relevância:

10.00% 10.00%

Publicador:

Resumo:

Os principais desafios relacionados ao problema de classificação de enzimas em banco de dados de estruturas de proteínas são: 1) o ruído presente nos dados; 2) o grande número de variáveis; 3) o número não-balanceado de membros por classe. Para abordar esses desafios, apresenta-se uma metodologia para seleção de parâmetros, que combina recursos de matemática (ex: Transformada Discreta do Cosseno) e da estatística (ex:.g., correlação de variáveis e amostragem com reposição). A metodologia foi validada considerando-se os três principais métodos de classificação da literatura, a saber; árvore de decisão, classificação Bayesiana e redes neurais. Os experimentos demonstram que essa metodologia é simples, eficiente e alcança resultados semelhantes àqueles obtidos pelas principais técnicas para seleção de parâmetros na literatura.Termos para indexação classificação de enzimas,predição de função de proteínas, estruturas de proteínas, banco de dados de proteínas, seleção de parâmetros, métodos para classsificação de dados.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

O software Sting é um software voltado para a Bioinformática e, d eforma geral, faz análise de estrutura de proteínas e mostra de forma especializada qualquer proteína cuja estrutura está em arquivos .pdf, que contém dados sobre proteínas, podendo ser acessados em Research Collaboratory for Structural Bionformatics.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

XML e sua utilização em aplicações de bioinformática. Utilização de XML no módulo JPD do SMS. Discussão e trabalhos futuros.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

O objetivo do curso foi familiarizar pesquisadores de áreas de biotecnologia, como genética, bioquímica, biologia molecular e bioinformática, com as novas ferramentas disponíveis para a análise de estruturas macromoleculares, juntamente com a explificação de novas abordagens e metodologias para o estudo das macromoléculares.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Os primeiros resultados do desenvolvimento de um novo método para a localização do átomo de hidrogênio contido em grupos hidroxila da cadeia lateral dos aminoácidos é apresentado neste artigo. Os métodos existentes utilizam campos de força para esse problema de localização. Os autores propõem uma abordagem computacional para esse problema, pelo reconhecimento de padrões de pontes de hidrogênio agrupados por similaridade em clusters.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

O presente trabalho foi elaborado a fim de que os usuários que utilizam o Sistema Bife de Qualidade pudessem consultar um manual de uso das ferramentas do sistema sempre que tivessem dúvidas em relação ao uso do mesmo. A vantagem de um manual de uso é que se consegue explicitar as principais funcionalidades do sistema sem exibir, no entanto, um texto abrangente e cansativo de ser lido. As diversas informações obtidas durante o desenvolvimento do sistema, tais como as coletadas em entrevistas com os principais usuários do sistema, foram consideradas na elaboração deste trabalho. Sendo assim, o objetivo do manual é reunir, de forma clara e objetiva, todas as funcionalidades fornecidas pelo Sistema Bife de Qualidade, de tal modo que os usuários possam encontrar instruções para interagir facilmente com cada uma das funcionalidades apresentadas.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

O objetivo deste relatório é apresentar o trabalho desenvolvido pela equipe da Embrapa Informática Agropecuária, durante a gestão 205-2009, destacando as principais ações realizadas no âmbito da pesquisa científica, que mais contribuíram para colocar em prática a missão da Unidade.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

O projecto de sequenciação do genoma humano veio abrir caminho para o surgimento de novas áreas transdisciplinares de investigação, como a biologia computacional, a bioinformática e a bioestatística. Um dos resultados emergentes desde advento foi a tecnologia de DNA microarrays, que permite o estudo do perfil da expressão de milhares de genes, quando sujeitos a perturbações externas. Apesar de ser uma tecnologia relativamente consolidada, continua a apresentar um conjunto vasto de desafios, nomeadamente do ponto de vista computacional e dos sistemas de informação. São exemplos a optimização dos procedimentos de tratamento de dados bem como o desenvolvimento de metodologias de interpretação semi-automática dos resultados. O principal objectivo deste trabalho consistiu em explorar novas soluções técnicas para agilizar os procedimentos de armazenamento, partilha e análise de dados de experiências de microarrays. Com esta finalidade, realizou-se uma análise de requisitos associados às principais etapas da execução de uma experiência, tendo sido identificados os principais défices, propostas estratégias de melhoramento e apresentadas novas soluções. Ao nível da gestão de dados laboratoriais, é proposto um LIMS (Laboratory Information Management System) que possibilita a gestão de todos os dados gerados e dos procedimentos realizados. Este sistema integra ainda uma solução que permite a partilha de experiências, de forma a promover a participação colaborativa de vários investigadores num mesmo projecto, mesmo usando LIMS distintos. No contexto da análise de dados, é apresentado um modelo que facilita a integração de algoritmos de processamento e de análise de experiências no sistema desenvolvido. Por fim, é proposta uma solução para facilitar a interpretação biológica de um conjunto de genes diferencialmente expressos, através de ferramentas que integram informação existente em diversas bases de dados biomédicas.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Um dos maiores avanços científicos do século XX foi o desenvolvimento de tecnologia que permite a sequenciação de genomas em larga escala. Contudo, a informação produzida pela sequenciação não explica por si só a sua estrutura primária, evolução e seu funcionamento. Para esse fim novas áreas como a biologia molecular, a genética e a bioinformática são usadas para estudar as diversas propriedades e funcionamento dos genomas. Com este trabalho estamos particularmente interessados em perceber detalhadamente a descodificação do genoma efectuada no ribossoma e extrair as regras gerais através da análise da estrutura primária do genoma, nomeadamente o contexto de codões e a distribuição dos codões. Estas regras estão pouco estudadas e entendidas, não se sabendo se poderão ser obtidas através de estatística e ferramentas bioinfomáticas. Os métodos tradicionais para estudar a distribuição dos codões no genoma e seu contexto não providenciam as ferramentas necessárias para estudar estas propriedades à escala genómica. As tabelas de contagens com as distribuições de codões, assim como métricas absolutas, estão actualmente disponíveis em bases de dados. Diversas aplicações para caracterizar as sequências genéticas estão também disponíveis. No entanto, outros tipos de abordagens a nível estatístico e outros métodos de visualização de informação estavam claramente em falta. No presente trabalho foram desenvolvidos métodos matemáticos e computacionais para a análise do contexto de codões e também para identificar zonas onde as repetições de codões ocorrem. Novas formas de visualização de informação foram também desenvolvidas para permitir a interpretação da informação obtida. As ferramentas estatísticas inseridas no modelo, como o clustering, análise residual, índices de adaptação dos codões revelaram-se importantes para caracterizar as sequências codificantes de alguns genomas. O objectivo final é que a informação obtida permita identificar as regras gerais que governam o contexto de codões em qualquer genoma.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

O desenvolvimento de equipamentos de descodificação massiva de genomas veio aumentar de uma forma brutal os dados disponíveis. No entanto, para desvendarmos informação relevante a partir da análise desses dados é necessário software cada vez mais específico, orientado para determinadas tarefas que auxiliem o investigador a obter conclusões o mais rápido possível. É nesse campo que a bioinformática surge, como aliado fundamental da biologia, uma vez que tira partido de métodos e infra-estruturas computacionais para desenvolver algoritmos e aplicações informáticas. Por outro lado, na maior parte das vezes, face a novas questões biológicas é necessário responder com novas soluções específicas, pelo que o desenvolvimento de aplicações se torna um desafio permanente para os engenheiros de software. Foi nesse contexto que surgiram os principais objectivos deste trabalho, centrados na análise de tripletos e de repetições em estruturas primárias de DNA. Para esse efeito, foram propostos novos métodos e novos algoritmos que permitirem o processamento e a obtenção de resultados sobre grandes volumes de dados. Ao nível da análise de tripletos de codões e de aminoácidos foi proposto um sistema concebido para duas vertentes: por um lado o processamento dos dados, por outro a disponibilização na Web dos dados processados, através de um mecanismo visual de composição de consultas. Relativamente à análise de repetições, foi proposto e desenvolvido um sistema para identificar padrões de nucleótidos e aminoácidos repetidos em sequências específicas, com particular aplicação em genes ortólogos. As soluções propostas foram posteriormente validadas através de casos de estudo que atestam a mais-valia do trabalho desenvolvido.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

A glicosilação não-enzimática e o stress oxidativo representam dois processos importantes visto desempenharem um papel importante no que respeita às complicações de vários processos patofisiológicos. No presente, a associação entre a glicosilação não-enzimática e a oxidação de proteínas é reconhecida como sendo um dos principais responsáveis pela acumulação de proteínas não-funcionais que, por sua vez, promove uma contínua sensibilização para um aumento do stress oxidativo ao nível celular. Embora esteja disponível bastante informação no que respeita aos dois processos e suas consequências ao nível estrutural e funcional, permanecem questões por esclarecer acerca do que se desenvolve ao nível molecular. Com o objectivo de contribuir para uma melhor compreensão da relação entre a glicosilação não-enzimática e a oxidação, proteínas modelo (albumina, insulina e histonas H2B e H1) foram submetidas a sistemas in vitro de glicosilação não-enzimática e oxidação em condições controladas e durante um período de tempo específico. A identificação dos locais de glicosilação e oxidação foi realizada através de uma abordagem proteómica, na qual após digestão enzimática se procedeu à análise por cromatografia líquida acoplada a espectrometria de massa tandem (MALDI-TOF/TOF). Esta abordagem permitiu a obtenção de elevadas taxas de cobertura das sequências proteicas, permitindo a identificação dos locais preferenciais de glicosilação e oxidação nas diferentes proteínas estudadas. Como esperado, os resíduos de lisina foram os preferencialmente glicosilados. No que respeita à oxidação, além das modificações envolvendo hidroxilações e adições de oxigénio, foram identificadas deamidações, carbamilações e conversões oxidativas específicas de vários aminoácidos. No geral, os resíduos mais afectados pela oxidação foram os resíduos de cisteína, metionina, triptofano, tirosina, prolina, lisina e fenilalanina. Ao longo do período de tempo estudado, os resultados indicaram que a oxidação teve início em zonas expostas da proteína e/ou localizadas na vizinhança de resíduos de cisteína e metionina, ao invés de exibir um comportamente aleatório, ocorrendo de uma forma nãolinear por sua vez dependente da estabilidade conformacional da proteína. O estudo ao longo do tempo mostrou igualmente que, no caso das proteínas préglicosiladas, a oxidação das mesmas ocorreu de forma mais rápida e acentuada, sugerindo que as alterações estruturais induzidas pela glicosilação promovem um estado pro-oxidativo. No caso das proteínas pré-glicosiladas e oxidadas, foi identificado um maior número de modificações oxidativas assim como de resíduos modificados na vizinhança de resíduos glicosilados. Com esta abordagem é realizada uma importante contribuição na investigação das consequências do dano ‘glico-oxidativo’ em proteínas ao nível molecular através da combinação da espectrometria de massa e da bioinformática.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

A fosforilação reversível de proteínas é um importante mecanismo de controlo em eucariotas. A fosfoproteína fosfatase 1 (PPP1) é uma fosfatase de serina/treonina envolvida em vários processos celulares. Existem três isoformas da subunidade catalítica (α/CA, δ/β/CB e γ/CC) com pequenas diferenças nos terminais amino e carboxílico. O gene PPP1CC sofre ainda splicing alternativo para produzir duas isoformas, a PPP1CC1 ubíqua e a PPP1CC2 enriquecida em testículo e específica de esperma. A localização e especificidade de substratos da PPP1 está dependente da formação de complexos oligoméricos com proteínas que interagem com a PPP1 (PIPs). O objetivo principal desta tese foi estudar novas PIPs, específicas de testículo e esperma, a fim de melhor caracterizar o papel desta fosfatase e dos respetivos complexos na reprodução em mamíferos. Com este fim, estudou-se a presença, localização e possíveis funções de uma PIP previamente conhecida, PPP1R2, e de duas novas PIPs, PPP1R2P3 e Tctex1d4. PPP1R2 e PPP1R2P3 estão presentes em esperma humano colocalizando com a PPP1CC2, na cabeça e na cauda. A hipótese é que as holoenzimas localizadas na cabeça terão um papel na reação acrossómica, enquanto que as holoenzimas presentes no axonema são relevantes para o controlo da motilidade flagelar. De seguida foram estudados os pseudogenes da PPP1R2, em termos de história evolutiva e de possíveis funções. Na espécie humana, a PPP1R2 tem 10 pseudogenes, 7 deles específicos de primatas. Estudos de bioinformática e dados de expressão mostram que os PPP1R2P1/P3/P9 são os pseudogenes com maior probabilidade de serem transcritos e traduzidos. Também identificámos o PPP1R2P9 em esperma humano e mostrámos que alguns pseudogenes poderão estar associados a estados fisiopatológicos. Isto indica que o processo de evolução poderá estar ligado á formação de novos genes ou ao controlo do mRNA da PPP1R2. A sobre-expressão da PPP1R2 ou PPP1R2P3 em testículo de ratinho também foi realizada, para caracterizar os mecanismos envolvidas na função dos complexos PPP1R2/PPP1R2P3-PPP1CC2 na espermatogénese e fisiologia dos espermatozoides. A dineína de cadeia leve, Tctex1d4, foi encontrada como interagindo com a PPP1C e como estando presente em testículo de ratinho e em esperma humano. Demonstrámos que a Tctex1d4 e a PPP1 colocalizam no centro organizador de microtúbulos e nos microtúbulos e que o motivo de ligação à PPP1 presente na Tctex1d4 parece ser importante para manter a PPP1 no centro organizador de microtúbulos e/ou para disromper ou atrasar o seu movimento ao longo dos microtúbulos emergentes. Estes resultados abrem novos caminhos para os possíveis papéis do complexo Tctex1d4-PPP1 na dinâmica dos microtúbulos, motilidade do esperma, reação acrossómica e na regulação da barreira hemato-testicular, provavelmente, através da via de sinalização do TGFß. A análise do motivo de ligação à PPP1 mostra que este é altamente conservado entre os mamíferos, com exceção das Pikas, sugerindo que esta perda aconteceu antes da radiação das Pikas, há 6-20 milhões de anos atrás. Através de um rastreio por mutações demonstrámos que a capacidade da Tctex1d4 se ligar à PPP1 é mantida nas Pikas, embora o motivo de ligação à PPP1 esteja disrompido. Este estudo abre portas para novas descobertas na área da reprodução mostrando o papel da PPP1CC2 na espermatogénese e fisiologia do esperma.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

A exigente inovação na área das aplicações biomédicas tem guiado a evolução das tecnologias de informação nas últimas décadas. Os desafios associados a uma gestão, integração, análise e interpretação eficientes dos dados provenientes das mais modernas tecnologias de hardware e software requerem um esforço concertado. Desde hardware para sequenciação de genes a registos electrónicos de paciente, passando por pesquisa de fármacos, a possibilidade de explorar com precisão os dados destes ambientes é vital para a compreensão da saúde humana. Esta tese engloba a discussão e o desenvolvimento de melhores estratégias informáticas para ultrapassar estes desafios, principalmente no contexto da composição de serviços, incluindo técnicas flexíveis de integração de dados, como warehousing ou federação, e técnicas avançadas de interoperabilidade, como serviços web ou LinkedData. A composição de serviços é apresentada como um ideal genérico, direcionado para a integração de dados e para a interoperabilidade de software. Relativamente a esta última, esta investigação debruçou-se sobre o campo da farmacovigilância, no contexto do projeto Europeu EU-ADR. As contribuições para este projeto, um novo standard de interoperabilidade e um motor de execução de workflows, sustentam a sucesso da EU-ADR Web Platform, uma plataforma para realizar estudos avançados de farmacovigilância. No contexto do projeto Europeu GEN2PHEN, esta investigação visou ultrapassar os desafios associados à integração de dados distribuídos e heterogéneos no campo do varíoma humano. Foi criada uma nova solução, WAVe - Web Analyses of the Variome, que fornece uma coleção rica de dados de variação genética através de uma interface Web inovadora e de uma API avançada. O desenvolvimento destas estratégias evidenciou duas oportunidades claras na área de software biomédico: melhorar o processo de implementação de software através do recurso a técnicas de desenvolvimento rápidas e aperfeiçoar a qualidade e disponibilidade dos dados através da adopção do paradigma de web semântica. A plataforma COEUS atravessa as fronteiras de integração e interoperabilidade, fornecendo metodologias para a aquisição e tradução flexíveis de dados, bem como uma camada de serviços interoperáveis para explorar semanticamente os dados agregados. Combinando as técnicas de desenvolvimento rápidas com a riqueza da perspectiva "Semantic Web in a box", a plataforma COEUS é uma aproximação pioneira, permitindo o desenvolvimento da próxima geração de aplicações biomédicas.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

The rapid evolution and proliferation of a world-wide computerized network, the Internet, resulted in an overwhelming and constantly growing amount of publicly available data and information, a fact that was also verified in biomedicine. However, the lack of structure of textual data inhibits its direct processing by computational solutions. Information extraction is the task of text mining that intends to automatically collect information from unstructured text data sources. The goal of the work described in this thesis was to build innovative solutions for biomedical information extraction from scientific literature, through the development of simple software artifacts for developers and biocurators, delivering more accurate, usable and faster results. We started by tackling named entity recognition - a crucial initial task - with the development of Gimli, a machine-learning-based solution that follows an incremental approach to optimize extracted linguistic characteristics for each concept type. Afterwards, Totum was built to harmonize concept names provided by heterogeneous systems, delivering a robust solution with improved performance results. Such approach takes advantage of heterogenous corpora to deliver cross-corpus harmonization that is not constrained to specific characteristics. Since previous solutions do not provide links to knowledge bases, Neji was built to streamline the development of complex and custom solutions for biomedical concept name recognition and normalization. This was achieved through a modular and flexible framework focused on speed and performance, integrating a large amount of processing modules optimized for the biomedical domain. To offer on-demand heterogenous biomedical concept identification, we developed BeCAS, a web application, service and widget. We also tackled relation mining by developing TrigNER, a machine-learning-based solution for biomedical event trigger recognition, which applies an automatic algorithm to obtain the best linguistic features and model parameters for each event type. Finally, in order to assist biocurators, Egas was developed to support rapid, interactive and real-time collaborative curation of biomedical documents, through manual and automatic in-line annotation of concepts and relations. Overall, the research work presented in this thesis contributed to a more accurate update of current biomedical knowledge bases, towards improved hypothesis generation and knowledge discovery.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Tese de doutoramento, Ciências Biomédicas, Departamento de Ciências Biomédicas e Medicina, Universidade do Algarve, 2014