21 resultados para Texto narrativo - Estrutura textual

em Repositório Institucional da Universidade de Aveiro - Portugal


Relevância:

30.00% 30.00%

Publicador:

Resumo:

É objetivo da presente investigação a análise sistemática do álbum narrativo infantil, mais concretamente, da obra escrita e ilustrada por Manuela Bacelar, numa leitura dialógica das suas componentes linguística e pictórica. Partindo de um conspecto teórico-crítico do conceito e da caracterização do álbum enquanto género maior da literatura, o estudo centra-se no exame técnicocompositivo do corpus, procurando indagar alguns dos traços e/ou dos recursos formais, retórico-estilísticos e ideotemáticos que singularizam a obra desta premiada artista plástica, assentando em algumas das modernas correntes literárias (e.g., a intertextualidade e a metaficção) que a inscrevem numa estética pós-modernista. As repercussões práticas do contacto precoce com o álbum e os seus contributos na promoção de comportamentos emergentes de literacia são analisados num estudo de caso que a investigação contempla. Analisando a interação entre as vertentes textual e icónica sublinha-se a especificidade de um género que aposta na narrativização como forma de aproximar a criança do universo plástico e literário.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

O trabalho que se segue estuda a natureza dos textos “criativos” produzidos por alunos de 12/13 anos, em situação de sala de aula. Para o efeito seleccionámos duas turmas do Ensino Básico – 3º ciclo – de perfis diferentes e acompanhámos os sessenta alunos que se enquadravam nessa faixa etária durante um ano lectivo, seguindo a sua evolução. Centrámos o nosso estudo no aluno, como produtor do texto, preocupado em fazer o seu melhor, desenvolvendo os temas a tratar com a originalidade de que era capaz e procurando a forma adequada ao assunto e à situação. Verificámos a sua preocupação em cumprir as expectativas do professor/receptor, mas também a sua vontade de entrar em negociações, numa tentativa de integrar as expectativas do docente nos seus próprios interesses pessoais. Para a sistematização das características globais dos textos produzidos pelos alunos utilizámos o modelo de análise textual de Beaugrande & Dressler, por nos parecer adaptar-se à situação de diálogo escolar, subjacente a qualquer produção de texto em sala de aula. O levantamento das características globais dos textos dos alunos tornou evidente as suas diferenças e os seus traços de individualidade. Por isso, achámos que este estudo não estaria completo sem a complementação duma segunda parte em que procurássemos encontrar os traços estilísticos desses mesmos textos, numa tentativa de analisar a presença de algumas características de estilo colectivas, produto das preocupações comuns aos alunos, assim como alguns traços estilísticos individuais, consequência de vivências particulares. Terminaremos fazendo uma síntese dos dados obtidos e reflectindo sobre as suas implicações na situação de ensino/aprendizagem.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

The rapid evolution and proliferation of a world-wide computerized network, the Internet, resulted in an overwhelming and constantly growing amount of publicly available data and information, a fact that was also verified in biomedicine. However, the lack of structure of textual data inhibits its direct processing by computational solutions. Information extraction is the task of text mining that intends to automatically collect information from unstructured text data sources. The goal of the work described in this thesis was to build innovative solutions for biomedical information extraction from scientific literature, through the development of simple software artifacts for developers and biocurators, delivering more accurate, usable and faster results. We started by tackling named entity recognition - a crucial initial task - with the development of Gimli, a machine-learning-based solution that follows an incremental approach to optimize extracted linguistic characteristics for each concept type. Afterwards, Totum was built to harmonize concept names provided by heterogeneous systems, delivering a robust solution with improved performance results. Such approach takes advantage of heterogenous corpora to deliver cross-corpus harmonization that is not constrained to specific characteristics. Since previous solutions do not provide links to knowledge bases, Neji was built to streamline the development of complex and custom solutions for biomedical concept name recognition and normalization. This was achieved through a modular and flexible framework focused on speed and performance, integrating a large amount of processing modules optimized for the biomedical domain. To offer on-demand heterogenous biomedical concept identification, we developed BeCAS, a web application, service and widget. We also tackled relation mining by developing TrigNER, a machine-learning-based solution for biomedical event trigger recognition, which applies an automatic algorithm to obtain the best linguistic features and model parameters for each event type. Finally, in order to assist biocurators, Egas was developed to support rapid, interactive and real-time collaborative curation of biomedical documents, through manual and automatic in-line annotation of concepts and relations. Overall, the research work presented in this thesis contributed to a more accurate update of current biomedical knowledge bases, towards improved hypothesis generation and knowledge discovery.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Ao abordar este tema, pretendemos oferecer um possível quadro de meios interpretativos, destinados a uma revelação actualizada do texto bachiano para violino solo. Considerando o manuscrito como fonte básica de informações, são analisados vários aspectos componísticos – ritmo, articulações, polifonia, harmonia, estrutura –, seleccionando os itens ou as características com incidência directa e maiores repercussões sobre a interpretação. Procurou-se encontrar convergências entre: a) a suposta representação sonora do autor, na época, e as especificidades do violino e do arco modernos, b) as dificuldades características do texto e os meios técnicos disponíveis na arte violinística actual, c) as exigências estéticas contemporâneas e a valiosa experiência conquistada, nas últimas décadas, pela interpretação em maneira barroca, autêntica, e com instrumentos originais.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O presente estudo teve como objectivo analisar o desempenho de alunos de primeiro ano dos cursos de Engenharia e de Ecoturismo da Escola Superior Agrária (ESAC) do Instituto Politécnico de Coimbra (IPC) no que respeita à realização de uma síntese da informação escrita a partir de várias fontes. O estudo compreendeu duas partes, constituídas em dois estudos de caso: no primeiro, realizado no ano lectivo de 2003/2004, participaram 123 alunos; no segundo, realizado no ano lectivo de 2006/2007, participaram 60 alunos, constituindo estes a totalidade de alunos de primeiro ano que estudaram a língua nacional sob as orientações do novo “Programa de Língua Portuguesa” vigente no Ensino Secundário a partir de 2003. Em ambos os estudos de caso, procurou-se conhecer o que pensavam os alunos sobre a sua relação com a escrita em contexto escolar e sobre os seus procedimentos e dificuldades relativos à selecção e síntese da informação. Foram analisados os seus procedimentos preliminares à produção de um texto a partir de várias fontes através de eventuais sublinhados, apontamentos e rascunhos e, em seguida, através do trabalho de revisão e qualidade do texto final, que pressupunha o domínio ao nível da explicitação do conhecimento. A análise comparativa a partir dos estudos e os resultados finais revelaram dificuldades de selecção, organização e conexão da informação, bem como dificuldades relativas a uma construção discursiva própria a partir da situação de comunicação proposta, tanto ao nível da superfície do texto quanto ao nível da sua estrutura profunda. Assim, considerando que os participantes no estudo apresentaram dificuldades ao nível da explicitação do conhecimento, considerando a pouca ou nenhuma abordagem do assunto no Ensino Secundário em Portugal, considerando ainda que, em contexto académico, a competência de escrita a partir de várias fontes com vista à explicitação do conhecimento é uma condição básica e necessária para uma escrita de transformação do conhecimento e consequente literacia crítica, torna-se imperativo reflectir sobre o problema para buscar soluções. A inclusão de uma disciplina no primeiro ano do Ensino Superior (cujos conteúdos básicos são aqui sugeridos) - que contemple o ensino explícito da escrita para o desenvolvimento das competências de explicitação e transformação do conhecimento - poderá ser uma interessante solução para promover a melhoria do desempenho escritural dos alunos na difícil transição do Ensino Secundário para o Superior, tornando-os mais auto-confiantes, afastando-os da prática do plágio e contribuindo para o seu sucesso escolar.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Esta tese surge no contexto de sistemas e serviços web. O objectivo é propor uma solução para o problema da integração de informação de diversas fontes, numa plataforma web única, personalizável e adaptável ao utilizador. Nos casos de empresas ou organizações que tenham para diferentes tarefas, diferentes sistemas de informação independentes, o problema da integração de informação surge com a necessidade de integração destes numa única interface disponibilizada aos seus utilizadores. A integração de serviços numa mesma interface pressupõe que haja comunicação entre um sistema central (que fornece a interface) e os diversos sistemas existentes (que detêm a totalidade – ou parte – da informação a apresentar). Assim, será necessário garantir a identidade do utilizador a cada um dos serviços apresentados, bem como assegurar que cada utilizador tem à sua disposição de forma centralizada, apenas e só a informação e operações a que realmente tem acesso em cada um dos sistemas. Trata-se de uma plataforma que pretende por um lado, fornecer a informação correcta e orientada ao utilizador e, por outro lado, garantir que a organização que suporta o sistema consegue informar e interagir com os seus utilizadores de forma mais eficaz. O cenário adoptado é a Universidade de Aveiro. Esta pretende disponibilizar uma plataforma electrónica, onde os diferentes interlocutores (alunos, docentes, funcionários, ex-alunos, etc.) possam ter acesso a informação dirigida e orientada aos seus interesses e funções na Universidade. De modo a que cada utilizador seja realmente visto como um utilizador único, serão estudados e comparados serviços de modelação de utilizador e perfis de utilizador. Será proposto um serviço de modelação de utilizador e uma lógica de criação de perfis de utilizador, distintos do existente no estado de arte. Esta lógica conjuga a personalização da interface por parte do utilizador, com a gestão de operações e definição de políticas de segurança por parte da organização, de forma independente relativamente ao sistema de informação subjacente.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Um dos maiores avanços científicos do século XX foi o desenvolvimento de tecnologia que permite a sequenciação de genomas em larga escala. Contudo, a informação produzida pela sequenciação não explica por si só a sua estrutura primária, evolução e seu funcionamento. Para esse fim novas áreas como a biologia molecular, a genética e a bioinformática são usadas para estudar as diversas propriedades e funcionamento dos genomas. Com este trabalho estamos particularmente interessados em perceber detalhadamente a descodificação do genoma efectuada no ribossoma e extrair as regras gerais através da análise da estrutura primária do genoma, nomeadamente o contexto de codões e a distribuição dos codões. Estas regras estão pouco estudadas e entendidas, não se sabendo se poderão ser obtidas através de estatística e ferramentas bioinfomáticas. Os métodos tradicionais para estudar a distribuição dos codões no genoma e seu contexto não providenciam as ferramentas necessárias para estudar estas propriedades à escala genómica. As tabelas de contagens com as distribuições de codões, assim como métricas absolutas, estão actualmente disponíveis em bases de dados. Diversas aplicações para caracterizar as sequências genéticas estão também disponíveis. No entanto, outros tipos de abordagens a nível estatístico e outros métodos de visualização de informação estavam claramente em falta. No presente trabalho foram desenvolvidos métodos matemáticos e computacionais para a análise do contexto de codões e também para identificar zonas onde as repetições de codões ocorrem. Novas formas de visualização de informação foram também desenvolvidas para permitir a interpretação da informação obtida. As ferramentas estatísticas inseridas no modelo, como o clustering, análise residual, índices de adaptação dos codões revelaram-se importantes para caracterizar as sequências codificantes de alguns genomas. O objectivo final é que a informação obtida permita identificar as regras gerais que governam o contexto de codões em qualquer genoma.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Os Modelos de Equações Simultâneas (SEM) são modelos estatísticos com muita tradição em estudos de Econometria, uma vez que permitem representar e estudar uma vasta gama de processos económicos. Os estimadores mais usados em SEM resultam da aplicação do Método dos Mínimos Quadrados ou do Método da Máxima Verosimilhança, os quais não são robustos. Em Maronna e Yohai (1997), os autores propõem formas de “robustificar” esses estimadores. Um outro método de estimação com interesse nestes modelos é o Método dos Momentos Generalizado (GMM), o qual também conduz a estimadores não robustos. Estimadores que sofrem de falta de robustez são muito inconvenientes uma vez que podem conduzir a resultados enganadores quando são violadas as hipóteses subjacentes ao modelo assumido. Os estimadores robustos são de grande valor, em particular quando os modelos em estudo são complexos, como é o caso dos SEM. O principal objectivo desta investigação foi o de procurar tais estimadores tendo-se construído um estimador robusto a que se deu o nome de GMMOGK. Trata-se de uma versão robusta do estimador GMM. Para avaliar o desempenho do novo estimador foi feito um adequado estudo de simulação e foi também feita a aplicação do estimador a um conjunto de dados reais. O estimador robusto tem um bom desempenho nos modelos heterocedásticos considerados e, nessas condições, comporta-se melhor do que os estimadores não robustos usados no estudo. Contudo, quando a análise é feita em cada equação separadamente, a especificidade de cada equação individual e a estrutura de dependência do sistema são dois aspectos que influenciam o desempenho do estimador, tal como acontece com os estimadores usuais. Para enquadrar a investigação, o texto inclui uma revisão de aspectos essenciais dos SEM, o seu papel em Econometria, os principais métodos de estimação, com particular ênfase no GMM, e uma curta introdução à estimação robusta.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O objectivo global deste trabalho consistiu em estudar aspectos da estrutura e dinâmica da ictiofauna da Ria de Aveiro, sistema lagunar estuarino com 43 km2 de extensão, em baixa-mar, que sofre influências dulçaquícolas e marinhas e fica situado entre 40º 30’-40º52’N and 8º35’-8º47W no litoral da costa Portuguesa. A ictiofauna foi capturada mensalmente, de Dezembro de 1996 a Novembro de 1997, em nove estações de amostragem dispersas pela laguna, com uma rede de pesca tradicional “chincha”. Foram também registados os seguintes parâmetros abióticos hidrológicos: temperatura, salinidade, oxigénio dissolvido e transparência. A temperatura variou entre 6,5 e 27,6ºC, a salinidade entre 0 e 41‰, o oxigénio dissolvido entre 1,2 e 11,4 mg.l-1 e a transparência entre 7,3 e 100,0%. A variação da salinidade e a transparência da água entre as estações de amostragem, assim como a variação da temperatura, salinidade e oxigénio dissolvido, ao longo dos meses, foram significativas. Foram capturados 14.598 exemplares pertencentes a 43 espécies de 21 famílias de Teleósteos. O número de espécies e densidade da ictiofauna foram mais elevados no Verão e nas estações mais perto da entrada da laguna, em especial na Barra e na Torreira, enquanto que a biomassa sofreu oscilações consideráveis ao longo dos meses e mostrou-se mais elevada nas estações mais afastadas da embocadura. As espécies marinhas sazonais foram as mais numerosas e registaram a maior biomassa e as categorias “marinha juvenil” e “estuarina residente” registaram o maior número de espécies. Mugilidae, Atherinidae e Clupeidae foram as famílias mais abundantes. Seis espécies representaram cerca de 74% da densidade total e cerca de 63% da biomassa total e ocorreram em todas as estações e em todos os meses. Pode-se concluir que a Ria de Aveiro, com elevada variação espacial e sazonal nos parâmetros abióticos, apresenta uma comunidade de peixes rica e representativa, comparada com lagunas costeiras estuarinas Europeias.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O presente trabalho de investigação visa propor uma metodologia de elaboração de uma base de dados terminológica destinada a um público não- -especialista, e surge como resposta à necessidade de transmissão de informação ao consumidor, fruto de falta de – ou parca – compreensão do mesmo, relativa a géneros alimentícios com alegações de saúde disponíveis no mercado: os denominados alimentos funcionais. A proposta metodológica de segmentação e caracterização do processo terminográfico, baseada no modelo desenvolvido por Gouadec, para organização do processo global de tradução, encontra-se organizada em três fases – pré-terminografia, terminografia e pós-terminografia –, e compreende três vertentes de análise – uma vertente conceptual, uma vertente comunicativa e uma vertente textual. Em termos gerais, na fase de pré-terminografia é desenvolvido um trabalho preparatório – de familiarização com a área de especialidade e de delimitação da subárea de especialidade, de identificação dos contextos comunicativos e de constituição de corpora especializados – essencial à subsequente fase executória – fase de terminografia – de elaboração do recurso terminológico. A última fase – fase de pós-terminografia – compreende o desenvolvimento de esforços com vista à aplicação industrial do recurso, assim como a sua posterior constante actualização. Constituem objecto de análise do presente trabalho as duas primeiras fases supramencionadas e as etapas que as constituem. A consideração de três vertentes de análise é, de igual forma, relevante.Tal facto é demonstrado ao longo do processo terminográfico, designadamente a nível da análise das repercussões, na fase de terminografia, de cada uma destas vertentes, consideradas já na fase de pré-terminografia. Com este trabalho de investigação pretendemos demonstrar o papel social da Terminologia, no contributo que pode prestar na divulgação de ciência, concretamente através da apresentação de uma proposta de uma base de dados terminológica sobre alimentos funcionais para o consumidor – a AlF Beta. Do mesmo modo, temos por objectivo contribuir a nível da reflexão teórica e metodológica em Terminologia, nomeadamente no que concerne a sua vertente aplicada, através da elaboração de recursos terminológicos destinados a públicos não-especialistas.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Além de alguns estudos lexicais, não existe em Portugal nenhuma tradição de análise linguística da imprensa. Entre os aspectos que oferecem especial interesse, incluem-se os títulos das notícias, em parte porque propõem uma gramática diferente da da norma discursiva, mas também devido aos jogos linguísticos, nomeadamente o emprego de linguagem metafórica, a que os redactores recorrem para incentivar a leitura dos textos. O trabalho em curso debruça-se sobre os vários níveis da realização linguística deste tipo textual, partindo de um corpus informatizado de 2.060 títulos de notícia portugueses com linguagem metafórica. Assim, no nível sintáctico, interessou-nos estudar a configuração sintáctica do título e os constituintes que nele correspondem ao veículo metafórico. No nível semântico, identificámos, seguindo um enquadramento teórico subordinado à teoria dos espaços múltiplos de Fauconnier e Turner, as metáforas conceptuais presentes no corpus. No nível fonológico, foi feito um estudo sobre padrões sonoros de aliteração, rima e jogos de palavras concomitantes com a linguagem metafórica do título. O nível gráfico debruçou-se sobre os diversos processos de destacar graficamente o veículo metafórico e suas consequências na descodificação da mensagem. Finalmente, no nível intertextual, apresentou-se uma pesquisa sobre as relações internas do título com outros componentes do co-texto noticioso e as relações externas com textos mais ou menos distantes, mas culturalmente partilhados. Os resultados da pesquisa revelaram os processos através dos quais a linguagem metafórica no título de imprensa permite a verbalização de conceitos, a condensação de significados e motiva à leitura do texto.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Motivados pelo propósito central de contribuir para a construção, a longo prazo, de um sistema completo de conversão de texto para fala, baseado em síntese articulatória, desenvolvemos um modelo linguístico para o português europeu (PE), com base no sistema TADA (TAsk Dynamic Application), que visou a obtenção automática da trajectória dos articuladores a partir do texto de entrada. A concretização deste objectivo ditou o desenvolvimento de um conjunto de tarefas, nomeadamente 1) a implementação e avaliação de dois sistemas de silabificação automática e de transcrição fonética, tendo em vista a transformação do texto de entrada num formato adequado ao TADA; 2) a criação de um dicionário gestual para os sons do PE, de modo a que cada fone obtido à saída do conversor grafema-fone pudesse ter correspondência com um conjunto de gestos articulatórios adaptados para o PE; 3) a análise do fenómeno da nasalidade à luz dos princípios dinâmicos da Fonologia Articulatória (FA), com base num estudo articulatório e perceptivo. Os dois algoritmos de silabificação automática implementados e testados fizeram apelo a conhecimentos de natureza fonológica sobre a estrutura da sílaba, sendo o primeiro baseado em transdutores de estados finitos e o segundo uma implementação fiel das propostas de Mateus & d'Andrade (2000). O desempenho destes algoritmos – sobretudo do segundo – mostrou-se similar ao de outros sistemas com as mesmas potencialidades. Quanto à conversão grafema-fone, seguimos uma metodologia baseada em regras de reescrita combinada com uma técnica de aprendizagem automática. Os resultados da avaliação deste sistema motivaram a exploração posterior de outros métodos automáticos, procurando também avaliar o impacto da integração de informação silábica nos sistemas. A descrição dinâmica dos sons do PE, ancorada nos princípios teóricos e metodológicos da FA, baseou-se essencialmente na análise de dados de ressonância magnética, a partir dos quais foram realizadas todas as medições, com vista à obtenção de parâmetros articulatórios quantitativos. Foi tentada uma primeira validação das várias configurações gestuais propostas, através de um pequeno teste perceptual, que permitiu identificar os principais problemas subjacentes à proposta gestual. Este trabalho propiciou, pela primeira vez para o PE, o desenvolvimento de um primeiro sistema de conversão de texto para fala, de base articulatória. A descrição dinâmica das vogais nasais contou, quer com os dados de ressonância magnética, para caracterização dos gestos orais, quer com os dados obtidos através de articulografia electromagnética (EMA), para estudo da dinâmica do velo e da sua relação com os restantes articuladores. Para além disso, foi efectuado um teste perceptivo, usando o TADA e o SAPWindows, para avaliar a sensibilidade dos ouvintes portugueses às variações na altura do velo e alterações na coordenação intergestual. Este estudo serviu de base a uma interpretação abstracta (em termos gestuais) das vogais nasais do PE e permitiu também esclarecer aspectos cruciais relacionados com a sua produção e percepção.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Acompanhando o crescente e recente interesse pela actividade do professor em sala de aula, esta investigação visa analisar, grosso modo, o papel assumido pelas ferramentas didácticas quer nas práticas docentes propriamente ditas quer no objecto efectivamente ensinado em sala de aula. Procuramos analisar, em síntese, de que forma a introdução de uma nova ferramenta de ensino – uma sequência didáctica – a mobilizar, in loco, pelo professor poderá gerar transformações não só nos próprios procedimentos de ensino do professor como também na própria forma como o objecto de ensino é (re)configurado no seio das interacções didácticas. Esta é, assim, a questãochave da nossa pesquisa, fundada em diferentes mas complementares correntes teóricas. De molde a procurar obter uma resposta a tal interrogação, desenhámos uma investigação em redor, concretamente, do ensino da escrita do texto de opinião, em turmas de sexto ano de escolaridade, que se desenrolou em duas grandes fases: i) numa primeira, cada professor ensina o objecto como lhe apraz; ii) numa segunda, cada professor procede, de novo, ao ensino desse objecto, mas, agora, com a nova ferramenta didáctica (a sequência didáctica) que a cada um é dada pela investigadora. A recolha dos dados efectuou-se mediante a gravação audiovisual das próprias aulas, realizando-se também entrevistas várias, com propósitos distintos, aos professores, antes e após cada uma das supracitadas fases. Os resultados demonstram a existência de uma série de transformações quer no plano das práticas dos professores quer no âmbito do objecto efectivamente ensinado. No entanto, foi também possível identificar aspectos vários em que a mudança não ocorreu ou, pelo menos, não foi significativa. Perante estes resultados, lançámo-nos ainda na formulação de determinadas perguntas, pistas para futuras investigações, cuja pertinência se nos afigura evidente, se se quiser reequacionar o papel das ferramentas didácticas no trabalho, em sala de aula, do professor.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Nesta tese são estabelecidas novas propriedades espectrais de grafos com estruturas específicas, como sejam os grafos separados em cliques e independentes e grafos duplamente separados em independentes, ou ainda grafos com conjuntos (κ,τ)-regulares. Alguns invariantes dos grafos separados em cliques e independentes são estudados, tendo como objectivo limitar o maior valor próprio do espectro Laplaciano sem sinal. A técnica do valor próprio é aplicada para obter alguns majorantes e minorantes do índice do espectro Laplaciano sem sinal dos grafos separados em cliques e independentes bem como sobre o índice dos grafos duplamente separados em independentes. São fornecidos alguns resultados computacionais de modo a obter uma melhor percepção da qualidade desses mesmos extremos. Estudamos igualmente os grafos com um conjunto (κ,τ)-regular que induz uma estrela complementar para um valor próprio não-principal $. Além disso, é mostrado que $=κ-τ. Usando uma abordagem baseada nos grafos estrela complementares construímos, em alguns casos, os respectivos grafos maximais. Uma caracterização dos grafos separados em cliques e independentes que envolve o índice e as entradas do vector principal é apresentada tal como um majorante do número da estabilidade dum grafo conexo.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

The electronic storage of medical patient data is becoming a daily experience in most of the practices and hospitals worldwide. However, much of the data available is in free-form text, a convenient way of expressing concepts and events, but especially challenging if one wants to perform automatic searches, summarization or statistical analysis. Information Extraction can relieve some of these problems by offering a semantically informed interpretation and abstraction of the texts. MedInX, the Medical Information eXtraction system presented in this document, is the first information extraction system developed to process textual clinical discharge records written in Portuguese. The main goal of the system is to improve access to the information locked up in unstructured text, and, consequently, the efficiency of the health care process, by allowing faster and reliable access to quality information on health, for both patient and health professionals. MedInX components are based on Natural Language Processing principles, and provide several mechanisms to read, process and utilize external resources, such as terminologies and ontologies, in the process of automatic mapping of free text reports onto a structured representation. However, the flexible and scalable architecture of the system, also allowed its application to the task of Named Entity Recognition on a shared evaluation contest focused on Portuguese general domain free-form texts. The evaluation of the system on a set of authentic hospital discharge letters indicates that the system performs with 95% F-measure, on the task of entity recognition, and 95% precision on the task of relation extraction. Example applications, demonstrating the use of MedInX capabilities in real applications in the hospital setting, are also presented in this document. These applications were designed to answer common clinical problems related with the automatic coding of diagnoses and other health-related conditions described in the documents, according to the international classification systems ICD-9-CM and ICF. The automatic review of the content and completeness of the documents is an example of another developed application, denominated MedInX Clinical Audit system.