O presente trabalho cujo Título é técnicas de Data e Text Mining para a anotação dum Arquivo Digital, tem como objectivo testar a viabilidade da utilização de técnicas de processamento automático de texto para a anotação das sessões dos debates parlamentares da Assembleia da República de Portugal. Ao longo do trabalho abordaram-se conceitos como tecnologias de descoberta do conhecimento (KDD), o processo da descoberta do conhecimento em texto, a caracterização das várias etapas do processamento de texto e a descrição de algumas ferramentas open souce para a mineração de texto. A metodologia utilizada baseou-se na experimentação de várias técnicas de processamento textual utilizando a open source R/tm. Apresentam-se, como resultados, a influência do pré-processamento, tamanho dos documentos e tamanhos dos corpora no resultado do processamento utilizando o algoritmo knnflex.


We present a comparative analysis of satellite derived climatologies in the Cape Verde region (CV). In order to establish chlorophyll a variability, in relation to other oceanographic phenomena, a set of, relatively long (from five to eight years), time series of chlorophyll a, sea surface temperature, wind and geostrophic currents, were ensembled for the Eastern Central Atlantic (ECA). We studied seasonal and inter-annual variability of phytoplankton concentration, in relation to the rest of the variables, with a special focus in CV. We compared the situation within the archipelago with those of the surrounding marine environments, such as the North West African Upwelling (NWAU), North Atlantic Subtropical Gyre (NASTG), North Equatorial Counter Current (NECC) and Guinea Dome (GD). At the seasonal scale, CV region behaves partly as the surrounding areas, nevertheless, some autochthonous features were also found. The maximum peak of the pigment having a positive correlation with temperature is found at the end of the year for all the points in the archipelago; a less remarkable rise with negative correlation is also detected in February for points CV2 and CV4. This is behavior that none of the surrounding environments have shown. This enrichment was found to be preceded by a drastic drop in wind intensity (SW Monsoon) during summer months. The inter-annual analysis shows a tendency for decreasing of the chlorophyll a concentration.


New data on the distributibn and conservation status of some angiosperms of the Cape Verde Islands, W Africa Intensive field work aud analysis of the state of biodiversity ou all islands during the years iYY.3 lo IYYY Icd lo lhc publication ol’several contributions lo the flora and vegelalion of the archipclago of Cabo Verde (Brochniann & al. 1997, Gornes & Vera-Cruz 1993. Gonles & al. I9YSa-h. 1998, Games 1997. Kilian & Leyens 1994, Leyens 1998. Leyens & Lobin 1995, Lobin & al. 1995) as well as to the compilation of the First Red Data List for the Cape Verde Islnuds (Lcyrus & Lobin 1996). the elaboration of the National Strategy for Biodiversity Conservation (SIPA 19YY) and ! compilation of all areas in urgent need of protection (Leyens unpubl. diplonla thc.\is IYYJ. Gwnes & al. iu prep.). As part UC the activities of the lnstituto National de Invcstig;u$o c Dcscnvolvitucnto Agriirio (INIDA) and the Dcpurtamcnto de GeociSncias do Institute Supcriot de Educ;u$o t ISE) iutcnsive t’icld studies were conducted PI many diffcrctu localilics OII xcvcr;~I islands. resulting in a thesis tGo~nes IY97) and several terminal study papers (Luz IYYY. Cosi;t 1994. Gonsalvez 1999). The results show that the vegetation and flora of the islands arc still IWI fully known and much more field work is needed. hllhot~gh Sanliiqw is one of lhc islands whcrc lhc firs1 holanicill iIlVcxligilliollx wcrr c:crriul WI (Wcbh 1x49. Schruidt 1x52. Chcvalicr IY35) and where uu~ny intensive field studirs wcrc


O propósito da Web Semântica é conseguir uma Web de dados totalmente ligada, isto é, numa perspetiva Linked Open Data. A Web Semântica deve garantir (estabelecendo padrões tecnológicos, vocabulários, linguagens lógicas, etc.) que os conteúdos publicados na Websejam inteligíveis quer por agentes humanos, quer por agentes máquina. Esta dissertação tem como objetivo responder à um problema delimitado, propondo uma solução no quadro da Web Semântica e suas tecnologias. Partindo-se de uma lista de termos em linguagem natural utilizados no Website da ANACOM (Autoridade Nacional de Comunicações), propomos uma organização de acordo com metodologias de construção de ontologias e vocabulários. Inspirámo-nos em duas metodologias, o Ontology Development 101 e o Process and Methodology for Core Vocabularies. O vocabulário controlado resultante, tem como base tecnológica o modelo de organização de conhecimento, recomendado pelo W3C (World Wide Web Consortium), o SKOS (Simple Knowledge Organization System). Trata-sede uma tecnologia standard da W3C desde 2009, utilizada na criação de tesauros,esquemas de classificação, taxonomias, glossários e outros tipos de vocabulários controlados. Como resultado da nossa intervenção, conseguimos organizar e codificar em SKOS, cerca de cinco centenas de termos identificados no Website da ANACOM. Para além da proposta do vocabulário controlado, passámos em revista às tecnologias e teorias que sustentam a temática da Web Semântica.