13 resultados para Semàntica diacrònica
em Repositório Institucional da Universidade de Aveiro - Portugal
Resumo:
O trabalho apresentado nesta dissertação teve por objectivo principal a concepção, modelação e desenvolvimento de uma plataforma de middleware que permitisse a integração de sistemas de informação, em todos os seus níveis (dados, lógico e apresentação), perfazendo uma federação de bibliotecas digitais distribuídas e ecléticas. Para este fim, foram estudadas as várias abordagens de modelação e organização das bibliotecas digitais, assim como os diversos sistemas e tecnologias de suporte existentes no momento inicial do trabalho. Compreendendo a existência de muitas lacunas ainda neste domínio, nomeadamente ao nível da interoperabilidade de sistemas heterogéneos e integração da semântica de metadados, decidiu-se proceder a um trabalho de investigação e desenvolvimento que pudesse apresentar eventuais soluções para o preenchimento de tais lacunas. Desta forma, surgem neste trabalho duas tecnologias, o XML e o Dublin Core, que servem de base a todas as restantes tecnologias usadas para a interoperabilidade e para a integração. Ainda utilizando estas tecnologias base, foram estudados e desenvolvidos meios simples, mas eficientes, de salvaguarda, indexação e pesquisa de informação, tentando manter a independência face aos grandes produtores de bases de dados, que só por si não resolvem alguns dos problemas mais críticos da investigação no domínio das bibliotecas digitais. ABSTRACT: The main objective of the work presented in this dissertation is the design, modulation and development of a middleware framework to allow information systems interoperability, in all their scope (data, logic and presentation), to accomplish a distributed and eclectic digital libraries federation. Several modulations and organizations were approached, and several support systems and technologies were studied. Understanding the existence of many gaps in this domain, namely in heterogeneous information systems interoperation and metadata semantic integration, it was decided to conduct a research and development work, which, eventually, could present some solutions to fill in these gaps. In this way, two technologies, XML and Dublin Core, appear to serve as the basis of all remaining technologies, to interoperate and to achieve semantic integration. Using yet these technologies, it was also studied and developed simple means, but efficient ones, to save, index and query information, preserving the independence from major data base producers, which by their selves don’t solve critical problems in the digital libraries research domain.
Resumo:
Discute-se na presente dissertação as metodologias de representação do conhecimento que podem ser utilizadas em terminologia na construção de ontologias. Através da análise de duas abordagens terminológicas – semasiologia e onomasiologia – observa-se o estatuto do texto de especialidade sob um ponto de vista teórico e prático, questionando-se a sua importância e o contributo do terminólogo e do especialista na captura de conhecimento enquanto especificação informal de uma conceptualização.
Resumo:
A ilustração como expressão, cumprindo o desígnio de comunicar visualmente, é reveladora de um modo específico de processo e pensamento. E pelo facto desse modo se constituir a partir do sentido implícito (do que não é dito), exigindo para se manifestar a participação cognitiva e afectiva do ilustrador, revela marcas de subjectividade e de poética portadoras de soluções narrativas, gráficas e plásticas originais. Essa transmutação entre as linguagens verbal e visual está impregnada de experiências, memórias e conhecimento; de tudo aquilo, enfim, que pelo corpo é percebido e sentido. Por isso se entende que configura, necessariamente, algo novo, já que não existem dois seres organicamente iguais. Tem-se como objectivo desta tese, reflectir sobre a ilustração ficcional enquanto construção de um autor na interpretação do texto de um outro, querendo, deste modo, contribuir para a afirmação do que é hoje a ilustração. Pretende-se, neste percurso, compreender os desígnios que cumpre a ilustração na actualidade e explicar o seu protagonismo no contexto presente do design de comunicação; quer-se ainda evidenciar que a prática da ilustração contamina ou influencia a prática do projecto de design; e que, por seu lado, a prática do projecto de design confere um entendimento distinto à prática da ilustração. As ilustrações que serão aqui objecto de estudo, são aquelas que manifestam um processo em cuja génese está a interpretação e o sentido que o seu autor atribui ao programa, e que se identificam, por isso, como próximas do projecto de design. O trabalho prático desenvolve-se pela selecção de autores que correspondem a esses pressupostos, pela sua entrevista e pela apresentação de projectos da sua autoria que justificam e reforçam a perspectiva teórica. Do confronto entre as respostas e os artefactos produzidos, conclui-se que a ilustração é, na singularidade do seu pensamento e enquanto recurso expressivo, configuradora de inovação semântica para o projecto de design de comunicação.
Resumo:
A presente tese apresenta-se num formato bipartido, sendo a primeira parte uma investigação teórica e a segunda parte um conjunto de composições originais que procuram estabelecer, directa e indirectamente, uma relação com a temática investigada. A investigação incide sobre as diferentes relações que se podem estabelecer entre estruturas intervalares e estruturas espectrais, a partir de um conjunto representativo de obras de diferentes compositores. As obras originais da segunda parte configuram um objecto final de análise e reflexão. As composições que integram a segunda parte da tese são: Inês – sete miniaturas sobre A Castro, para soprano e orquestra, sobre excertos de “Castro”, de António Ferreira; Um sino contra o tempo, para flauta, clarinete, percussão e piano; Terra, para orquestra de cordas; Dor e Amor, para voz, flauta, clarinete, percussão, harpa, piano, violino, viola e violoncelo, sobre poemas de Nuno Júdice; e Ode a Gaia, para soprano solo, coro misto e electrónica, a partir de textos de diversos autores e épocas, desde Homero a Fernando Pessoa. Esta investigação surge a partir da convicção de que é possível e enriquecedor para a composição a coexistência e o estabelecimento de uma relação entre estruturas que valorizam as qualidades dos intervalos que as constituem e estruturas de tipo espectral. Se o pensamento intervalar pode ser relacionado com princípios de estruturação ligados a toda uma tradição musical, desde a música modal, à tonal e à atonal, o pensamento espectral relaciona-se com o estudo do fenómeno sonoro e do timbre e é integrado mais tardiamente no séc. XX como um possível modelo estruturante na composição. A investigação sobre as obras seleccionadas, sobretudo de compositores que colocam o fenómeno da percepção num plano central, procura diferentes interacções entre os dois tipos de estrutura, interrogando-se sobre em que medida é que essa interacção influencia ou é mesmo determinante para o resultado musical final. São analisadas diferentes aplicações, tais como: a procura de qualidades acústicas na criação de estruturas intervalares, a criação de timbres particulares para linhas estruturantes, a manipulação tímbrica de estruturas verticais, a inter-relação de camadas intervalares e espectrais na textura musical de forma sincrónica e diacrónica, e o surgimento de material intervalar a partir de estruturas espectrais. Os principais resultados passam pela confirmação de que o pensamento intervalar é compatível com o pensamento espectral e vice-versa, podendo-se concluir que são essenciais diferentes funções para os dois tipos de estrutura na textura musical e que quer as estruturas intervalares quer as espectrais se relacionam com diferentes aspectos da percepção, tendo, assim, uma influência determinante no resultado musical final, na eficácia da escuta e na sua fruição.
Resumo:
The electronic storage of medical patient data is becoming a daily experience in most of the practices and hospitals worldwide. However, much of the data available is in free-form text, a convenient way of expressing concepts and events, but especially challenging if one wants to perform automatic searches, summarization or statistical analysis. Information Extraction can relieve some of these problems by offering a semantically informed interpretation and abstraction of the texts. MedInX, the Medical Information eXtraction system presented in this document, is the first information extraction system developed to process textual clinical discharge records written in Portuguese. The main goal of the system is to improve access to the information locked up in unstructured text, and, consequently, the efficiency of the health care process, by allowing faster and reliable access to quality information on health, for both patient and health professionals. MedInX components are based on Natural Language Processing principles, and provide several mechanisms to read, process and utilize external resources, such as terminologies and ontologies, in the process of automatic mapping of free text reports onto a structured representation. However, the flexible and scalable architecture of the system, also allowed its application to the task of Named Entity Recognition on a shared evaluation contest focused on Portuguese general domain free-form texts. The evaluation of the system on a set of authentic hospital discharge letters indicates that the system performs with 95% F-measure, on the task of entity recognition, and 95% precision on the task of relation extraction. Example applications, demonstrating the use of MedInX capabilities in real applications in the hospital setting, are also presented in this document. These applications were designed to answer common clinical problems related with the automatic coding of diagnoses and other health-related conditions described in the documents, according to the international classification systems ICD-9-CM and ICF. The automatic review of the content and completeness of the documents is an example of another developed application, denominated MedInX Clinical Audit system.
Resumo:
Esta dissertação pretende contribuir para a investigação em design, validando a interpretação como método em design aplicada a meta-projectos de cenários de equipamentos no século XXI. A análise e a avaliação dos dois conceitos - interpretação e cenário - como reflexo da maneira de pensar da contemporaneidade são a base para a estruturação de um meta-projecto aplicado na epiderme da cidade, sustentado pela metodologia projectual da hermenêutica e pela competência da semiótica. Este projecto de investigação organiza-se em duas partes; cada uma desenvolvida ao longo de três capítulos. No primeiro capítulo da primeira parte averigua-se o relacionamento entre a metodologia projectual aplicada por projectistas, desde o séc. XVII até aos nossos dias, e o pensamento filosófico para fundamentar a interpretação como método em design. No segundo capítulo analisa-se o cenário enquanto superfície vertical da cidade definida por um sistema de equipamentos. Por um lado, verifica-se que o equipamento ( équipement , Le Corbusier) é a proposta de ordem construtiva dos anos 20 e que a pattern ( pattern language , Alexander) é a ordem construtiva a partir dos anos 70. Por outro lado, averigua-se que hoje a superfície da cidade é constituída por várias camadas e que a camada superior é a epiderme. Enquanto película de sistema de patterns, a epiderme revela-se apta a deixar-se afectar pela mudança e, consequentemente, a ser trabalhada pelo design. O terceiro capítulo analisa a história da cultura da superfície dos edifícios no contexto ocidental, da Grécia Clássica aos nossos dias, para interpretar a proposta do design da epiderme. Para caracterizar a complexidade do período compreendido entre a acção metodológica de Le Corbusier nos anos 20 e o séc. XXI são comentados cinco momentos temáticos distintos. No primeiro capítulo da segunda parte escolhe-se o exercício do meta-projecto como instrumento de reflexão projectual dialéctico, definidor de uma metodologia projectual. O meta-projecto é analisado na realidade ocidental diacrónica e sincronicamente para fundamentar o conceito de junkspace como nova ordem. Neste sentido, são interpretados conceitos relativos à vivência urbana, reivindicando-lhes uma nova existência: a iluminação, a zona verde como pulmão da cidade, a energia interpretada como competência do cenário envolvente e o junkspace como nova ordem arquitectónica. No segundo capítulo define-se uma estratégia meta-projectual narrativa aplicada ao projecto da epiderme da cidade, destacando a particular importância do relacionamento entre a investigação em design e as empresas como fonte de inovação e de conhecimento. O terceiro capítulo defende um exercício experimental na área do projecto da epiderme dos edifícios como uma oportunidade para desenvolver diferentes propostas, partindo do mesmo brief. São apresentados resultados dos workshops inter-disciplinares entre o contexto académico e a realidade empresarial que alimentam o meta-projecto enquanto processo dialéctico, contínuo e inovador. Conclui-se com o argumento de que o design é uma disciplina com uma participação fundamental na valorização e na transformação das cidades do século XXI.
Resumo:
O presente trabalho inscreve-se no domínio da etnomusicologia e propõe-se abordar o fenómeno das bandas filarmónicas em Portugal numa perspetiva eminentemente histórica, usando como recursos metodológicos a pesquisa de arquivo e o trabalho de campo. Tomando como exemplo a Banda de Música de Santiago de Riba-Ul, que se autodesigna “a banda mais antiga de Portugal”, e tentando contextualizar a sua existência bicentenária no movimento filarmónico nacional, procurei explorar o desenvolvimento que o grupo teve ao longo do tempo, a partir da análise de documentos de arquivo em articulação com os discursos produzidos no domínio da oralidade e do periodismo local. Através da análise histórica reflito sobre movimentos semelhantes aos da implantação de agrupamentos filarmónicos na Europa, a estrutura democratizada e multifuncional que foram adquirindo ao longo do tempo, os espaços de ocorrência, o repertório e os instrumentos. Tendo em conta que o universo das bandas filarmónicas em Portugal representa ainda um domínio pouco estudado, procurei neste trabalho definir um quadro conceptual sobre as diferentes designações associadas a agrupamentos de sopro em Portugal, que recorre à história como ferramenta essencial para o entendimento da relação entre designações e conceitos a partir da análise de funções, contextos e repertórios. Através do estudo de caso da Banda de Música de Santiago de Riba-Ul, procurei estabelecer um modelo de análise que é revelador sobre o modo como, em muitos casos, as bandas usam o passado (real, imaginado, vivido ou mitificado), transformado em memória semântica, como forma de legitimar o presente, convertendo a própria banda num documento/monumento. Esse estatuto conduz à reprodução do modelo de polivalência que o passado lhe legou e oferece-lhe, através de um jogo coerente de cumplicidades no seio do movimento filarmónico em Portugal, um lugar cativo no macrocosmos que aqui defini como um campo social institucional, a partir da proposta conceptual de Bourdieu.
Resumo:
A exigente inovação na área das aplicações biomédicas tem guiado a evolução das tecnologias de informação nas últimas décadas. Os desafios associados a uma gestão, integração, análise e interpretação eficientes dos dados provenientes das mais modernas tecnologias de hardware e software requerem um esforço concertado. Desde hardware para sequenciação de genes a registos electrónicos de paciente, passando por pesquisa de fármacos, a possibilidade de explorar com precisão os dados destes ambientes é vital para a compreensão da saúde humana. Esta tese engloba a discussão e o desenvolvimento de melhores estratégias informáticas para ultrapassar estes desafios, principalmente no contexto da composição de serviços, incluindo técnicas flexíveis de integração de dados, como warehousing ou federação, e técnicas avançadas de interoperabilidade, como serviços web ou LinkedData. A composição de serviços é apresentada como um ideal genérico, direcionado para a integração de dados e para a interoperabilidade de software. Relativamente a esta última, esta investigação debruçou-se sobre o campo da farmacovigilância, no contexto do projeto Europeu EU-ADR. As contribuições para este projeto, um novo standard de interoperabilidade e um motor de execução de workflows, sustentam a sucesso da EU-ADR Web Platform, uma plataforma para realizar estudos avançados de farmacovigilância. No contexto do projeto Europeu GEN2PHEN, esta investigação visou ultrapassar os desafios associados à integração de dados distribuídos e heterogéneos no campo do varíoma humano. Foi criada uma nova solução, WAVe - Web Analyses of the Variome, que fornece uma coleção rica de dados de variação genética através de uma interface Web inovadora e de uma API avançada. O desenvolvimento destas estratégias evidenciou duas oportunidades claras na área de software biomédico: melhorar o processo de implementação de software através do recurso a técnicas de desenvolvimento rápidas e aperfeiçoar a qualidade e disponibilidade dos dados através da adopção do paradigma de web semântica. A plataforma COEUS atravessa as fronteiras de integração e interoperabilidade, fornecendo metodologias para a aquisição e tradução flexíveis de dados, bem como uma camada de serviços interoperáveis para explorar semanticamente os dados agregados. Combinando as técnicas de desenvolvimento rápidas com a riqueza da perspectiva "Semantic Web in a box", a plataforma COEUS é uma aproximação pioneira, permitindo o desenvolvimento da próxima geração de aplicações biomédicas.
Resumo:
Face à existência de um vazio teórico-conceptual e empírico no contexto investigativo português no que concerne à supervisão da investigação doutoral, este trabalho visa contribuir para a compreensão integrada deste fenómeno. Especificamente, com este estudo pretendemos construir um referencial de qualidade do processo de supervisão da investigação doutoral, em particular na ‘corporização’ dos perfis de qualidade dos dois mais importantes intervenientes - supervisores e estudantes de doutoramento – pela identificação de competências transversais às mais variadas áreas disciplinares. Desta forma, será possível desenhar-se, num futuro próximo, não só recomendações a nível institucional de índole mais praxiológica, como também um processo de avaliação e de monitorização adequado. Tendo em consideração o contexto português e o objetivo central do estudo, foram revisitados (i) discursos da política educativa de Ensino Superior de âmbito europeu e (ii) discursos fundamentados na investigação de índole internacional. Ambos permitiram contextualizar o fenómeno, perceber as tendências existentes, sintetizar as contribuições de variados referenciais e modelos existentes, e planear, em específico, a investigação, particularmente em termos de recolha de dados. A investigação, predominantemente de cariz qualitativo, foi conduzida na Universidade de Aveiro, tendo sido seguido o método de estudo de caso: baseou-se nas ‘vozes’ de supervisores e estudantes de doutoramento desta instituição relativamente ao que deve estar presente no processo de supervisão de investigação doutoral. A recolha de dados iniciou-se com entrevistas semiestruturadas, de âmbito exploratório, a especialistas em supervisão pedagógica - o tema semântica e epistemologicamente mais próximo do fenómeno em estudo. Foi realizada, pois, uma primeira aproximação ao ‘terreno’ a nível nacional e foram depuradas as dimensões que deveriam estar presentes no instrumento de recolha de dados do momento subsequente. Em seguida, foram realizados focus groups com supervisores e estudantes de doutoramento da Universidade de Aveiro. As conceções partilhadas em grupo puderam ser categorizadas segundo (i) o enquadramento do processo supervisivo e investigativo de doutoramento, nomeadamente no que concerne à natureza e ao valor do doutoramento atribuídos pelos participantes, assim como ao processo de transformação que experienciam; (ii) a qualidade do processo supervisivo e investigativo de doutoramento, consoante aspectos intrínsecos, dos quais se ressalta o perfil desejável de qualidade do supervisor e do estudante, pela identificação de um conjunto de competências fulcrais, e aspectos extrínsecos aos indivíduos; e (iii) os problemas do processo supervisivo e investigativo de doutoramento, considerando, novamente, aspectos intrínsecos e extrínsecos aos indivíduos. O último momento de recolha de dados foi realizado através da aplicação de questionários a supervisores e estudantes da Universidade de Aveiro. Assim, foi possível debruçarmo-nos especificamente sobre os perfis de qualidade de estudantes e supervisores. As competências integradas nos questionários foram provenientes dos resultados dos focus groups, tendo sido consideradas as mais importantes. Nos questionários foi solicitado aos respondentes que revelassem o seu grau de concordância relativamente às competências que deveriam fazer parte dos perfis de qualidade. Foi, então, possível proceder a uma análise e reflexão sobre o estabelecimento de uma hierarquia de competências, numa tentativa de depurar os perfis de qualidade dos elementos da díade supervisiva. Assim, conclui-se que há variáveis que podem influenciar o estabelecimento dessa hierarquia, reforçando que o processo supervisivo, quando refletido, avaliado e monitorizado, deve considerar diversos ‘contextos’ que o poderão influenciar. Todavia, há um conjunto de competências que parecem ‘isentas’ de influências, apesar de serem necessários estudos mais aprofundados para esclarecer esta assunção. Face a todo o percurso investigativo, apresenta-se, no final, um referencial de qualidade integrado e sistematizado, considerando o enquadramento teórico e o estudo empírico, assim como um sistema articulado de competências referente aos perfis de qualidade que supervisores e estudantes de doutoramento devem demonstrar e desenvolver.
Resumo:
O presente trabalho pretende contribuir para a definição de um paradigma teórico para o estudo do romance-diário em Portugal, assim como reconstituir a sua linhagem e incidência na narrativa portuguesa contemporânea. Apresenta-se, num primeiro momento, uma cartografia diacrónica da emergência e implantação do subgénero no campo literário português, desde finais do século XIX até à contemporaneidade, destacando os processos complementares de imitação e variação genológicas. Num segundo momento, partindo de um corpus constituído por cinco romances portugueses publicados nas últimas décadas do século XX, pretende-se averiguar algumas das modulações contemporâneas do romance-diário, por forma a demonstrar a capacidade de sobrevivência e renovação proteica da ficção diarística.
Resumo:
For the actual existence of e-government it is necessary and crucial to provide public information and documentation, making its access simple to citizens. A portion, not necessarily small, of these documents is in an unstructured form and in natural language, and consequently outside of which the current search systems are generally able to cope and effectively handle. Thus, in thesis, it is possible to improve access to these contents using systems that process natural language and create structured information, particularly if supported in semantics. In order to put this thesis to test, this work was developed in three major phases: (1) design of a conceptual model integrating the creation of structured information and making it available to various actors, in line with the vision of e-government 2.0; (2) definition and development of a prototype instantiating the key modules of this conceptual model, including ontology based information extraction supported by examples of relevant information, knowledge management and access based on natural language; (3) assessment of the usability and acceptability of querying information as made possible by the prototype - and in consequence of the conceptual model - by users in a realistic scenario, that included comparison with existing forms of access. In addition to this evaluation, at another level more related to technology assessment and not to the model, evaluations were made on the performance of the subsystem responsible for information extraction. The evaluation results show that the proposed model was perceived as more effective and useful than the alternatives. Associated with the performance of the prototype to extract information from documents, comparable to the state of the art, results demonstrate the feasibility and advantages, with current technology, of using natural language processing and integration of semantic information to improve access to unstructured contents in natural language. The conceptual model and the prototype demonstrator intend to contribute to the future existence of more sophisticated search systems that are also more suitable for e-government. To have transparency in governance, active citizenship, greater agility in the interaction with the public administration, among others, it is necessary that citizens and businesses have quick and easy access to official information, even if it was originally created in natural language.
Resumo:
O presente estudo tem como objectivo entender todo o universo anexo à performance do silêncio na música clássica contemporânea. Numa nova perspectiva: o estudo do impacto da ansiedade num músico que se observa e que observa a sua interação com o contexto artístico que o rodeia, são estudadas todas as variáveis com influência directa no acto de percepção e gestão dos momentos de ausência de som. Tendo por base os princípios da investigação qualitativa foi criado um modelo teórico de análise na área dos estudos em performance. Este modelo foi aplicado em dois recitais realizados na Universidade de Aveiro e num concerto do Remix Ensemble da Casa da Música do Porto. O uso de ferramentas de pesquisa: O teste do Cortisol e o uso do colete Vitaljacket®, permitiu observar comportamentos fisiológicos no performer e no público nunca antes relatados. Os principais resultados desta investigação permitem aferir a elevada complexidade do fenómeno perceptivo e performativo do silêncio na música contemporânea. A pesquisa realizada permitiu observar que o silêncio na música contemporânea acontece num contexto de elevada ambiguidade semântica e que a duração dada a este num concerto, está directamente dependente do quadro fisiológico observado no performer no momento do concerto. Foi ainda possível aferir que a repetição, numa data posterior, de um mesmo programa de concerto provoca uma acentuada descida dos níveis de ansiedade no performer e essa descida altera a forma como este gere, em concerto, os momentos de silêncio. As conclusões alcançadas em sede de investigação reforçam a pertinência deste estudo. São postas à prova concepções altamente empíricas sobre a performance dos silêncios em música contemporânea. As asserções formuladas têm impacto a nível pedagógico e didático. São apontadas direcções de investigação futura no sentido da valorização do estudo da gestão dos momentos de silêncio em performance.
Resumo:
Nos últimos anos temos vindo a assistir a uma mudança na forma como a informação é disponibilizada online. O surgimento da web para todos possibilitou a fácil edição, disponibilização e partilha da informação gerando um considerável aumento da mesma. Rapidamente surgiram sistemas que permitem a coleção e partilha dessa informação, que para além de possibilitarem a coleção dos recursos também permitem que os utilizadores a descrevam utilizando tags ou comentários. A organização automática dessa informação é um dos maiores desafios no contexto da web atual. Apesar de existirem vários algoritmos de clustering, o compromisso entre a eficácia (formação de grupos que fazem sentido) e a eficiência (execução em tempo aceitável) é difícil de encontrar. Neste sentido, esta investigação tem por problemática aferir se um sistema de agrupamento automático de documentos, melhora a sua eficácia quando se integra um sistema de classificação social. Analisámos e discutimos dois métodos baseados no algoritmo k-means para o clustering de documentos e que possibilitam a integração do tagging social nesse processo. O primeiro permite a integração das tags diretamente no Vector Space Model e o segundo propõe a integração das tags para a seleção das sementes iniciais. O primeiro método permite que as tags sejam pesadas em função da sua ocorrência no documento através do parâmetro Social Slider. Este método foi criado tendo por base um modelo de predição que sugere que, quando se utiliza a similaridade dos cossenos, documentos que partilham tags ficam mais próximos enquanto que, no caso de não partilharem, ficam mais distantes. O segundo método deu origem a um algoritmo que denominamos k-C. Este para além de permitir a seleção inicial das sementes através de uma rede de tags também altera a forma como os novos centróides em cada iteração são calculados. A alteração ao cálculo dos centróides teve em consideração uma reflexão sobre a utilização da distância euclidiana e similaridade dos cossenos no algoritmo de clustering k-means. No contexto da avaliação dos algoritmos foram propostos dois algoritmos, o algoritmo da “Ground truth automática” e o algoritmo MCI. O primeiro permite a deteção da estrutura dos dados, caso seja desconhecida, e o segundo é uma medida de avaliação interna baseada na similaridade dos cossenos entre o documento mais próximo de cada documento. A análise de resultados preliminares sugere que a utilização do primeiro método de integração das tags no VSM tem mais impacto no algoritmo k-means do que no algoritmo k-C. Além disso, os resultados obtidos evidenciam que não existe correlação entre a escolha do parâmetro SS e a qualidade dos clusters. Neste sentido, os restantes testes foram conduzidos utilizando apenas o algoritmo k-C (sem integração de tags no VSM), sendo que os resultados obtidos indicam que a utilização deste algoritmo tende a gerar clusters mais eficazes.