Clustering de dados biomédicos com algoritmos baseados em critérios entrópicos
Contribuinte(s) |
Santos, Jorge M. |
---|---|
Data(s) |
03/06/2014
03/06/2014
2012
|
Resumo |
A procura de padrões nos dados de modo a formar grupos é conhecida como aglomeração de dados ou clustering, sendo uma das tarefas mais realizadas em mineração de dados e reconhecimento de padrões. Nesta dissertação é abordado o conceito de entropia e são usados algoritmos com critérios entrópicos para fazer clustering em dados biomédicos. O uso da entropia para efetuar clustering é relativamente recente e surge numa tentativa da utilização da capacidade que a entropia possui de extrair da distribuição dos dados informação de ordem superior, para usá-la como o critério na formação de grupos (clusters) ou então para complementar/melhorar algoritmos existentes, numa busca de obtenção de melhores resultados. Alguns trabalhos envolvendo o uso de algoritmos baseados em critérios entrópicos demonstraram resultados positivos na análise de dados reais. Neste trabalho, exploraram-se alguns algoritmos baseados em critérios entrópicos e a sua aplicabilidade a dados biomédicos, numa tentativa de avaliar a adequação destes algoritmos a este tipo de dados. Os resultados dos algoritmos testados são comparados com os obtidos por outros algoritmos mais “convencionais" como o k-médias, os algoritmos de spectral clustering e um algoritmo baseado em densidade. The search for patterns in data in order to find groups is known as clustering and is one of the most important tasks in pattern recognition and data mining. In this work, we explore entropy and the usefulness of some entropic algorithms to cluster biomedical data. The use of entropy in clustering is recent and comes as an attempt to take advantage from its capability of extracting higher order information from the data and use it as a criterion to form clusters or to improve/complement already existing algorithms, as a way of achieving better results. Some work with entropic algorithms have shown positive results on clustering real data. In this work, we have explored some entropic algorithms and its aplication to biomedical datasets, to evaluate if this algorithms are suitable to this kind of data. The results from these algorithms are compared with those obtained with more conventional ones, such as k-means, spectral clustering and density based clustering. |
Identificador |
http://hdl.handle.net/10400.22/4464 201744872 |
Idioma(s) |
por |
Publicador |
Instituto Politécnico do Porto. Instituto Superior de Engenharia do Porto |
Direitos |
openAccess |
Tipo |
masterThesis |