News

Banca de QUALIFICAÇÃO: MARCEL RAIMUNDO DE SOUZA MOURA

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE: MARCEL RAIMUNDO DE SOUZA MOURA
DATA: 18/11/2019
HORA: 14:00
LOCAL: Sala de Aula - PPgCC
TÍTULO: Rotulação Automática de Clusters Baseada em Interdependência Cluster-Atributo
PALAVRAS-CHAVES: Rotulação, Agrupamento, Discretização
PÁGINAS: 62
GRANDE ÁREA: Ciências Exatas e da Terra
ÁREA: Ciência da Computação
SUBÁREA: Sistemas de Computação
ESPECIALIDADE: Arquitetura de Sistemas de Computação
RESUMO:

O agrupamento de dados por métodos não-supervisionados é uma área de pesquisa relevante em Aprendizado de Máquina. O objetivo do clustering é agrupar os objetos de um conjunto de dados de modo que cada grupo seja constituído por aqueles similares, que possuem características que os tornam agrupáveis e essas mesmas características devem ser suficientes em distingui-los de outros grupos. Para que o agrupamento de dados seja aplicável, a tarefa de interpretação dos grupos é fundamental e diante desta necessidade surge o problema de rotulação. Este trabalho apresenta um método não- supervisionado de rotulação de clusters que emprega uma versão modificada do algoritmo de discretização CAIM a fim encontrar faixas de valores representativas nos atributos que serão relevantes para interpretação dos clusters. Para aplicação do modelo proposto, é necessária uma técnica de agrupamento não-supervisionado que formará os clusters. Nos atributos numéricos contínuos do conjunto de dados é utilizada uma discretização que considera o índice de interdependência entre estes atributos e os clusters formados na fase de agrupamento. Do processo de discretização dos atributos resultarão faixas de valores que serão analisadas e comparadas com os valores ocorrentes dos atributos em cada cluster, para determinar os atributos e faixas de valores representativas. Estes atributos e faixas de valores expressivos formarão o rótulos para cada cluster. O modelo proposto nessa pesquisa buscou obter um método que mitigasse as limitações observadas em outros trabalhos que propunham rotulação automática de clusters. Os testes resultam em uma acurácia média dos rótulos sugeridos de 98.03% considerando todas as bases de dados testadas. Estes rótulos são constituídos por poucos atributos e em 94.5% dos casos um atributo é suficiente para defini-lo.


MEMBROS DA BANCA:
Interno - 1350246 - KELSON ROMULO TEIXEIRA AIRES
Interno - 1579396 - RODRIGO DE MELO SOUZA VERAS
Presidente - 1446435 - VINICIUS PONTE MACHADO
Notícia cadastrada em: 11/11/2019 23:13
SIGAA | Superintendência de Tecnologia da Informação - STI/UFPI - (86) 3215-1124 | © UFRN | sigjb03.ufpi.br.sigaa 19/04/2024 18:23