Identificar semelhança nos dados de teste que não foram rotulados, classificados ou categorizados é uma das funções do aprendizado não supervisionado. A clusterização é uma técnica que permite dividir automaticamente o conjunto de dados de acordo com uma similaridade. É muito importante, além de identificar os grupos (clusters) formados, compreendê-los. A grande vantagem do uso das técnicas de clusterização é que, ao agrupardados similares, pode-se descrever de forma mais eficiente e eficaz as características peculiares de cada um dos grupos identificados. Este trabalho tem como objetivo estudar a formação desses grupos e a interpretação deles através de rótulos. Para isso, é necessárioutilizar técnicas com aprendizagem de máquina não supervisionada, a aplicação dos filtros de ganho de informação através da seleção de atributos e um modelo de discretização.Um algoritmo de aprendizagem não supervisionado é aplicado para formação dos clusters. Então se aplica os filtros de seleção de atributos para apresentar os atributos que possuem grande relevância e ainda, um modelo de discretização, no cálculo da variação de valores dos dados e gera a rotulação. Foi aplicado a metodologia proposta em 3 base de dados distintas, na qual a base Iris aplicando os 3 filtros de seleção de atributos foi a que apresentou melhores resultados. Uma média de 96% de rótulos corretos como resultado.