A evasão estudantil nas universidades vem se apresentando um problema recorrente e
preocupante no mundo ao longo dos anos, algo ainda mais alarmante no Brasil em suas
universidades públicas com orçamento oriundo dos cofres da nação, problema esse não
limitado ao prejuízo financeiro, mas também social e acadêmico. Diminuir a evasão se
torna uma ação importante nas universidades, sendo de grande ajudar um mecanismo para
classificar alunos ativos na sua predisposição para evadir. Esse trabalho se propõe, com a
ajuda do modelo de aprendizagem de máquina Random Forest, classificar e prever um
discente ativo como “Evadido”, podendo assim os interessados redirecionarem esforços para
evitar que o discente evada. Serão utilizados 2 estudos de casos, o primeiro utilizando dados
do curso de Ciência da Computação da Universidade Federal do Piauí (UFPI), e o segundo
com os discentes de 8 cursos de graduação do Centro de Ciências da Natureza(CCN)
da UFPI. O processo de aprendizagem segue o processo de Knowledge Discovery in
Databases (KDD), descrevendo o processo de coleta dos dados, pré-processamento e, por
fim, a mineração dos dados utilizando algoritmos de aprendizagem de máquina. O modelo
treinado é validado com métricas importantes como Accuracy, Recall, Precision, F1 Score,
Índice Kappa e curva ROC. Por fim, é realizada uma validação amostral e abstrata com
os dados referentes às instâncias ativas na tentativa de predição real na classificação.