• O sistema entrará em processo de atualização de funcionalidades às 22:30. Pedimos a todos que salvem seus trabalhos para que não haja transtornos.
    Agradecemos a compreensão, em 15 minutos o sistema estará de volta.
Notícias

Banca de DEFESA: ANNE CAROLINNE CARVALHO GALDINO

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE: ANNE CAROLINNE CARVALHO GALDINO
DATA: 18/03/2026
HORA: 09:00
LOCAL: Google Meet - https://meet.google.com/ydt-igwf-dro
TÍTULO: Metodologia de Imputação de Dados Ausentes Orientada pelo Perfil Estatístico: Uma Abordagem Híbrida Baseada em Variância e Correlação
PALAVRAS-CHAVES: Predição de Dados Ausentes, Machine Learning, Datasets Clínicos, Metodologia, Imputação de Dados, Definição de Limiares, Modelagem Preditiva, Pré-processamento de Dados
PÁGINAS: 48
GRANDE ÁREA: Ciências Exatas e da Terra
ÁREA: Ciência da Computação
SUBÁREA: Metodologia e Técnicas da Computação
ESPECIALIDADE: Sistemas de Informação
RESUMO:

A qualidade dos dados é fundamental para a confiabilidade de sistemas de apoio à decisão e modelos de Inteligência Artificial, especialmente no contexto de bases de dados heterogêneas e desbalanceadas, onde a integridade da informação é crítica. No entanto, a presença de dados faltantes (missing values) representa um desafio estrutural que, se tratado inadequadamente, introduz vieses severos. O objetivo deste trabalho foi desenvolver e validar uma Metodologia de Imputação Híbrida Orientada pelo Perfil Estatístico, integrando algoritmos de Imputação Multivariada (MICE com Random Forest) e técnicas de Discretização Adaptativa para variáveis de alta variância. Para tanto, realizou-se uma pesquisa experimental aplicada, utilizando datasets reais de alta complexidade (Kala-Cal e BRFSS). A validação ocorreu através da análise comparativa entre a proposta e métodos clássicos (baselines) como a Média, Mediana e KNN, avaliando-se não apenas métricas de erro, mas também a preservação das distribuições originais. Os resultados indicaram que a abordagem diagnóstica obteve desempenho superior, garantindo a convergência em variáveis onde a regressão linear falhou e preservando a variabilidade natural dos dados, o que representa uma melhoria significativa frente à aplicação monolítica de algoritmos. Conclui-se que a técnica proposta é viável e eficaz para maximizar a fidelidade estatística no tratamento de dados incompletos, mitigando riscos de “alucinações” em modelos preditivos subsequentes.

 


MEMBROS DA BANCA:
Presidente - 1446435 - VINICIUS PONTE MACHADO
Interno - 1744590 - GUILHERME AMARAL AVELINO
Interno - 2167802 - PEDRO DE ALCANTARA DOS SANTOS NETO
Externo à Instituição - 310.***.***-23 - RICARDO AUGUSTO SOUZA FERNANDES - USP
Notícia cadastrada em: 23/02/2026 14:15
SIGAA | Superintendência de Tecnologia da Informação - STI/UFPI - (86) 3215-1124 | © UFRN | sigjb05.ufpi.br.instancia1 24/02/2026 22:38