Últimas Notícias
Banca de DEFESA: FLÁVIO JOSÉ SCHAEFER FERLIN
Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE: FLÁVIO JOSÉ SCHAEFER FERLIN
DATA: 20/02/2026
HORA: 08:30
LOCAL: Virtual - meet.google.com/ftp-qrhg-bga
TÍTULO: Apparent Attention in Classrooms: Probing Vision Models with Synthetic Data
PALAVRAS-CHAVES: Fisher Information; Information Geometry; Linear Discriminant Analysis; representation learning; dados sintéticos; Vision Foundation Models; atenção visualmente aparente
PÁGINAS: 93
GRANDE ÁREA: Ciências Exatas e da Terra
ÁREA: Ciência da Computação
SUBÁREA: Sistemas de Computação
ESPECIALIDADE: Arquitetura de Sistemas de Computação
RESUMO:

Ao modelar a atenção visualmente aparente em cenas de sala de aula, um dataset gerado sinteticamente e rotulado por modelos visão–linguagem — construído sob recursos computacionais limitados — fornece uma forte base empírica para avaliar o grau de maturidade de representações visuais pré-treinadas contemporâneas. Os resultados reforçam uma interpretação operacional de boas representações, como aquelas que permitem a extração eficiente de informação relevante à tarefa por meio de classificadores simples. Nesse contexto, análises sensíveis à variância e relacionadas à tarefa, tendo por objeto a geometria do embedding em modelos visuais pré-treinados contemporâneos, demonstram que um contraste binário atento versus desatento se organiza ao longo de uma única direção discriminativa dominante em espaços de embedding de alta dimensionalidade. Essa estrutura fortemente anisotrópica está presente em representações congeladas e pode ser exposta de modo confiável com pouquíssimos dados, como se observa na saturação rápida das curvas de aprendizado e na sensibilidade limitada ao aumento da capacidade de adaptadores, indicando que a maior parte do sinal relevante à tarefa é acessível sem necessidade de adaptações.

Motivado pela hipótese de que Vision Foundation Models codificam variação estruturada associada ao comportamento de atenção visualmente aparente, este trabalho adota uma perspectiva centrada em representações, que prioriza análise geométrica ao invés de end-to-end optimization. Assim, o reconhecimento de atenção visualmente aparente é tratado não como um problema de supervised decoding, mas como uma investigação sobre como a estrutura alinhada à tarefa é organizada e revelada dentro de espaços de embeddings pré-treinados.

Para testar essa hipótese sob condições controladas, um dataset sintético de sala de aula — que será disponibilizado publicamente — é construído como um instrumento experimental para perturbar seletivamente pistas de atenção visualmente aparentes ao longo de diversas atividades em sala e configurações comportamentais, mantendo um rótulo alvo binário atento versus desatento, sem tratar dados sintéticos como um substituto para distribuições do mundo real. Anotações comportamentais para o alvo binário são fornecidas por modelos multimodais visão-linguagem. Os embeddings congelados de Vision Foundation Models e de um baseline convolucional são avaliados como objetos geométricos sob regimes de readout com capacidade variável. O desempenho é avaliado por métricas padrão de classificação (Macro-F1 e ROC–AUC), enquanto a estrutura induzida pela tarefa é examinada por meio de projeções sensíveis à variância (Linear Discriminant Analysis) e espectros empíricos da Fisher Information.

Os resultados mostram que a separabilidade emerge com poucas amostras e rapidamente entra em platô, enquanto o aumento da capacidade de readout amplifica principalmente a sensibilidade ao longo da mesma direção dominante, em vez de revelar eixos de tarefa adicionais e independentes. O baseline convolucional exibe uma geometria task-induced comparável, porém com menor eficiência representacional. Em conjunto, esses resultados fornecem evidência quantitativa e não anedótica de que, para as distinções comportamentais consideradas, representações visuais pré-treinadas e congeladas já expõem a maior parte da estrutura relevante à tarefa quando combinadas com downstream readouts leves, indicando que, nesse regime, adaptadores simples costumam ser suficientes, com benefício marginal limitado de task-specific fine-tuning. De forma mais ampla, esses achados motivam o uso de diagnósticos geométricos e de teoria da informação, como ferramentas para caracterizar tanto as capacidades quanto os limites das representações visuais modernas.


MEMBROS DA BANCA:
Presidente - 1177449 - IVAN SARAIVA SILVA
Interno - 1350246 - KELSON ROMULO TEIXEIRA AIRES
Interno - 1446435 - VINICIUS PONTE MACHADO
Externo à Instituição - 792.***.***-72 - BRUNO MOTTA DE CARVALHO - UFRN

Cadastrada em: 19/02/2026
Mais Notícias
Processos Seletivos Veja abaixo os processos seletivos disponíveis para nosso Programa de Pós-Graduação.
Calendário Fique por dentro dos eventos relacionados ao nosso Programa de Pós-Graduação.
  • 24/02/2026 - 27/02/2026 · Matrícula para o período 2026.1.
  • 10/03/2026 · Início do período letivo 2026.1.
SIGAA | Superintendência de Tecnologia da Informação - STI/UFPI - (86) 3215-1124 | © UFRN | sigjb03.ufpi.br.instancia1 21/02/2026 13:32