Atualizações Eventos

Projeto Céos representa UFSC e MPSC nas maiores conferências de IA e Ciência de Dados da América Latina

Um dos trabalhos apresentado pela equipe no SBBD aponta como a tecnologia desenvolvida pelo Projeto Céos pode gerar uma economia anual de até de até R$ 160.000,00 para o Ministério Público de Santa Catarina (MPSC). 


O Projeto Céos participou do 40º Simpósio Brasileiro de Banco de Dados, realizado entre os dias 29 de setembro e 2 de outubro em Fortaleza (CE). O evento, promovido em conjunto com a 35ª Conferência Brasileira sobre Sistemas Inteligentes (BRACIS), reuniu pesquisadores de todo o país nas áreas de ciência de dados e inteligência artificial.

Um dos trabalhos apresentado pela equipe no SBBD, “Language Models are not a Panacea: Combining them with Domain Knowledge and Efficient Indexes for Entity Linking”, aponta como a tecnologia desenvolvida pelo Projeto Céos pode gerar uma economia anual de até R$ 160.000,00 para o Ministério Público de Santa Catarina (MPSC). O estudo estima que este seria o custo (US$ 30.000,00) para analisar os milhões de itens de notas fiscais processadas anualmente por meio das principais ferramentas de inteligência artificial do mercado. A solução criada pela equipe do Céos, atinge praticamente a mesma acurácia de modelos como Claude 3.7 ou GPT-4o no reconhecimento de entidades como nomes de medicamentos, de princípios ativos e de textos que descrevem itens de notas fiscais. Modelos de linguagem são usados de maneira mais racional, somente para desambiguar ligações candidatas para cada item. Isso resulta em uma economia expressiva para os cofres públicos.

O pesquisador Hudson Afonso Batista da Silva apresentou o trabalho “Uma Abordagem para a Gestão da Linhagem de Dados Heterogêneos”, que propõe soluções para rastrear e garantir a confiabilidade de informações provenientes de múltiplas fontes — um dos principais desafios enfrentados pelo Projeto Céos no desenvolvimento de suas ferramentas de IA. Segundo Hudson, “a pesquisa propõe uma abordagem para aumentar a confiabilidade dos dados utilizados na identificação de possíveis fraudes em licitações por meio do painel inteligente desenvolvido pela equipe”.

Participaram do evento, como integrantes do Céos, a professora Jerusa Marchi, os professores Renato Fileto e Ronaldo Mello, além dos pós-graduandos Hudson Afonso, William Jones Beckhauser e Daniel Lucas.

Language Models are not a Panacea: Combining them with Domain Knowledge and Efficient Indexes for Entity Linking. Daniel Lucas Albuquerque, Vitória S. Santos, Pedro Nack, Renato Fileto, Carina F. Dorneles. SBBD 2025. doi.org/10.5753/sbbd.2025.247273.

Uma Abordagem para a Gestão da Linhagem de Dados Heterogêneos. Hudson A. B. da Silva, José E. M. Jochem, João V. dos Santos, Eduardo F. R. de Sousa, Ronaldo dos S. Mello, Carina F. Dorneles, Renato Fileto. Em: Anais do XL Simpósio Brasileiro de Banco de Dados (SBBD 2025), Fortaleza/CE. Sociedade Brasileira de Computação, Porto Alegre, p. 630–643. ISSN 2763-8979. https://doi.org/10.5753/sbbd.2025.247293.