Confira os destaques recentes do Projeto Céos
Destaques do mês de novembro na Linha 1
Dedicada à detecção de fraudes em compras públicas, a equipe da Linha 1 do Projeto Céos registrou importantes avanços nas pesquisas realizadas em novembro. Os pesquisadores desenvolveram uma nova metodologia para identificar e agrupar itens de notas fiscais de medicamentos por meio de técnicas de Machine Learning, alcançando maior precisão em relação a abordagens que dependem exclusivamente do código GTIN.
A solução organiza dados das bases oficiais da ANVISA e da CMED em entidades únicas — considerando características como princípio ativo, concentração e forma farmacêutica — e cruza essas informações com as descrições presentes nas notas fiscais, mesmo quando há inconsistências ou variações nos textos. Depois dessa etapa, regras heurísticas eliminam alternativas incompatíveis. Já nos casos em que ainda há ambiguidade, a desambiguação é realizada pelos “Small Language Models” (SLMs) de código aberto executados localmente (on-premise), método que preserva a privacidade dos dados e reduz custos de processamento.
Segundo Márcio Castro, coordenador da Linha 1 e professor do Programa de Pós-Graduação em Ciência da Computação (PPGCC), “o avanço representa um marco importante para o projeto, pois possibilita um agrupamento de melhor qualidade uma vez que muitos medicamentos são cadastrados com código GTIN incorreto”.
