Retrieval-Augmented Generation (RAG)

Fontes e contexto para
respostas rastreáveis.

RAG é uma capacidade interna da Apeirum: a busca recupera contexto aprovado antes da geração para apoiar respostas mais revisáveis.

Ingestão e Parsing

Extraímos texto de PDFs, DOCX e MD com reconhecimento de estrutura, tabelas e metadados.

Dividimos o conteúdo em blocos semânticos para preservar contexto e melhorar a recuperação.

Utilizamos embeddings de alta densidade para encontrar os trechos mais relevantes para a sua pergunta.

Os trechos selecionados compõem o contexto da resposta para facilitar revisão e reduzir resposta sem lastro.

O fluxo é desenhado para recuperar o trecho certo, reduzir ruído e deixar a resposta pronta para revisão.

Otimização de Query (Multi-query retrieval)

Re-ranking de resultados por relevância semântica

Controle de janela de contexto dinâmico

Citação direta de fontes (rastreabilidade)

RAG_PIPELINE_TRACE.log

[PROCESS] Ingesting Document: Contrato_Alpha.pdf

[STEP 1] OCR_Engine: Success (32 pages extracted)

[STEP 2] Semantic_Chunking: 142 segments created

[STEP 3] Vector_Sync: Upserting to private_namespace_712

[QUERY] "Qual o prazo de rescisão?"

[SEARCH] Top-k results fetched from VectorDB

[RE-RANK] Higher priority given to Clause 12.1

[INJECT] Prompt augmented with 3 verified sources

[RESPONSE] Generated based on injected sources.

Veja como a API organiza entrada, recuperação, resposta revisável e saída estruturada.