GraphRAG vs Vector RAG: Quando Relacionamentos Importam Mais que Similaridade

Uma equipe de assuntos regulatórios pergunta ao seu sistema RAG: “Quais padrões ambientais em nossas operações na UE, Suíça e EAU se aplicam à nossa linha de processamento de alumínio, e quais de nossos três fornecedores tier-1 são certificados para esses padrões?” A busca vetorial retorna parágrafos relevantes sobre padrões ambientais. Retorna parágrafos sobre fornecedores. Não os conecta. A resposta exige percorrer relações de entidades em quatro conjuntos de documentos. Isso não é um problema de recuperação. É um problema de grafo.

O Vector RAG foi construído para uma classe diferente de pergunta.

A Pergunta que o Vector RAG Não Consegue Responder Bem

Recuperação vetorial é busca por similaridade sobre texto embutido. Dada uma consulta, retorna as passagens no corpus cujo embedding é mais próximo do embedding da consulta. Excelente em: encontrar a seção de um manual que explica X, trazer à superfície a política que cobre Y, recuperar a cláusula de um contrato que endereça Z.

Tem dificuldades com perguntas que exigem conectar entidades em múltiplos documentos. “Quais regulações afetam este processo?” fica respondível com algumas passagens de documentos relevantes. “Quais regulações em três jurisdições afetam este processo, e quais de nossos fornecedores estão implicados?” exige saber que regulação A na jurisdição 1 está conectada ao padrão B na jurisdição 2, que é exigido pela certificação C de fornecedor na jurisdição 3. Essa cadeia de conexões não está em nenhuma passagem isolada. Está nas relações entre entidades.

A distinção é similaridade semântica versus percurso relacional. São operações diferentes. Um sistema otimizado para uma tem desempenho ruim na outra.

Perguntas multi-hop, onde a resposta exige conectar entidades nomeadas em múltiplos documentos através de múltiplos tipos de relacionamento, são onde o Vector RAG degrada e a recuperação baseada em grafo ganha.

O Que o GraphRAG Realmente Faz

A hybrid retrieval map where vector search finds entry passages and graph traversal connects suppliers, certifications, regulations, and processes.

A abordagem Microsoft GraphRAG pega um corpus de documentos e usa um LLM para extrair entidades e relacionamentos. Um contrato referencia um fornecedor. Um fornecedor detém uma certificação. Uma certificação satisfaz um requisito regulatório. As entidades e relacionamentos extraídos formam um grafo de conhecimento. A recuperação percorre o grafo em vez de, ou além de, buscar no espaço vetorial.

Duas variantes endereçam preocupações específicas de custo:

LazyGraphRAG (Microsoft Research): adia a extração de entidades até o momento da consulta, construindo resumos de comunidades de forma lazy na primeira consulta em vez de indexar o grafo completo antecipadamente. Reduz substancialmente o custo de construção do grafo para corpora grandes. O tradeoff é latência na primeira consulta.

HippoRAG [ESTIMATIVA: verificar paper original]: inspirado na memória associativa humana, usa estrutura de grafo para simular a forma como o hipocampo vincula memórias através de contexto compartilhado. Particularmente eficaz para recuperação multi-hop onde a conexão entre consulta e resposta percorre entidades intermediárias.

GraphRAG Híbrido: busca vetorial identifica pontos de entrada no corpus (os documentos ou passagens mais relevantes para a consulta), depois o percurso de grafo explora relações de entidades a partir desses pontos de entrada. Os dois mecanismos são complementares: busca vetorial para relevância, percurso de grafo para conectividade.

O tradeoff de custo é real e vale afirmar claramente: a construção do grafo é mais cara e complexa do que a indexação vetorial. A qualidade da extração de entidades determina a qualidade do grafo. Extração de entidades ruim, onde o LLM identifica erroneamente entidades, cria relacionamentos espúrios ou perde conexões importantes, produz um grafo que recupera pior do que o vetorial isolado. O retorno da estrutura de grafo está em tipos de consulta que exigem raciocínio relacional. Aplicá-lo a consultas que não o exigem adiciona custo sem adicionar qualidade.

Os Casos de Uso Corporativos que Favorecem Grafos

O padrão que identifica um caso de uso adequado para grafo: a consulta tem a estrutura “encontrar entidades do tipo A que estão conectadas a entidades do tipo B via relacionamento C.”

Consultas de cadeia de compliance: “Quais requisitos regulatórios se aplicam ao processo X nas jurisdições A, B e C?” Requisitos regulatórios existem como entidades. Processos existem como entidades. Jurisdições existem como entidades. As relações entre eles abrangem múltiplos documentos regulatórios que nunca foram escritos para serem lidos juntos. O percurso de grafo reconstrói a cadeia; a busca vetorial retorna passagens individuais que o usuário deve conectar manualmente.

Conhecimento organizacional: “Quem em nossa organização trabalhou em projetos envolvendo tecnologia X com o cliente Y?” Pessoas, projetos, tecnologias e clientes são entidades. Seus relacionamentos são o conhecimento. Nenhum documento isolado contém essa resposta. A resposta é construída percorrendo a rede de entidades.

Análise de contratos: “Quais de nossos contratos de fornecedores referenciam cláusulas de force majeure que incluem cenários de pandemia, e quais desses fornecedores também têm pedidos de compra abertos acima de um valor limite?” Isso exige extração de entidades (contratos, fornecedores, cláusulas, pedidos de compra), identificação de relacionamentos (contrato referencia fornecedor, contrato contém cláusula, fornecedor tem pedidos de compra) e percurso multi-hop de dados de contrato e ERP simultaneamente.

Conhecimento de produto: “Quais de nossas linhas de produto têm componentes fornecidos pelo fornecedor X, e quais desses componentes têm incidentes de qualidade abertos?” Relações de lista de materiais mais vinculação de incidentes de qualidade. Um percurso de grafo. Não uma busca semântica.

O Stack de Ponta em 2026

Neo4j 5.x: banco de dados de grafo de nível de produção com suporte nativo a índice vetorial. Consultas híbridas de grafo mais vetor executam em uma única consulta contra um único banco de dados. Percurso de grafo e busca semântica não são sistemas separados. Para organizações que precisam de ambos os tipos de recuperação, o Neo4j elimina a complexidade de integração de manter repositórios de grafo e vetorial separados. A adoção corporativa em grandes organizações financeiras e tecnológicas está confirmada em estudos de caso públicos.

Microsoft GraphRAG (open source, Apache 2.0): pipeline de extração de entidades, detecção de comunidade para síntese de consultas globais e dois modos de consulta: global (sintetiza em resumos de comunidade, apropriado para perguntas analíticas amplas) e local (recuperação focada em entidades, apropriado para consultas de entidades específicas). O repositório GitHub está disponível publicamente; verifique o status atual de licença e manutenção antes de adotar.

LazyGraphRAG: a variante com custo otimizado para organizações onde o custo de construção upfront do grafo é a barreira principal. Comece com isso se o custo de indexação completo do Microsoft GraphRAG for proibitivo.

Um esclarecimento de nomenclatura que vale fazer explicitamente: LangGraph é um framework de orquestração de agentes da LangChain. Não é um sistema de recuperação de grafo. Gerencia grafos de estado de agentes, ramificações e ciclos. Seu nome cria confusão em discussões que misturam orquestração de agentes com GraphRAG. São ferramentas diferentes resolvendo problemas diferentes.

Quando Vector RAG Ainda É a Escolha Certa

A maioria das cargas de trabalho corporativas de Q&A sobre documentos é respondível com Vector RAG bem implementado. A tendência de alcançar complexidade de grafo antes de validar se a recuperação vetorial está realmente falhando é um padrão que vale resistir.

Para Q&A em documento único, busca de procedimentos, recuperação de cláusulas e perguntas sobre políticas com uma única jurisdição, Vector RAG hierárquico com hybrid search supera grafo a custo e complexidade substancialmente menores. A construção do grafo adiciona uma etapa de extração intensiva em LLM, um banco de dados de grafo para manter e lógica de percurso para depurar. Se o tipo de consulta não exige vinculação de entidades entre documentos, essa complexidade não tem retorno.

O framework de decisão:

Se o tipo de consulta exige encontrar texto relevante dentro de documentos: use Vector RAG, invista em qualidade de recuperação
Se o tipo de consulta exige encontrar entidades e percorrer relacionamentos entre documentos: adicione uma camada de grafo
Se incerto: registre os tipos de consulta em que o Vector RAG falha; se o padrão de falha for multi-entidade multi-documento, esse é o sinal para avaliar grafo

Um ponto adicional que o entusiasmo por arquiteturas híbridas às vezes obscurece: um grafo medíocre mais um repositório vetorial medíocre é pior do que um repositório vetorial excelente isolado. A qualidade da extração de entidades condiciona o grafo inteiro. Se a extração é não confiável, o grafo recupera relacionamentos incorretos com confiança. Recuperação vetorial excelente sobre documentos bem ingeridos não tem esse modo de falha composto.

Híbrido não é sempre melhor. A sofisticação está em escolher a arquitetura certa para o tipo de consulta, não em implantar a mais complexa.

Caminho de Migração Prático

A migração de Vector RAG puro para grafo mais vetor híbrido não é uma substituição. É uma adição. A sequência que evita disrupção:

Comece com Vector RAG. Implante, instrumente e construa um harness de avaliação. Estabeleça um baseline de qualidade. Identifique os tipos específicos de consulta onde o sistema falha.

Classifique o padrão de falha. Se as consultas com falha seguem o padrão multi-entidade multi-documento, esse é o sinal. Se falham por outros motivos (chunking ruim, metadados faltando, alucinação por lacunas de contexto), endereçe isso primeiro. Grafo não adiciona valor quando a recuperação vetorial subjacente está quebrada.

Execute extração de entidades como enriquecimento em background. A construção do grafo pode prosseguir em paralelo com as operações de RAG no corpus existente. Não exige desligar o sistema. O grafo fica disponível como caminho adicional de recuperação sem interromper o existente.

Arquitetura de produção: Neo4j com índice vetorial e property graph para a camada de recuperação dual, LangGraph como orquestração de agentes se a recuperação envolver raciocínio multi-etapa, RAGAS para métricas de avaliação em ambos os tipos de recuperação e LangSmith ou Langfuse para observabilidade.

O pipeline de ingestão que alimenta sistemas vetoriais e de grafo é onde a maioria dos problemas de qualidade se origina. Essa arquitetura está coberta em O Pipeline de Ingestão Que Ninguém Discute.

Para equipes corporativas avaliando integração de knowledge graph como parte de uma arquitetura AI-First, o AI Opportunity Sprint mapeia a decisão antes da construção começar.