Dejá de Quemar Tokens: Cómo un Knowledge Graph Hace que tu Agente Entienda tu Repo

Dejá de Quemar Tokens: Cómo un Knowledge Graph Hace que tu Agente Entienda tu Repo

Hay un patrón que seguramente ya viste a tu coding agent repetir. Le preguntás dónde se usa una función. Hace grep. Lee un archivo. Hace grep de nuevo. Abre tres archivos más, los lee de arriba a abajo, y doce tool calls después te da una respuesta —habiendo gastado una pequeña fortuna en tokens para reconstruir algo que el “find references” de tu IDE hace al instante.

El problema no es el agente. Es que el agente no tiene un mapa. En cada sesión, redescubre tu codebase desde cero, leyendo un archivo a la vez.

codebase-memory-mcp, de DeusData, es una apuesta a que esto se puede arreglar. Indexa todo tu repositorio en un knowledge graph persistente —funciones, clases, call chains, HTTP routes, links entre servicios— y se lo expone a tu agente a través de 14 MCP tools. En vez de hacer grep y leer, el agente consulta un graph. El repo está en torno a las 20.9K estrellas y creciendo rápido, lo que te dice que el dolor de cabeza es bastante compartido.

Qué hace en concreto

La propuesta es velocidad y eficiencia. Parsea código con análisis de AST vía tree-sitter en 158 lenguajes, potenciado con resolución semántica de tipos basada en LSP para los más pesados (Python, TypeScript/JavaScript, Go, Rust, C/C++, Java, Kotlin, C#, PHP). El resultado es un knowledge graph persistente en SQLite que sobrevive entre sesiones —así tu agente no arranca de cero cada vez.

El indexado es el titular. El proyecto afirma que full-indexa un repo promedio en milisegundos y todo el kernel de Linux —28M de líneas, 75K archivos— en unos tres minutos, respondiendo structural queries en menos de un milisegundo. El pipeline RAM-first (compresión LZ4, SQLite in-memory) libera la memoria una vez que termina de indexar.

Un watcher thread en segundo plano monitorea los cambios de archivos y reindexar solo lo que cambió, así el graph se mantiene actualizado sin un re-parse completo.

El argumento de los tokens

Esta es la parte que vale la pena leer con atención, porque es la razón de ser de la herramienta. El proyecto reporta que cinco structural queries cuestan alrededor de 3.400 tokens a través del graph versus unos 412.000 tokens vía exploración archivo por archivo —lo que enmarcan como unas 120x menos tokens. También hay un preprint (arXiv:2603.27277) que describe benchmarks sobre 31 repos reales, reportando 83% de calidad de respuesta con cerca de 10x menos tokens y 2.1x menos tool calls que la exploración archivo por archivo.

Vale aclararlo: estos son los números del propio proyecto, y el paper de arXiv es un preprint del mismo equipo —no una validación independiente. Tomalos como una afirmación fuerte para probar en tu propio repo, no como un hecho cerrado. Dicho eso, el mecanismo tiene sentido: una sola query al graph realmente reemplaza decenas de ciclos de grep/read, y eso es algo que podés verificar vos mismo en una sola sesión.

Instalación y alcance

Esta es la parte que hace fácil probarlo de verdad. Ships como un único binario estático para macOS, Linux y Windows —sin Docker, sin runtime dependencies, sin API keys. Descargás, corrés install, reiniciás tu agente, listo. El instalador autodetecta y configura en 11 coding agents, incluyendo Claude Code, Codex CLI, Gemini CLI, Zed, OpenCode, Aider y otros —así que no es una jugada exclusiva de Claude Code.

También hay una visualización 3D del graph integrada (en la variante UI) que te deja explorar el knowledge graph en tu navegador en localhost —útil para ver de verdad la forma de un codebase que heredaste.

¿Vale la pena?

Si trabajás en repos grandes o multi-servicio donde tu agente gasta plata real redescubriendo la estructura en cada sesión, este es un experimento de alto valor con un costo de entrada bajo: un binario, un comando de install. Las afirmaciones de eficiencia son self-reported y deberías verificarlas en tu propio código —pero la idea central, darle a tu agente un mapa persistente en vez de hacerlo reexplorar cada vez, es ese tipo de win de hacer-más-con-menos que cuesta discutir una vez que sentiste la factura de tokens.