Agentmemory: Memoria Persistente para Claude Code — 92% Menos Tokens

Ya te pasó. Sesión uno, le explicás toda tu arquitectura de autenticación a Claude Code. Sesión dos, la estás explicando de nuevo. Tu CLAUDE.md arrancó con 20 líneas y ahora tiene 300 — un monstruo que se vuelca entero al contexto lo necesites o no. Al segundo mes de uso serio, ese archivo solo te está costando 22.000+ tokens por sesión, y la mayoría es información desactualizada.

agentmemory es la solución. Es una capa de memoria local que corre como servidor MCP junto a tu agente, captura silenciosamente lo que el agente hace, comprime esas observaciones en memorias estructuradas y buscables, e inyecta solo el contexto relevante al inicio de cada nueva sesión.

El benchmark que lo hizo trending esta semana: con 240 observaciones, un CLAUDE.md vuelca 22.000+ tokens al contexto. agentmemory usa ~1.900 — una reducción del 92%. Las mismas observaciones. El mismo historial. Solo recuperación más inteligente.

El problema que resuelve

Los LLMs son stateless por diseño. Cada sesión arranca desde cero. Los workarounds que los devs construyeron — archivos CLAUDE.md, .cursorrules, el ritual de pegar-tu-contexto-acá — comparten el mismo defecto: son manuales, crecen sin límite, y cargan todo independientemente de la relevancia.

agentmemory toma un camino distinto. En vez de un archivo plano, construye un store de memoria indexado. Captura decisiones, incidentes, archivos tocados, enfoques fallidos y resultados de herramientas. Cuando arranca una nueva sesión, recupera solo lo relevante para la tarea actual — no todo lo que hiciste alguna vez.

La diferencia en la práctica: si el lunes configuraste JWT auth y elegiste jose sobre jsonwebtoken por compatibilidad con Edge, el jueves tu agente ya lo sabe. No re-explicás. No pegás. Simplemente lo sabe.

Cómo funciona

agentmemory corre como servidor local (por defecto: localhost:3111) con un viewer en localhost:3113. El setup es un solo comando:

npx @agentmemory/agentmemory

Para Claude Code específicamente, se integra vía hooks — el mismo mecanismo que Claude Code usa para callbacks pre/post ejecución de herramientas. Una vez instalado, captura automáticamente eventos del ciclo de sesión, llamadas a herramientas, mensajes y resultados de tareas sin ningún cambio en tu workflow.

El motor de memoria usa recuperación híbrida: búsqueda por keywords BM25 + embeddings vectoriales + una capa de knowledge graph para relaciones entre entidades. Un ciclo de compresión por hora fusiona observaciones duplicadas, decae entradas obsoletas con scoring de retención y genera un audit trail limpio. En el benchmark LongMemEval-S, este pipeline alcanza 95,2% R@5 — el recuerdo correcto aparece entre los primeros 5 resultados el 95% del tiempo.

Los embeddings vectoriales corren localmente usando @xenova/transformers, lo que significa cero llamadas externas a APIs para operaciones de memoria y un costo estimado de ~$10/año con modelos en la nube, o gratis con inferencia local.

Compatibilidad con agentes

Acá es donde agentmemory se diferencia de las soluciones específicas para Claude. Funciona con cualquier agente que hable MCP o HTTP — lo que en 2026 significa prácticamente todo:

Claude Code, Cursor, Codex CLI, Gemini CLI, Windsurf, Kilo Code, OpenCode, Cline, Roo Code, Goose, Aider, Hermes y OpenClaw tienen integraciones confirmadas. Un servidor, memorias compartidas entre todos ellos. Si cambiás de herramienta a mitad de un proyecto, tu memoria te acompaña.

La REST API (/agentmemory/*) permite que cualquier agente sin soporte nativo de MCP igualmente consulte el store de memoria vía HTTP.

Qué se recuerda

agentmemory está diseñado específicamente para memoria operacional — no historial de chat. La distinción importa.

Captura: decisiones de arquitectura, elecciones de dependencias y su justificación, bugs conocidos y sus fixes, restricciones de deployment, estado de cobertura de tests, ubicaciones de componentes clave, y enfoques fallidos (para que tu agente no intente el mismo camino roto dos veces).

La capa de knowledge graph extrae entidades y relaciones de estas observaciones. Podés consultar el grafo en /agentmemory/graph o visualizarlo en el viewer. Los edges temporales están soportados, así el sistema no solo sabe qué se decidió, sino cuándo — útil para rastrear cómo evolucionó tu arquitectura.

Para usuarios existentes de Claude Code, hay importación JSONL: apuntá agentmemory a tus archivos de transcript de Claude Code y rehidrata el historial completo de sesiones — observaciones, usos de herramientas, timeline — al store de memoria.

Una advertencia honesta

Una limitación conocida que vale la pena mencionar: el plugin actualmente envía tokens de autenticación sobre HTTP plano (issue #275, abierto). El binding por defecto a localhost contiene esta exposición para la mayoría de los casos de uso, pero si estás exponiendo la REST API más allá de una sola máquina — por ejemplo, en un setup de equipo o detrás de un reverse proxy — vas a querer TLS y una revisión de autenticación antes de ir por ese camino. El proyecto es activo y esto está en el roadmap.

Los benchmarks destacados (92% de reducción de tokens, 95,2% R@5) se miden sobre el pipeline propio de agentmemory y su suite de tests (LongMemEval-S). Competidores como Mem0 publican números en conjuntos de evaluación diferentes, así que las comparaciones directas no son manzanas con manzanas. Tomá los números como sólidamente direccionales, no como un leaderboard entre herramientas.

Para empezar

# Iniciá el servidor de memoria
npx @agentmemory/agentmemory

# Viewer disponible en http://localhost:3113
# Servidor MCP disponible en http://localhost:3111

Para Claude Code, el instalador maneja el registro de hooks automáticamente, escribiendo los comandos necesarios en ~/.claude/settings.json. Para otros agentes, revisá el repo para las guías de integración por herramienta — la mayoría tiene carpetas de plugin dedicadas con READMEs de setup.

El proyecto es 100% open source, superó las 5.000 estrellas en GitHub en sus primeras dos semanas, y tiene una comunidad activa de contributors con 654 tests passing al momento de esta publicación.

GitHub: github.com/rohitg00/agentmemory
Sitio: agent-memory.dev