CAVEMAN: El Skill de Claude Code que se Volvió Viral Haciendo que tu IA Hable como Cavernícola

CAVEMAN: El Skill de Claude Code que se Volvió Viral Haciendo que tu IA Hable como Cavernícola

Julius Brussee es un estudiante universitario holandés. Su padre es Arjan Brussee — co-creador de Jazz Jackrabbit, veterano del desarrollo de videojuegos. El hijo heredó el instinto. La semana pasada, Julius publicó un repo de GitHub de una sola línea con el tagline “why use many token when few token do trick” y se despertó unos días después encontrándolo en tendencia #1 en GitHub y encabezando la discusión de Hacker News.

El repo se llama caveman. Al momento de escribir esto, ya superó las 14.000 estrellas y sigue subiendo.

La premisa es casi absurdamente simple: Claude Code (y la mayoría de los agentes de código basados en LLMs) están entrenados para ser verbosos y corteses. Dicen “¡Claro! Con mucho gusto te ayudo con eso. El problema que estás experimentando probablemente se debe a…” antes de llegar a la respuesta real. Cada una de esas palabras cuesta tokens. Caveman las elimina todas.


Qué hace Caveman exactamente

Caveman es un skill de Claude Code — un archivo de instrucciones en texto plano que cambia cómo Claude formatea sus respuestas en prosa. La lógica central es directa:

Fuera: artículos (a/an/the), palabras de relleno (just, really, basically, actually, simply), frases de cortesía (sure, certainly, of course, happy to help), lenguaje de cobertura.

Adentro: respuestas directas. Patrón: [cosa] [acción] [razón]. [próximo paso].

La decisión de diseño crítica: el contenido técnico pasa sin cambios. Bloques de código, rutas de archivos, URLs, comandos, números de versión, mensajes de error — nada de eso se comprime. Solo la explicación en prosa alrededor de ellos recibe el tratamiento cavernícola.

El ejemplo canónico del README:

Antes (Claude normal):

“The reason your React component is re-rendering is likely because you’re creating a new object reference on each render cycle. When you pass an inline object as a prop, React’s shallow comparison sees it as a different object every time, which triggers a re-render. I’d recommend using useMemo to memoize the object.”

Después (caveman full):

“New object ref each render. Inline object prop = new ref = re-render. Wrap in useMemo.”

Mismo fix. Misma información. Fracción de los tokens.


Tres modos (más Chino Clásico)

Caveman incluye tres niveles de compresión para inglés:

Modo Qué hace
/caveman lite Elimina relleno y cortesías. Frases completas, artículos conservados.
/caveman full Caveman completo. Sin artículos, fragmentos OK, sinónimos cortos.
/caveman ultra Compresión máxima. Abreviaciones (DB, auth, fn, impl), flechas para causalidad (X → Y), una palabra cuando una palabra alcanza.

Y sí — el repo también incluye tres modos wenyan (compresión literaria en Chino Clásico), porque aparentemente el habla cavernícola y el chino escrito de hace 2.500 años son ambos extremadamente eficientes en tokens. wenyan-ultra reporta 80-90% de reducción de caracteres manteniendo todo el significado técnico.


El lado del input: caveman-compress

El skill maneja la compresión del output. Pero caveman también incluye una herramienta separada — caveman-compress — que se ocupa de la compresión del input.

La idea: tu CLAUDE.md se carga al inicio de cada sesión de Claude Code. Si tiene 1.500 palabras de instrucciones verbosas, estás pagando overhead de tokens en cada sesión. Caveman-compress lo reescribe en caveman-speak comprimido, preservando el original como CLAUDE.md.original.md para que vos lo puedas leer y editar sin problemas.

El repo afirma ~45% de reducción en tokens de input por sesión con este enfoque. Tu CLAUDE.md se convierte en problema de Claude leer rápido, mientras vos conservás la versión legible para humanos.


Los números de tokens: qué creerle

El repo afirma 65-75% de reducción en tokens de output. Benchmarks independientes sobre tareas reales de coding midieron ahorros más modestos pero genuinos — aproximadamente 14-21%. El proyecto incluye su propia suite de evaluación (uv run python evals/llm_run.py) para que puedas medir con tu carga de trabajo específica.

El framing honesto del propio README: “Caveman no make brain smaller. Caveman make mouth smaller. Biggest win is readability and speed, cost savings are a bonus.”

Hay también una referencia de investigación real acá. Un paper de marzo de 2026 titulado “Brevity Constraints Reverse Performance Hierarchies in Language Models” encontró que restringir a los modelos grandes a respuestas breves mejoró la precisión en 26 puntos porcentuales en ciertos benchmarks y revirtió completamente los rankings de rendimiento entre modelos. En otras palabras: hacer que Claude se calle puede hacerlo más inteligente, no solo más barato.


Instalación

Como plugin de Claude Code (recomendado — incluye hooks que activan caveman automáticamente al iniciar sesión):

claude plugin marketplace add JuliusBrussee/caveman
claude plugin install caveman@caveman

O solo como skill (sin hooks de auto-carga):

npx skills add JuliusBrussee/caveman

Una vez instalado, lo activás en tu sesión con /caveman, /caveman lite, /caveman full, o /caveman ultra. La versión con hooks se activa automáticamente.

Para usuarios de Codex: cloná el repo → abrí Codex en el proyecto → /plugins → buscá Caveman → Install.


Por qué se volvió viral

La mecánica importa menos que el punto más amplio que caveman expuso: la verbosidad de la IA tiene un costo real, y ese costo se viene absorbiendo en silencio. La mayoría de los devs no monitorea el uso de tokens por sesión — simplemente aparece en la factura. Caveman lo hizo visible al hacer la compresión tan agresiva que resulta graciosa.

Que cruzara las 14.000 estrellas en menos de una semana significa que el dolor era real y ampliamente compartido. Y que un estudiante universitario lo publicara como un archivo .skill de texto plano — no un producto SaaS, no una extensión de browser, no una herramienta paga — es exactamente el tipo de cosa que hace un buen post en Hacker News.

La pregunta más profunda que abrió la discusión: ¿están los LLMs entrenados para ser verbosos porque la verbosidad señala esfuerzo a los evaluadores humanos durante el RLHF? Si es así, caveman es un workaround para un artefacto de entrenamiento, no una corrección de bug. Esa es una conversación más interesante que el ahorro de tokens en sí.


¿Ya probaste caveman en tus sesiones de Claude Code? ¿Cuánto ahorrás en tokens con tu caso de uso real? Compartí en los comentarios :backhand_index_pointing_down: