El problema que nadie habla
Todos estamos corriendo agentes de código. Claude Code, Codex, Cursor Agent, Gemini CLI — las opciones sobran. Pero hay un patrón que se repite en todos los equipos: el agente es poderoso, pero el workflow alrededor es un desastre.
Copiás y pegás prompts. Babysiteás cada sesión. No hay forma de saber qué hizo un agente ayer. Y cuando el agente genera código, salta specs, ignora tests, y toma el atajo más corto posible.
No es un problema del modelo. Es un problema de infraestructura. Te falta la capa entre “tengo un agente” y “tengo un agente que trabaja como un compañero de equipo real.”
Esta semana, dos repositorios que atacan exactamente este problema explotaron en GitHub Trending. Y lo interesante es que resuelven las dos mitades del mismo gap.
Multica: tus agentes en el tablero, como compañeros de equipo
Repo: github.com/multica-ai/multica
Stars: ~15K | Forks: ~1.8K | Licencia: Apache-2.0 | Lenguaje: TypeScript + Go
Multica es una plataforma open-source de agentes gestionados. La propuesta es directa: en vez de interactuar con tus agentes via terminal uno a uno, los convertís en miembros de tu equipo con presencia en un tablero de proyecto.
Cómo funciona
Instalás el CLI, levantás el daemon, y Multica detecta automáticamente qué agentes tenés disponibles en tu PATH — Claude Code, Codex, OpenClaw, OpenCode, Hermes, Gemini, Pi, o Cursor Agent.
# Instalación
curl -fsSL https://raw.githubusercontent.com/multica-ai/multica/main/scripts/install.sh | bash
# Configurar y arrancar
multica setup
Una vez conectado, creás agentes desde la interfaz web. Cada agente tiene nombre, perfil, y aparece en el tablero como cualquier otro integrante del equipo. Le asignás un issue → el agente lo toma, escribe código, reporta blockers, actualiza el estado. Sin intervención.
La arquitectura
┌──────────────┐ ┌──────────────┐ ┌──────────────────┐
│ Next.js │────>│ Go Backend │────>│ PostgreSQL │
│ Frontend │<────│ (Chi + WS) │<────│ (pgvector) │
└──────────────┘ └──────┬───────┘ └──────────────────┘
│
┌──────┴───────┐
│ Agent Daemon │
│ (tu máquina │
│ o cloud) │
└──────────────┘
El daemon corre en tu máquina local y se conecta al backend via WebSocket. Cuando un agente recibe una tarea, el daemon crea un ambiente aislado, ejecuta el agente, y reporta los resultados. También hay opción de Multica Cloud si no querés self-hostear.
Lo que lo diferencia
Skills compuestos: cada solución que un agente encuentra se convierte en un skill reutilizable para todo el equipo. Deployments, migraciones, code reviews — los skills se acumulan con el tiempo. El agente que resolvió el problema de CORS la semana pasada “recuerda” la solución para la próxima vez.
Multi-workspace: isolation a nivel de workspace. Cada workspace tiene sus propios agentes, issues, y configuraciones. Pensá en ello como tener equipos separados con sus propios agentes especializados.
Vendor-neutral: no estás atado a ningún provider. Podés mezclar Claude Code para tareas complejas, Codex para refactors masivos, y OpenCode para lo que sea — todo coordinado desde el mismo tablero.
agent-skills: la disciplina de un senior engineer, empaquetada en Markdown
Repo: github.com/addyosmani/agent-skills
Stars: ~16K | Forks: ~2.1K | Licencia: MIT | Autor: Addy Osmani (Google)
Si Multica resuelve el “dónde y cómo coordinan los agentes”, agent-skills resuelve el “qué disciplina siguen cuando trabajan.”
Addy Osmani — Engineering Manager en Google Chrome, autor de libros clásicos de JavaScript — empaquetó las prácticas de ingeniería de producción de Google en 20 skills estructurados que cualquier agente de código puede seguir.
El problema que ataca
Los agentes de código toman el camino más corto. Le pedís una feature y te la da sin spec, sin tests, sin security review. Funciona en el momento, pero es el tipo de código que un senior engineer rechazaría en code review.
agent-skills le da al agente un proceso estructurado para cada fase del desarrollo:
| Fase | Skills | Qué fuerzan |
|---|---|---|
| Definir | idea-refine, spec-driven-development | Requerimientos antes de código |
| Planificar | planning-and-task-breakdown | Descomponer en chunks verificables |
| Construir | incremental-implementation, context-engineering, frontend-ui-engineering | Slices verticales, contexto correcto |
| Verificar | test-driven-development, debugging-and-error-recovery | Probar que funciona con tests reales |
| Revisar | code-review-and-quality, security-and-hardening | Gates de calidad antes de merge |
| Shipear | git-workflow-and-versioning, ci-cd-and-automation, shipping-and-launch | Releases seguros y documentados |
Cómo se usa
Con Claude Code, la instalación es directa:
# Instalar como plugin
claude plugin add agent-skills
# O clonar y referenciar
git clone https://github.com/addyosmani/agent-skills.git
Una vez instalado, tenés slash commands:
/spec → Arranca desarrollo spec-driven
/plan → Descompone el trabajo en tareas
/build → Implementa incrementalmente
/test → Workflow TDD
/review → Trigger code review
/ship → Checklist pre-launch
Para Cursor, copiás los SKILL.md a .cursor/rules/. Para Windsurf, los agregás a la configuración de rules. Para Copilot, van como agent personas. Y como cada skill es simplemente un archivo Markdown, funciona con cualquier agente que acepte system prompts.
Lo que hace diferente a estos skills
No son prompts genéricos del tipo “write good tests.” Cada skill tiene:
Tablas anti-racionalización. Son las excusas que los agentes usan para saltear pasos importantes, con contra-argumentos factuales. Cuando tu agente piensa “esto es simple, no necesita spec”, el skill lo intercepta con el razonamiento de por qué sí lo necesita.
Gates de verificación. Checkpoints en cada paso del proceso. El agente no avanza a la siguiente fase hasta que la actual esté verificada.
Red flags. Señales observables de que el skill se está violando. Útiles tanto para el agente en modo de auto-monitoreo como para vos cuando revisás el output.
La inspiración viene directo de la cultura de ingeniería de Google — Hyrum’s Law para diseño de APIs, la Beyonce Rule para testing, la pirámide de tests (80/15/5).
Agent personas incluidos
Además de los skills, el repo incluye personas reutilizables que podés invocar:
- code-reviewer — revisa PRs con criterio de senior engineer
- test-engineer — analiza cobertura y calidad de tests
- security-auditor — audita endpoints y detecta vulnerabilidades
La historia real: dos capas del mismo stack emergente
Lo interesante de que Multica y agent-skills estén trending la misma semana es lo que dice sobre hacia dónde va la industria.
El stack de desarrollo con agentes se está estratificando:
- Capa de modelo — Claude, GPT, Gemini, etc. (resuelto)
- Capa de agente — Claude Code, Codex, Cursor Agent (resuelto)
- Capa de coordinación — Multica, similares (emergiendo ahora)
- Capa de disciplina — agent-skills, similares (emergiendo ahora)
Las capas 1 y 2 ya están maduras. Las capas 3 y 4 son exactamente lo que faltaba para pasar de “un dev con un agente” a “un equipo donde los agentes son compañeros productivos.”
Multica maneja el dónde y cuándo trabajan los agentes. agent-skills maneja el cómo y con qué estándar de calidad. Son complementarios por diseño, aunque no fueron creados juntos.
Cómo empezar
Si trabajás solo o en equipo chico: empezá por agent-skills. Es cero infraestructura — instalás el plugin o copiás los Markdown, y tu agente inmediatamente produce código con más disciplina. El impacto es instantáneo.
Si coordinás múltiples agentes o tenés un equipo: Multica tiene más sentido. La inversión en setup (self-hosted o cloud) se justifica cuando necesitás que varios agentes trabajen en paralelo con visibilidad centralizada.
Si querés los dos: instalás Multica para la coordinación, y los agent-skills se cargan en cada agente individual. Los skills de Multica (que se acumulan) y los agent-skills de Osmani (que definen el proceso) son complementarios.
Links
- Multica: GitHub - multica-ai/multica: The open-source managed agents platform. Turn coding agents into real teammates — assign tasks, track progress, compound skills. · GitHub
- agent-skills: GitHub - addyosmani/agent-skills: Production-grade engineering skills for AI coding agents. · GitHub
- Documentación de agent-skills: agent-skills/docs/getting-started.md at 9534f44c5448086fcc0046f9d83752c654c81930 · addyosmani/agent-skills · GitHub
¿Ya estás usando alguna capa de gestión o disciplina sobre tus agentes de código? ¿O seguís en el modo copy-paste de prompts? Contanos en los comentarios ![]()
