Durante dos años enseñamos a los developers a escribir prompts.
Creamos bibliotecas de templates. Compartimos hacks en Twitter. Diseñamos frameworks como CRISPE, Chain-of-Thought y ReAct. Aparecieron cursos, consultoras y puestos de trabajo enteros alrededor del prompt engineering.
Pero algo interesante está empezando a ocurrir.
Los equipos que construyen los agentes más avanzados del mercado — Anthropic entre ellos — sugieren que la etapa del prompt escrito manualmente podría estar acercándose a su fin.
No porque los prompts dejen de importar.
Sino porque cada vez más agentes empiezan a generarlos, refinarlos y corregirlos por sí mismos.
Boris Cherny, uno de los líderes detrás de Claude Code, describió recientemente esta transición como el paso desde el prompt engineering hacia el loop engineering.
La idea es simple.
El desarrollador deja de escribir instrucciones detalladas paso a paso.
Y pasa a diseñar el sistema que produce esas instrucciones automáticamente.
Ese cambio parece sutil.
No lo es.
Es probablemente uno de los cambios arquitectónicos más importantes que veremos en la ingeniería asistida por IA durante los próximos años.
El límite del prompt engineering
La primera generación de aplicaciones LLM estaba construida alrededor de una premisa sencilla:
Un humano escribe un prompt.
El modelo responde.
Fin de la historia.
Incluso los sistemas más sofisticados seguían funcionando esencialmente igual:
Usuario → Prompt → Modelo → Respuesta
El problema aparece cuando intentás escalar autonomía.
Un agente que debe:
- explorar un repositorio grande,
- ejecutar herramientas,
- planificar tareas de varias horas,
- corregir errores,
- validar resultados,
- adaptarse a cambios inesperados,
no puede depender únicamente de un prompt inicial escrito por un humano.
La razón es obvia.
Los humanos no conocemos de antemano todas las situaciones que aparecerán durante la ejecución.
Un agente suficientemente autónomo necesita reinterpretar constantemente sus objetivos.
Necesita crear nuevas instrucciones para sí mismo.
Los agentes ya se auto-promptean
De hecho, esto ya está ocurriendo.
Cuando usás herramientas como Claude Code, Codex, OpenCode o Gemini CLI, el prompt que escribís raramente es el prompt que termina llegando al modelo.
Tu instrucción original suele atravesar múltiples capas:
Usuario
↓
Prompt inicial
↓
Prompt del sistema
↓
Memoria persistente
↓
Contexto recuperado
↓
Herramientas disponibles
↓
Subagentes especializados
↓
Prompts internos generados dinámicamente
↓
Modelo
La mayor parte de estas instrucciones nunca las ve el usuario.
Por ejemplo:
- Un agente puede reformular automáticamente una tarea ambigua.
- Puede generar un plan de ejecución intermedio.
- Puede crear subtareas para subagentes especializados.
- Puede resumir contexto antiguo.
- Puede generar prompts de verificación.
- Puede pedirle a otro modelo que critique su propia respuesta.
Todo eso son prompts.
Simplemente no fueron escritos por un humano.
Del prompt al loop
Esto nos lleva al concepto central.
El nuevo objeto de diseño deja de ser el prompt.
Pasa a ser el loop.
Un loop agentic típico podría verse así:
Objetivo humano
↓
Planificación
↓
Ejecución
↓
Observación del resultado
↓
Evaluación
↓
Reflexión
↓
Ajuste del plan
↓
Nueva ejecución
Cada iteración produce nuevas instrucciones.
Cada observación modifica el comportamiento futuro.
Cada fallo genera prompts correctivos.
Lo importante ya no es escribir la instrucción perfecta.
Es diseñar el mecanismo mediante el cual el sistema aprende a producir instrucciones mejores con cada ciclo.
Un ejemplo concreto
Imaginemos un workflow clásico:
“Migrá este servicio de Express a Fastify.”
En un paradigma de prompt engineering tradicional, intentaríamos describir todo desde el principio:
Migrá el proyecto completo.
Preservá compatibilidad.
Actualizá tests.
No rompas endpoints.
Usá TypeScript.
Generá documentación.
El resultado suele ser inconsistente.
Porque la tarea real contiene cientos de decisiones emergentes.
En un sistema basado en loops:
Iteración 1
El agente:
- inspecciona el código,
- estima complejidad,
- identifica riesgos.
Genera internamente:
Primero identificar middleware personalizados y dependencias críticas.
Iteración 2
Encuentra incompatibilidades.
Genera:
Crear subagente especializado para revisar autenticación.
Iteración 3
Los tests fallan.
Genera:
Revisar diferencias semánticas entre middleware Express y hooks Fastify.
Iteración 4
El sistema detecta regresiones.
Genera:
Solicitar revisión crítica sobre compatibilidad hacia atrás.
El humano nunca escribió ninguno de esos prompts.
Diseñó el loop.
El rol del desarrollador cambia
Esto tiene consecuencias profundas para AI Builders.
El trabajo deja de consistir principalmente en:
- optimizar wording,
- experimentar frases,
- ajustar temperatura,
- probar pequeños cambios de prompt.
Empieza a consistir en diseñar:
Objetivos
¿Qué significa éxito?
Restricciones
¿Qué cosas nunca puede hacer el agente?
Herramientas
¿Qué capacidades tiene disponibles?
Memoria
¿Qué debe recordar entre iteraciones?
Evaluación
¿Cómo sabe si está progresando?
Políticas
¿Cuándo debe detenerse?
Escalamiento
¿Cuándo debe pedir ayuda humana?
Este cambio acerca el desarrollo de agentes mucho más a la ingeniería de sistemas que a la escritura creativa.
La arquitectura empieza a importar más que el modelo
En este nuevo mundo, dos equipos usando exactamente el mismo modelo pueden obtener resultados radicalmente distintos.
La diferencia estará en:
- la calidad de los loops,
- los mecanismos de evaluación,
- la observabilidad,
- las políticas de recuperación,
- la memoria,
- las herramientas disponibles.
Esto ayuda a explicar por qué el mercado se está moviendo hacia el concepto de harness.
El modelo se vuelve una pieza intercambiable.
El loop se convierte en el producto.
Los nuevos patrones emergentes
Ya empiezan a aparecer patrones relativamente estables.
Plan → Execute → Reflect
El agente planifica, ejecuta, analiza resultados y ajusta.
Critic Loops
Un segundo agente evalúa la salida del primero.
Self-Refinement
El propio agente revisa y mejora su trabajo antes de entregarlo.
Multi-Agent Delegation
Agentes especializados reciben subtareas específicas.
Adaptive Context
El sistema decide dinámicamente qué información cargar.
Escalation Loops
Cuando la incertidumbre supera cierto umbral, interviene un humano.
Estos patrones probablemente se conviertan en las nuevas abstracciones básicas de la ingeniería agentic.
Qué deberían hacer hoy los equipos
No hace falta esperar AGI para prepararse.
Algunas recomendaciones prácticas:
1. Diseñá workflows, no prompts aislados
Pensá en estados, transiciones y feedback.
2. Separá intención de ejecución
El humano define objetivos.
El sistema decide implementación.
3. Invertí en observabilidad
Necesitás entender qué prompts internos genera el sistema.
4. Medí loops completos
No evalúes respuestas individuales.
Evaluá tareas completas.
5. Definí políticas explícitas
Todo loop necesita límites claros.
6. Diseñá mecanismos de intervención humana
La autonomía total sigue siendo una excepción.
El futuro del prompt engineering
¿Desaparecerá el prompt engineering?
Probablemente no.
Pero su nivel de abstracción cambiará.
Los prompts explícitos seguirán existiendo.
Simplemente dejarán de ser el centro del sistema.
Del mismo modo que hoy nadie programa ensamblador para construir aplicaciones web, probablemente dentro de algunos años pocos equipos pasarán su tiempo optimizando manualmente prompts individuales.
Diseñarán loops.
Diseñarán evaluadores.
Diseñarán políticas.
Diseñarán sistemas capaces de generar sus propias instrucciones.
Y eso representa una transición importante.
Porque significa que la disciplina dominante deja de parecerse a escribir.
Y empieza a parecerse, una vez más, a ingeniería.
Por Grego — yoDEV
