El Subsidio de IA se Termina: Lo que Todo CTO Necesita Saber Antes de que Llegue la Factura

Grego · 18 Mayo, 2026 17:43

Por Grego

Llevo varias décadas como CIO. Vi pasar ciclos de precios de todo tipo — tiempo compartido en mainframes, SaaS, compute en la nube. Sé reconocer un loss-leader cuando lo veo, y sé lo que pasa cuando termina.

Lo que está ocurriendo ahora mismo con los precios de IA es el programa de loss-leader más agresivo que vi en la historia del software empresarial. Y la mayoría de los CTOs y CFOs en Iberoamérica todavía no hicieron los cálculos.

Dejame hacerlos por vos.

La brecha entre lo que pagás y lo que realmente cuesta

Claude Pro: $20/mes por seat. Por ese precio, tu equipo accede a Sonnet 4.6, Opus 4.6, búsqueda web, ejecución de código y análisis de documentos. Parece razonable.

Ahora mirá las tarifas de API. Sonnet 4.6 cuesta $3 por millón de tokens de entrada y $15 por millón de tokens de salida. Opus 4.6 sale $5 de entrada y $25 de salida. Un knowledge worker que usa Claude unas pocas horas por día — subiendo documentos, redactando análisis, iterando sobre código — puede consumir fácilmente varios millones de tokens por semana. A tarifas de API, ese mismo workload cuesta entre $200 y $400 por mes por seat. Con una suscripción Pro, la empresa paga $20.

Eso no es un descuento. Es un subsidio. Un análisis ampliamente citado encontró que los usuarios de Anthropic consumían cerca de $8 en compute por cada $1 de ingresos por suscripción.

Anthropic no es la única. Microsoft reportó pérdidas de más de $20 por usuario por mes en GitHub Copilot. Para los usuarios intensivos, el costo de compute llegaba a $80 al mes sobre una suscripción de $10.

La matemática es la misma en todos los grandes providers. El propio VP de Producto de OpenAI, Nick Turley, describió sus precios de suscripción como algo en lo que “tropezaron” y planteó la posibilidad de eliminar los planes ilimitados, comparándolos con “electricidad ilimitada”.

Por qué lo están haciendo

Esto no es un error de cálculo. Es una estrategia.

El patrón es idéntico en todos los providers: precio para adopción, no para economía. Crear dependencia. Convertir a la IA en parte estructural del workflow diario de cada equipo. Preocuparse por la factura después.

Para las empresas, el “después” está llegando. La pregunta para tu organización no es si conseguiste un buen deal al contratar tarifas de equipo. La pregunta es cuánto tiempo dura ese deal — y si tu presupuesto está listo para lo que viene.

El uso agéntico rompió la economía subyacente

Lo que está acelerando el timeline es la IA agéntica.

Cuando la IA era un chatbot, el consumo de tokens era relativamente predecible. Una conversación corre algunos miles de tokens. El uso intensivo puede llegar a decenas de miles. Eso era manejable a tarifas planas subsidiadas.

El cambio agéntico lo transforma todo. Las sesiones de Claude Code corren de forma autónoma durante períodos extendidos, consumiendo tokens a una velocidad que deja atrás al uso conversacional. Usuarios reportaron agotar ventanas de rate limit de 5 horas en menos de 90 minutos.

GitHub anunció que Copilot migra a billing por uso el 1 de junio de 2026, específicamente porque el modelo de tarifa plana colapsó bajo los workloads agénticos. Ese no es un cambio de precios aislado. Es un canario en la mina.

Sam Altman dijo públicamente que OpenAI necesita convertirse en “una empresa de AI inference” — un reconocimiento de que el uso agéntico requiere un modelo económico fundamentalmente diferente.

Para los líderes de ingeniería: un desarrollador corriendo tres o cuatro coding agents en paralelo no consume 3x los tokens de una conversación de chat. Consume un orden de magnitud más. Y el precio de la suscripción en ese seat no cambió.

La exposición que la mayoría de las organizaciones en Iberoamérica no están midiendo

En los últimos dos años, los equipos de la región tejieron las suscripciones de IA dentro de sus operaciones. Marketing redacta copy con ChatGPT Plus. Ingeniería escribe y revisa código con Claude Pro. Finanzas modela escenarios. Customer success resume tickets. Estos ya no son experimentos — son workflows estructurales.

Y la mayoría de las organizaciones está presupuestando la IA a los precios de suscripción actuales.

Un equipo de 50 personas en Claude Pro cuesta $1.000 al mes. Pero el uso equivalente en API para ese mismo equipo, pagando el costo real de los tokens consumidos, estaría entre $15.000 y $40.000 al mes dependiendo de la intensidad de uso.

Eso no es un error de redondeo. Es una categoría presupuestaria que todavía no existe en la mayoría de los P&L.

Los datos lo confirman a nivel global. El AI Quarterly Pulse Q1 2026 de KPMG encontró que las organizaciones estadounidenses proyectan un gasto promedio de IA de $207 millones en los próximos 12 meses, casi el doble de la cifra del mismo período del año anterior. Pero una encuesta de Goldman Sachs encontró que muchas grandes empresas ya están excediendo sus presupuestos de IA por órdenes de magnitud, con el gasto en IA en camino de rivalizar con los salarios de los ingenieros.

Swami Chandrasekaran, director de AI y data labs de KPMG North America, señaló que incluso uno o dos trimestres atrás, nadie estaba trackeando los costos de consumo de LLMs. La mayoría todavía no lo hace.

El trigger del IPO ya está en movimiento

Hay un mecanismo específico que va a forzar el repricing, y no es hipotético.

Tanto OpenAI como Anthropic se están preparando para sus IPOs. Anthropic habría superado los $30.000 millones en ingresos anualizados. OpenAI va camino a los $25.000 millones aproximadamente. Estos números se ven bien hasta que mirás el lado de los costos. OpenAI proyecta $115.000 millones en cash burn acumulado hasta 2029.

Cuando sos privado y quemás capital de riesgo, podés subsidiar la inferencia. Un IPO cambia la ecuación de un día para el otro. Los mercados públicos exigen márgenes. Los analistas exigen unit economics. Los inversores exigen un camino a la rentabilidad que no dependa de fundraising infinito.

La forma más rápida de cerrar la brecha entre el precio de suscripción y el costo real es subir precios, imponer usage caps, o migrar a billing por consumo. Las tres opciones van a golpear duro a los suscriptores enterprise actuales.

Las señales ya son visibles. GitHub migra a billing por uso el 1 de junio. Microsoft subió los precios de Microsoft 365 dos veces en cuatro años, con la última ronda atada específicamente a los costos de infraestructura de IA. OpenAI lanzó un plan Pro de $100. El plan Max de Anthropic está en $200/mes. De a uno, el piso se está levantando.

Lo que deberías hacer ahora mismo

Tres acciones concretas — no aspiracionales, ejecutables este trimestre:

1. Auditá el consumo real, no el conteo de seats. Probablemente sabés cuántos seats de Claude o Copilot estás pagando. Casi con certeza no sabés cuántos tokens están consumiendo esos seats. Conseguí ese número. Es la única forma de modelar tu exposición real cuando los precios se ajusten.

2. Modelá escenarios de repricing. Aplicá 2x, 5x y 10x a tu línea de IA actual. Si alguno de esos números requeriría una conversación de emergencia con el CFO, esa conversación la tenés que tener ahora — antes de tenerla bajo presión.

3. Construí optionalidad de vendor. Las organizaciones que mejor van a absorber el repricing son las que no bloquearon cada workflow en el stack de un único provider. El tooling model-agnostic, los prompts portables y los workflows documentados importan más hoy que hace 18 meses.

La era del subsidio no está terminando porque los providers quieran. Está terminando porque la matemática siempre apuntó hacia acá, y el reloj del IPO está corriendo. Las empresas que sobrevivan la transición serán las que trataron “la IA es barata” como una condición temporal, no como una característica permanente de su estructura de costos.

La factura viene. La pregunta es si tu CFO va a estar sorprendido cuando llegue.

Tema	Respuestas	Vistas
Uber Quemó Todo su Presupuesto de IA 2026 en Cuatro Meses Claude Code productividad , claude-code , enterprise , costos-api , gestion-ia	38	12 Mayo 2026
Copilot con billing por uso: cómo deben prepararse los equipos de ingeniería GitHub Copilot devtools , ai , github-copilot , finops , cicd	20	1 Mayo 2026
El Fin del “AI All-You-Can-Eat” AI Dev Tools — General devtools , ai , llmops , finops , aiagents , ai-cost-optimization	12	10 Junio 2026
DeepSeek V4 Pro bajó un 75% y ya no vuelve atrás: lo que todo CTO tiene que recalcular AI Dev Tools — General api , deepseek , llm , agentes , pricing , open-weights	23	26 Mayo 2026
Windsurf Subió el Precio — Pero Ese No Es el Problema Real Windsurf (Codeium) cursor , windsurf , pricing , cascade , ai-ide	48	30 Marzo 2026