¿Dónde están todas las apps de IA que prometieron?

Las Apps de IA que Nadie Ve

Hace unos días, Answer.AI publicó un análisis tranquilo pero certero que llegó a Hacker News y generó 77 comentarios. La pregunta que se hicieron fue simple: si la IA hace a los desarrolladores 2x, 10x, quizás 100x más productivos, ¿dónde está el software?

Miraron PyPI — el repositorio central de paquetes Python, con 800.000 paquetes y datos históricos consistentes. El hallazgo principal: no hay ningún salto de productividad visible. Sin punto de inflexión cuando se lanzó ChatGPT. Sin explosión cámbrica de nuevos paquetes. La cadencia de actualizaciones de los paquetes existentes apenas se movió. Para una tecnología que supuestamente está restructurando cómo se construye software, los números agregados son sorprendentemente planos.

Pero los datos cuentan una historia más interesante que “el hype de la IA está sobredimensionado.” Y la discusión en Hacker News agrega las piezas que los gráficos no pueden mostrar.

Lo que los datos realmente dicen

El único lugar donde Answer.AI ve un efecto claro es en los paquetes sobre IA — herramientas y bibliotecas que son parte del ecosistema de IA en sí mismo. Esos muestran un salto de más del doble en frecuencia de actualizaciones post-ChatGPT, concentrado en los paquetes más populares. Los autores ofrecen dos explicaciones: o bien quienes construyen herramientas de IA también son los que saben usar IA efectivamente (un efecto de habilidad), o el enorme flujo de financiamiento hacia IA simplemente está pagando por más trabajo de desarrollo (un efecto de dinero). Probablemente ambos.

¿Todo lo demás? Sin cambios significativos.

Adónde fueron realmente las apps

Lo que los datos de PyPI no pueden ver es la explosión de software que nunca fue pensado para ser distribuido.

El hilo de Hacker News está lleno de ejemplos. Un desarrollador reemplazó VSCode con un dashboard hiper-personal que combina noticias, issues, PRs, un editor markdown, un calendario y botones con IA que hacen cosas que no pueden hacerse de forma programática — y no lo comparte porque no encajaría en el flujo de trabajo de nadie más. Otro construyó una app de compras en 20 minutos, específica para cómo y dónde él hace las compras, inútil para cualquier otra persona. Un tercero describió haber construido docenas de herramientas personales en el último año para resolver problemas que acumuló durante décadas — cosas que no tiene ninguna intención de vender ni compartir.

Esta es la ganancia de productividad invisible. No apareció en PyPI porque nunca estaba destinada a PyPI.

Un comentarista lo resumió con claridad: el umbral mínimo para que una app tenga sentido bajó a una sola persona. Eso es nuevo. Antes de los LLMs, escribir software para una audiencia de uno raramente tenía sentido económico. Ahora sí. El resultado es una categoría de software sin canal de distribución, sin métricas, sin visibilidad — pero genuinamente útil para quien la construyó.

También hay una segunda categoría: software que existe pero es transitorio. Un desarrollador describió usar Codex para levantar una pequeña app web para manejar credenciales OAuth durante unos minutos y después borrarla. Código como artefacto desechable. Esa es una ganancia de productividad real que nunca va a registrarse en ningún lado.

El problema de llamarte “app de IA”

El tercer hilo de la discusión es uno que los equipos de producto deberían tomar en serio.

Varios comentarios hicieron la misma observación de forma independiente: las apps de IA que realmente ganan usuarios son aquellas donde la IA es invisible. Las que se comercializan como “impulsadas por IA” atraen curiosidad pero no retención. Las que simplemente resuelven un problema — y resulta que usan LLMs por debajo — consiguen uso real.

Un comentarista lo planteó bien: la mayoría de la gente no quiere IA. Quiere software que haga cosas mágicamente útiles. El detalle de implementación es irrelevante. Presentar un producto como una “app de IA” es como comercializar una computadora más rápida hablando de sus especificaciones de silicio — le estás hablando a vos mismo, no a tu cliente.

Los datos de sentimiento del consumidor muestran reacciones negativas medibles hacia el branding de IA en contextos inesperados. Sin embargo, la presión desde el liderazgo para lanzar “features con IA como protagonista” sigue siendo intensa. Esa tensión — entre lo que el mercado realmente responde y lo que el organigrama demanda — es un riesgo real de producto.

La brecha que persiste

El resumen honesto de los hallazgos de Answer.AI es este: no hay evidencia de que los desarrolladores en general sean 10x más productivos. Pero sí hay evidencia de que desarrolladores específicos, trabajando en cosas específicas, están construyendo significativamente más rápido. Las ganancias son reales y concentradas, no universales y difusas.

La brecha entre la capacidad del modelo y la distribución del producto siempre fue el problema más difícil. Los LLMs no resolvieron los ciclos de ventas, la confianza, el onboarding, ni el 10% del esfuerzo de ingeniería que representa el 90% del dolor. Lo que cambió es el piso: el costo de un prototipo funcional colapsó. Lo que no cambió es todo lo que ocurre después del prototipo.

Para equipos de producto y fundadores, la lectura práctica es esta: los modelos están listos. El cuello de botella de distribución es tuyo para resolver.


¿Vos estás viendo este efecto en tus propios proyectos? ¿Construís software personal que nunca vas a distribuir, o seguís apuntando a productos con usuarios reales? Contanos en los comentarios.

Fuentes: