Si alguna vez quisiste prototipar un workflow agéntico, probar un modelo nuevo o simplemente jugar con una API de LLM sin cargar una tarjeta, seguramente chocaste con la misma pared: ¿qué providers ofrecen acceso gratis de verdad, y cuáles son los límites reales?
free-llm-api-resources de cheahjs responde exactamente eso. Es una referencia mantenida por la comunidad —con 23.8K stars— que cataloga servicios que ofrecen acceso gratuito vía API a LLMs, divididos en dos grupos: providers con un free tier genuino, y providers que te dan trial credits para arrancar.
Lo que lo hace útil no es la idea (todos sabemos que existen los free tiers), sino que la lista se mantiene actualizada e incluye los rate limits reales por provider, así sabés de entrada con qué estás trabajando.
Qué hay en la lista
El repo cubre los providers que esperarías y varios que quizás no:
- Google AI Studio — modelos Gemini con cuotas gratuitas generosas. El detalle que conviene saber: fuera de UK/CH/EEA/EU, tus datos se usan para training en el free tier.
- Groq — inferencia rápida, free tier con límites por modelo (aproximadamente 30 requests/minuto, 14.400 requests/día en los modelos documentados).
- Cerebras — acceso gratuito con caps de tokens por minuto y por día; requiere verificación de número de teléfono.
- OpenRouter — rutea a varios providers y expone un set de modelos gratuitos.
- Cloudflare Workers AI, HuggingFace Serverless Inference (limitado a modelos de menos de 10GB, con algunas excepciones), Mistral, GitHub Models, y más.
También lista providers de trial credits (Together, Fireworks, Baseten, entre otros) para cuando ya te quedaste corto con los free tiers pero todavía no querés comprometerte.
Un par de cosas que el maintainer deja explícitas, y que vale la pena repetir: no abuses de estos servicios — el sobreuso es justamente como desaparecen los free tiers. Y la lista excluye deliberadamente cualquier cosa turbia, como servicios que hacen reverse-engineering de un chatbot existente.
Por qué vale la pena guardarlo
Dos razones. Primero, los free tiers y sus límites cambian constantemente — los providers suben caps, dan de baja modelos, agregan requisitos de verificación. Un blog post estático sobre este tema queda desactualizado la semana después de publicarse. Este repo se regenera desde datos de origen y lo actualiza la comunidad, así que es lo más cercano a una source of truth.
Segundo, los rate limits por provider son la parte que realmente necesitás al planificar. Saber que un provider te da 1M tokens/día versus los 60K tokens/minuto de otro es la diferencia entre un workflow que corre y uno que se throttlea a mitad de camino.
La aclaración honesta: tratá los números de cualquier artículo (incluido este) como una foto del momento. Para cuando leas esto, algún límite puede haberse movido. Andá al repo para ver el estado actual — esa es justamente la razón por la que existe.
Cómo usarlo
No hay nada que instalar. Abrí el README, buscá un provider cuyos límites encajen con tu caso de uso, registrate, agarrá una API key. La mayoría habla el formato de API compatible con OpenAI, así que cambiar de provider en tu código suele ser cuestión de cambiar base-URL y key.
Para prototipar, probar un modelo antes de pagarlo, o correr side projects que no justifican una factura, es difícil ganarle a lo gratis.
¿Cuál de estos providers ya estás usando para tus side projects? ¿Alguno que falte en la lista?
