Presentación de Nano Banana Pro: Tutorial completo para desarrolladores

Imagen de portada para Introducción a Nano Banana Pro: Tutorial Completo para Desarrolladores

Guillaume Vernade para Google AI

Publicado el 21 de noviembre

Introducción a Nano Banana Pro: Tutorial Completo para Desarrolladores

Construcción con Gemini 3 (Google AI) (Serie de 6 partes)

¿Te encantó Nano-Banana? ¿Creaste imágenes de figuras de todos tus amigos y caras fantasma detrás de todos tus enemigos? Aquí llega el no tan nano modelo “Gemini 3 Pro Image”, al que todos preferirán llamar Nano Banana Pro.

Mientras que el modelo Flash (Nano Banana) ofrecía velocidad y asequibilidad, la versión Pro introduce capacidades de “pensamiento”, anclaje a búsquedas y salida de alta fidelidad en 4K. ¡Es hora de volverse loco con tareas creativas complejas!

Esta guía te llevará paso a paso por las funciones avanzadas de Nano Banana Pro utilizando la API de Desarrollador Gemini.

Esta guía cubrirá:

  1. Uso de Nano Banana Pro en Google AI Studio
  2. Configuración del proyecto
  3. Inicialización del cliente
  4. Generación básica (los clásicos)
  5. El proceso de “pensamiento”
  6. Anclaje a búsquedas
  7. Generación en alta resolución 4K
  8. Capacidades multilingües
  9. Mezcla avanzada de imágenes
  10. Demostraciones exclusivas de Pro

Nota: para una versión interactiva de esta publicación, consulta el cuaderno de Python o el cuaderno de JavaScript en AI Studio.

1) Uso de Nano Banana Pro en Google AI Studio

Mientras que los usuarios finales pueden acceder a Nano Banana Pro en la aplicación Gemini, el mejor entorno para que los desarrolladores prototipen y prueben indicaciones es Google AI Studio. AI Studio es un entorno de prueba para experimentar con todos los modelos de IA disponibles antes de escribir cualquier código, y también es el punto de entrada para construir con la API Gemini.

Puedes usar Nano Banana Pro dentro de AI Studio. Para comenzar, ve a aistudio.google.com, inicia sesión con tu cuenta de Google y selecciona Nano Banana Pro (Gemini 3 Pro Image) desde el selector de modelos.

A diferencia de Nano-Banana, la versión Pro no tiene una capa gratuita, lo que significa que necesitas seleccionar una clave de API con facturación habilitada (ver sección “configuración del proyecto” a continuación).

Comienza con Nano Banana Pro en AI Studio

Consejo: También puedes codificar aplicaciones web de Nano Banana directamente en AI Studio en ai.studio/apps, o explorar el código y remixear una de las aplicaciones existentes.

2) Configuración del proyecto

Para seguir esta guía, necesitarás lo siguiente:

Si ya eres un usuario avanzado de la API Gemini con todo esto, ¡genial! Simplemente omite esta sección y pasa a la siguiente. De lo contrario, aquí te explicamos cómo comenzar:

Paso A: Obtén tu clave de API

Cuando inicies sesión por primera vez en AI Studio, se creará automáticamente un proyecto de Google Cloud y una clave de API.

Abre la pantalla de administración de claves de API y haz clic en el ícono “copiar” para copiar tu clave de API.

Copia tu clave de API

Paso B: Habilita la facturación

Como Nano Banana Pro no tiene una capa gratuita, debes habilitar la facturación en tu proyecto de Google Cloud.

En la pantalla de administración de claves de API, haz clic en Configurar facturación junto a tu proyecto y sigue las instrucciones en pantalla.

Configurar facturación

¿Cuánto cuesta Nano Banana Pro?

La generación de imágenes con Nano Banana Pro es más cara que la versión Flash, especialmente para imágenes en 4K. En el momento de publicación de este artículo, una imagen en 1K o 2K cuesta $0.134, mientras que una en 4K cuesta $0.24 (más el costo de los tokens de entrada y salida de texto).

Consulta los precios en la documentación para obtener los detalles más recientes.

Consejo profesional: Para ahorrar un 50% en tus costos de generación, puedes usar la API por lotes. A cambio, podrías tener que esperar hasta 24 horas antes de obtener tus imágenes.

Paso C: Instala el SDK

Elige el SDK para tu lenguaje preferido.

Python:

pip install -U google-genai
# Instala la biblioteca Pillow para manipulación de imágenes
pip install Pillow

JavaScript / TypeScript:

npm install @google/genai

Nota: Los siguientes ejemplos usan el SDK de Python para demostración. Fragmentos de código equivalentes para usar Nano Banana en JavaScript se proporcionan en este Cuaderno JS.

3) Inicializa el cliente

Para usar el modelo Pro, necesitarás usar el ID del modelo gemini-3-pro-image-preview.

from google import genai
from google.genai import types

# Inicializa el cliente
client = genai.Client(api_key="TU_CLAVE_DE_API")

# Establece el ID del modelo
PRO_MODEL_ID = "gemini-3-pro-image-preview"

4) Generación básica (los clásicos)

Antes de entrar en lo sofisticado, veamos una generación estándar. Puedes controlar la salida usando response_modalities (para obtener texto e imágenes o solo imágenes) y aspect_ratio.

prompt = "Crea una imagen fotorrealista de un gato siamés con un ojo izquierdo verde y uno derecho azul"
aspect_ratio = "16:9" # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9" o "21:9"

response = client.models.generate_content(
    model=PRO_MODEL_ID,
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=['Text', 'Image'], # O solo ['Image']
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
        )
    )
)

# Guarda la imagen
for part in response.parts:
    if image:= part.as_image():
        image.save("cat.png")

Gato siamés

El modo chat también es una opción (de hecho, es lo que recomendaría para ediciones de múltiples turnos). Consulta el ejemplo 8, “Polyglot Banana”, para ver un ejemplo.

5) El proceso de “pensamiento” (¡Está vivo!)

Nano Banana Pro no solo dibuja; está pensando. Esto significa que puede razonar sobre tus indicaciones más complejas y retorcidas antes de generar una imagen. Y lo mejor de todo: ¡puedes mirar dentro de su cerebro!

Para habilitar esto, establece include_thoughts=True en thinking_config.

prompt = "Crea una imagen inusual pero realista que podría volverse viral"
aspect_ratio = "16:9"

response = client.models.generate_content(
    model=PRO_MODEL_ID,
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=['Text', 'Image'],
        image_config=types.ImageConfig(
            aspect_ratio=aspect_ratio,
        ),
        thinking_config=types.ThinkingConfig(
            include_thoughts=True # Habilita pensamientos
        )
    )
)

# Guarda la imagen y los pensamientos
for part in response.parts:
  if part.thought:
    print(f"Pensamiento: {part.text}")
  elif image:= part.as_image():
    image.save("viral.png")

Y deberías obtener algo como:

## Imaginando Llamas Comutantes

Ahora me estoy enfocando en las llamas. El objetivo es capturarlas como
comutantes diarios en un autobús bullicioso en La Paz, Bolivia. Mi plan
implica un autobús vintage abarrotado de pasajeros divertidos. La imagen
destacará detalles como una llama mirando por la ventana,
otra interactuando con un pasajero, mientras la gente toma
fotos.

[IMAGEN]

## Visualizando el Concepto

Ahora estoy completamente inmerso en el escenario solicitado. Mi enfoque principal
es en los aspectos "inusuales pero realistas". La escena está comenzando a tomar forma
con los elementos clave establecidos.

Imagen viral

Esta transparencia te ayuda a entender cómo el modelo interpretó tu solicitud. ¡Es como tener una conversación con tu artista!

6) Anclaje a búsquedas (magia en tiempo real)

Una de las características más revolucionarias es el Anclaje a búsquedas. Nano Banana Pro no está atrapado en el pasado; puede acceder a datos en tiempo real de Google Search para generar imágenes precisas y actualizadas. ¿Quieres el clima? Lo tienes.

Por ejemplo, puedes pedirle que visualice el pronóstico del clima actual:

prompt = "Visualiza el pronóstico del clima actual para los próximos 5 días en Tokio como un gráfico de clima limpio y moderno. Añade una visualización de lo que debo usar cada día"

response = client.models.generate_content(
    model=PRO_MODEL_ID,
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=['Text', 'Image'],
        image_config=types.ImageConfig(
            aspect_ratio="16:9",
        ),
        tools=[{"google_search": {}}] # Habilita Google Search
    )
)

# Guarda la imagen
for part in response.parts:
    if image:= part.as_image():
        image.save("weather.png")

# Muestra fuentes (siempre debes hacerlo)
print(response.candidates[0].grounding_metadata.search_entry_point.rendered_content)

Clima en Tokio

7) ¡Ve grande o vete a casa: generación en 4K!

¿Necesitas imágenes de calidad para impresión? Nano Banana Pro admite resolución 4K. Porque a veces, más grande es mejor.

prompt = "Una foto de un roble experimentando cada estación"
resolution = "4K" # Opciones: "1K", "2K", "4K", ten cuidado, minúsculas no funcionan.

response = client.models.generate_content(
    model=PRO_MODEL_ID,
    contents=prompt,
    config=types.GenerateContentConfig(
        response_modalities=['Text', 'Image'],
        image_config=types.ImageConfig(
            aspect_ratio="1:1",
            image_size=resolution
        )
    )
)

Roble experimentando todas las estaciones

Nota: La generación en 4K tiene un costo más alto, ¡así que úsala con sabiduría!

8) Polyglot Banana (capacidades multilingües)

El modelo puede generar e incluso traducir texto dentro de imágenes en más de una docena de idiomas. Es básicamente un traductor universal para tus ojos.

# Genera una infografía en español
message = "Haz una infografía explicando la teoría de la Relatividad General de Einstein adecuada para un estudiante de sexto grado en español"

response = chat.send_message(message,
    config=types.GenerateContentConfig(
        image_config=types.ImageConfig(aspect_ratio="16:9")
    )
)

# Guarda la imagen
for part in response.parts:
    if image:= part.as_image():
        image.save("relativity.png")

Relatividad General en español

# Tradúcela al japonés
message = "Traduce esta infografía al japonés, manteniendo todo lo demás igual"
response = chat.send_message(message)

# Guarda la imagen
for part in response.parts:
    if image:= part.as_image():
        image.save("relativity_JP.png")

Relatividad General en japonés

9) ¡Mezclalo! (mezcla avanzada de imágenes)

Mientras que el modelo Flash puede mezclar hasta 3 imágenes, el modelo Pro puede manejar hasta 14 imágenes. ¡Eso es toda una fiesta en una sola indicación. Perfecto para crear collages complejos o mostrar toda tu línea de productos.

# Mezcla múltiples imágenes
response = client.models.generate_content(
    model=PRO_MODEL_ID,
    contents=[
        "Una foto grupal de oficina de estas personas, están haciendo caras divertidas.",
        PIL.Image.open('John.png'),
        PIL.Image.open('Jane.png'),
        # ... añade hasta 14 imágenes
    ],
)

# Guarda la imagen
for part in response.parts:
    if image:= part.as_image():
        image.save("group_picture.png")

Nota: Si deseas una fidelidad muy alta para tus personajes, limita a 5, ¡lo cual ya es más que suficiente para una noche de fiesta!

10) ¡Hora de presumir! (demostraciones exclusivas de Pro)

Aquí hay algunos ejemplos de lo que solo es posible con Nano Banana Pro. Prepárate para quedar asombrado:

Arte pixel personalizado (anclaje a búsquedas)

Indicación: “Busca en la web y luego genera una imagen en perspectiva isométrica, arte pixel detallado que muestre la carrera de Guillaume Vernade”

Esto usa el anclaje a búsquedas para encontrar información específica sobre una persona y visualizarla en un estilo específico.

Carrera de Guillaume Vernade

Integración compleja de texto

Indicación: “Muéstrame una infografía sobre cómo funcionan los sonetos, usando un soneto sobre plátanos escrito en él, junto con un análisis literario extenso del poema. Buenos estilos vintage”

El modelo puede generar texto coherente y extenso e integrarlo perfectamente en un diseño complejo.

Maquetas de alta fidelidad

Indicación: “Una foto de un programa para el espectáculo de Broadway sobre jugadores de TCG en un asiento de teatro agradable, es profesional y bien hecho, brillante, podemos ver la portada y una página que muestra una foto del escenario.”

Crea maquetas fotorrealistas de materiales impresos con iluminación y textura precisas.

## 11) Buenas prácticas y consejos para prompts con Nano Banana y Nano Banana Pro

Para obtener los mejores resultados con los modelos Nano Banana, sigue estas pautas para crear prompts:

Sé hiperespecífico: Cuanto más detalle proporciones sobre sujetos, colores, iluminación y composición, más control tendrás sobre la salida.

Proporciona contexto e intención: Explica el propósito o el estado de ánimo deseado de la imagen. La comprensión del contexto por parte del modelo influirá en sus elecciones creativas.

Itera y refina: No esperes la perfección en el primer intento. Utiliza la capacidad conversacional del modelo para realizar cambios graduales y perfeccionar tu imagen.

Usa instrucciones paso a paso: Para escenas complejas, divide tu prompt en una serie de instrucciones claras y secuenciales.

Usa un enfoque positivo: En lugar de prompts negativos como “sin coches”, describe la escena deseada de forma positiva: “una calle vacía y desierta sin señales de tráfico”.

Controla la cámara: Usa términos fotográficos y cinematográficos para dirigir la composición, como “toma de ángulo ancho”, “toma macro” o “perspectiva de ángulo bajo”.

Aprovecha la búsqueda con anclaje: Cuando sepas que deseas que el modelo utilice datos en tiempo real o del mundo real, sé muy preciso al respecto. “Busca en la web sobre el último partido del Olympique Lyonnais y crea una infografía” funcionará mejor que simplemente “una infografía de los últimos partidos del OL” (que aún debería funcionar, pero no tomes riesgos).

Usa la API por lotes para reducir tus costos y obtener más cuota: La API por lotes permite enviar juntos lotes pequeños o muy grandes de solicitudes. Pueden tardar hasta 24 horas en procesarse, pero a cambio puedes ahorrar un 50 % en tus costos de generación. ¡Y la cuota también es mayor!

Para profundizar en las mejores prácticas, consulta la guía de prompts en la documentación y las mejores prácticas para prompts para Nano Banana publicadas en el blog oficial.

Conclusión

Nano Banana Pro (Gemini 3 Pro Image) abre un nuevo horizonte para la generación de imágenes con IA. Con su capacidad para pensar, buscar y renderizar en 4K, es una herramienta para creadores serios (y diversión seria).

¿Listo para probarlo? Ve a Google AI Studio, prueba o personaliza nuestras Aplicaciones o echa un vistazo al cuaderno de recetas.