Cómo usar Nano Banana (Gemini 2.5 Flash Image) para generar y editar imágenes con IA

🚀

Introducción

"Nano Banana" es el apodo con el que se conoce, de manera informal, a la generación nativa de imágenes del modelo Gemini 2.5 Flash Image de Google. Más allá del nombre curioso, el aporte real es que puedes crear o editar imágenes describiendo con palabras lo que quieres lograr.

Desde un retrato con fondo desenfocado hasta un póster con estética retro o una composición de producto sobre un escenario específico. La gran ventaja para personas sin experiencia es que no hay que partir de herramientas complejas: puedes comenzar desde el navegador, en Google AI Studio, y en minutos tener resultados aprovechables.

Si ya programas, la API te permite integrar flujos de generación y edición en aplicaciones web, paneles internos o pipelines creativos. Este artículo explica las dos rutas: sin código para validar ideas de inmediato, y con código para llevarlo a producción con JavaScript o Python.

🤔

¿Qué es "Nano Banana" y por qué es útil?

Cuando hablamos de "Nano Banana" nos referimos a la capacidad del modelo de Google para generar y editar imágenes a partir de instrucciones en lenguaje natural. Mientras que otras herramientas requieren múltiples pasos en editores como Photoshop, aquí describes el resultado deseado y el modelo se encarga del resto.

🎯 Es especialmente útil para quienes necesitan:

🔸Prototipar ideas visuales para redes, blogs y landing pages.
🔸Preparar bocetos de branding o estilos fotográficos antes de una sesión real.
🔸Hacer retoques rápidos en imágenes existentes (eliminar objetos, corregir color, desenfoque selectivo).
🔸Construir catálogos de producto con variantes de iluminación, fondo y encuadre.

⚙️

Requisitos y configuración inicial

🔑 Cuenta y clave

Crea tu API key en Google AI Studio y guárdala como variable de entorno GEMINI_API_KEY

🛤️ Elección de ruta

Comienza con el flujo sin código (AI Studio) para validar, luego pasa a integración con código

🎯 Modelo correcto

Usa el identificador gemini-2.5-flash-image en tus solicitudes

⚖️ Licencias y políticas

Respeta usos permitidos, privacidad y marcas de agua invisibles (SynthID) aplicadas en contenido generado

🎨 Generación sin código en Google AI Studio

Empieza a crear imágenes con Gemini 2.5 Flash Image directamente desde el navegador, sin instalar SDKs. Sigue estos pasos con capturas y notas claras para principiantes.

1
Accede y crea tu cuenta
Entra a Google AI Studio con tu cuenta de Google. En la pantalla inicial, haz clic en “Use Google AI Studio/ Try Gemini”
botón “Try Gemini”.
2
Acepta los terminos y condiciones
Terminos y condiciones.
3
Selecciona el modelo correcto
Abre el selector de modelos y elige gemini-2.5-flash-image-preview. Evita confundirlo con gemini-pro (texto) o gemini-1.5 (multimodal).
✔ Generación de imágenes
gemini-2.5-flash-image-preview
Texto
gemini-pro
Multimodal
gemini-1.5
Modelos de generación

Escribe un prompt claro (descripción)

Indica sujeto, luz, ambiente, estilo y tamaño. Evita frases vagas como “hazlo bonito”. Sé específico.

Plantilla orientativa

Sujeto principal + entorno + tipo de luz + estilo/estética + encuadre + resolución/aspect ratio
Ej.: “Taza de café cerámica blanca sobre mesa de madera clara, luz lateral suave, estilo editorial realista, encuadre cercano, formato cuadrado 1024x1024”.

5
Configura los parámetros clave
Ajusta estos controles en el panel lateral de AI Studio:
Resolución
512×512 → rápido, pruebas.
1024×1024 → balance recomendado.
2048×2048 → máxima calidad (más tiempo).
Temperature (creatividad)
0.3 → resultados consistentes.
0.5–0.7 → balance.
1.0 → más variedad, menos control.
Relación de aspecto
1:1 → cuadrado (producto, catálogo).
16:9 → horizontal (web, slides).
9:16 → vertical (reels/historias).
Consejo: comienza con 1024×1024 y Temperature 0.5. Si buscas estilos más creativos, sube gradualmente la Temperature.
6
Genera, evalúa y refina
Haz clic en Run. Cuando aparezca el resultado:
- Evalúa luz, encuadre y texturas.
- Refina el prompt con cambios puntuales: “incrementa contraste de sombras”, “bokeh más suave en fondo”, “mantén textura natural de piel”.
- Repite hasta lograr coherencia con tu objetivo.
botón “Run” y primer resultado

🔍 Ejemplo guiado (listo para replicar)

Prompt

Retrato corporativo realista de mujer joven en oficina moderna, 
bokeh cálido de fondo, luz lateral suave tipo softbox, 
encuadre medio, formato 1024x1024.

Parámetros

Resolución: 1024×1024
Temperature: 0.5
Aspect Ratio: 1:1

Refinamientos típicos

“mantén textura natural de la piel”
“reduce brillo en frente y mejillas”
“bokeh ligeramente más suave”

Resultado esperado del retrato corporativo — Resultado esperado: retrato listo para perfil profesional.
imagen creada con NanoBanana

✅ Checklist antes de descargar

La luz y el color se ven naturales y consistentes.
No hay artefactos en bordes de objetos o cabello.
La resolución y el aspecto (1:1, 16:9, 9:16) son los que necesitas.
Guardaste el prompt/alias para repetir el estilo.

🛠️ Si algo sale mal

Sombras extrañas o poco realistas

Añade: “sombras suaves y coherentes con luz lateral”, “reflejos sutiles, sin halo”.

Piel demasiado plastificada

Añade: “mantén textura natural de piel”, “evita suavizado excesivo”. Baja la Temperature a 0.4–0.5.

Fondo con ruido o bokeh inconsistente

Indica: “bokeh uniforme y suave”, “fondo limpio sin artefactos”. Prueba 1024×1024 o mayor.

Nota: respeta las políticas de uso de contenido y privacidad. El contenido generado puede incluir marcas de agua invisibles (SynthID) para trazabilidad.

💻

Integración con JavaScript (SDK oficial)

Cuando necesites automatizar o incorporar la generación de imágenes a un sitio o herramienta interna, la integración con JavaScript es muy directa. La idea general es: instancias el cliente con tu API key, envías la descripción (y opcionalmente una imagen) y guardas el binario devuelto como archivo.

🔄 Flujo de trabajo explicado para principiantes

🔧Inicializar: instala el SDK y crea un cliente con tu clave

📝Describir: arma un texto claro con el resultado deseado

⚡Generar: envía la solicitud al modelo y espera la respuesta

💾Guardar: recorre las partes de la respuesta y escribe el archivo

📄 Ejemplo completo en JavaScript

//🚀 Generación de imágenes con Gemini 2.5 Flash Image
// Instalación: npm i @google/genai
// Configuración: export GEMINI_API_KEY="tu_clave_aqui"

import { GoogleGenAI, toGenerativePart } from "@google/genai";
import fs from "node:fs";

const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });

// ✨ Función para generar imágenes desde texto
async function generarImagen() {
  const prompt = `Ilustración de un café humeante en taza cerámica blanca 
    sobre mesa de madera clara, luz lateral suave, estilo editorial, 
    formato 1:1 2048x2048, alta calidad`;
    
  const response = await ai.models.generateContent({
    model: "gemini-2.5-flash-image",
    contents: [{ role: "user", parts: [{ text: prompt }] }]
  });

  // 💾 Guardar imágenes generadas
  const parts = response.candidates?.[0]?.content?.parts ?? [];
  parts.forEach((part, index) => {
    if (part.inlineData) {
      fs.writeFileSync(
        `cafe_generado_${index}.png`,
        Buffer.from(part.inlineData.data, "base64")
      );
      console.log(`✅ Imagen ${index + 1} guardada exitosamente`);
    }
  });
}

// 🎨 Función para editar imágenes existentes
async function editarImagen() {
  const prompt = `Elimina la cuchara del plato y aumenta ligeramente 
    el contraste del café, mantén la iluminación natural`;
    
  const imageBytes = fs.readFileSync("./cafe_original.jpg");
  const imagePart = toGenerativePart(imageBytes, "image/jpeg");

  const response = await ai.models.generateContent({
    model: "gemini-2.5-flash-image",
    contents: [{ 
      role: "user", 
      parts: [{ text: prompt }, imagePart] 
    }]
  });

  // 💾 Guardar versión editada
  const parts = response.candidates?.[0]?.content?.parts ?? [];
  parts.forEach((part, index) => {
    if (part.inlineData) {
      fs.writeFileSync(
        `cafe_editado_${index}.png`,
        Buffer.from(part.inlineData.data, "base64")
      );
    }
  });
}

// 🚀 Ejecutar flujo completo
generarImagen()
  .then(() => editarImagen())
  .then(() => console.log('🎉 Proceso completado'))
  .catch(console.error);

🐍

Integración con Python (SDK oficial)

En Python el patrón es idéntico: crea el cliente, envía la descripción y guarda la imagen. Si trabajas en ciencia de datos, esta ruta es cómoda para incorporar el modelo a notebooks o scripts de preproducción.

📄 Ejemplo completo en Python

# 🐍 Generación de imágenes con Python
# Instalación: pip install -U google-genai
# Configuración: export GEMINI_API_KEY="tu_clave_aqui"

import os
import base64
from pathlib import Path
from google import genai
from google.genai.types import Part

# 🔧 Configuración del cliente
client = genai.Client(api_key=os.environ.get("GEMINI_API_KEY"))

def generar_poster():
    """✨ Genera un póster minimalista para evento de IA"""
    prompt = """Póster minimalista para evento de IA, fondo blanco cálido, 
    tipografía sans bold negra, acento azul vibrante, formato vertical 1080x1350,
    composición centrada, jerarquía visual clara, estilo moderno"""
    
    try:
        response = client.models.generate_content(
            model="gemini-2.5-flash-image",
            contents=[prompt]
        )
        
        # 💾 Guardar imágenes generadas
        for i, part in enumerate(response.candidates[0].content.parts):
            if hasattr(part, "inline_data") and part.inline_data:
                filename = f"poster_ia_{i}.png"
                Path(filename).write_bytes(
                    base64.b64decode(part.inline_data.data)
                )
                print(f"✅ {filename} guardado exitosamente")
                
    except Exception as e:
        print(f"❌ Error generando póster: {e}")

def editar_poster():
    """🎨 Edita el póster agregando efectos visuales"""
    if not Path("poster_ia_0.png").exists():
        print("❌ No se encontró el póster base")
        return
        
    prompt = """Agrega un degradado sutil azul en el fondo y una sombra 
    suave al texto principal, mantén el estilo minimalista"""
    
    try:
        img_bytes = Path("poster_ia_0.png").read_bytes()
        
        response = client.models.generate_content(
            model="gemini-2.5-flash-image",
            contents=[
                Part.from_text(prompt), 
                Part.from_bytes(img_bytes, "image/png")
            ]
        )
        
        # 💾 Guardar versión editada
        for i, part in enumerate(response.candidates[0].content.parts):
            if hasattr(part, "inline_data") and part.inline_data:
                filename = f"poster_editado_{i}.png"
                Path(filename).write_bytes(
                    base64.b64decode(part.inline_data.data)
                )
                print(f"✅ {filename} guardado exitosamente")
                
    except Exception as e:
        print(f"❌ Error editando póster: {e}")

if __name__ == "__main__":
    print("🚀 Iniciando generación de póster...")
    generar_poster()
    print("🎨 Aplicando ediciones...")
    editar_poster()
    print("🎉 Proceso completado")

🌐

REST con cURL: prueba mínima

Si prefieres no instalar SDKs, puedes usar cURL para enviar una solicitud REST y decodificar la respuesta base64 en tu lenguaje favorito.

📄 Ejemplo con cURL

# 🌐 Solicitud REST con cURL
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-image:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -H "Accept: application/json" \
  -d '{
    "contents": [{
      "parts": [{
        "text": "Infografía isométrica de ciberseguridad, estilo limpio y moderno, paleta azul/gris, tipografía legible, iconografía consistente, formato 1920x1080, alta resolución"
      }]
    }],
    "generationConfig": {
      "temperature": 0.7,
      "maxOutputTokens": 2048
    }
  }' | jq '.candidates[0].content.parts[0].inlineData.data' | base64 -d > infografia.png

✂️

Edición por texto: qué pedir y cómo pedirlo

💡 La edición funciona mejor cuando das instrucciones concretas y, si es necesario, limitas el área afectada con descripciones claras.

🗑️ Eliminar objetos

"Elimina el cable que cruza por el piso y reconstruye el patrón de la madera"

💡 Reiluminación suave

"Iluminación templada lateral desde la izquierda, sombras suaves, tono cálido"

🎨 Corrección de color

"Balance de blancos neutro, contraste +8%, saturación +5%, sin recortar"

🌀 Desenfoque de fondo

"Bokeh suave en el fondo y nitidez leve en el sujeto principal, mantén ojos y manos bien definidos"

🔄

Fusión de múltiples imágenes (multi-image fusion)

La fusión permite combinar un sujeto con un escenario nuevo de forma coherente, ajustando perspectiva e iluminación. Esto agiliza muchísimo catálogos de producto y previsualizaciones de campañas.

Prepara tus archivos

Sujeto (PNG con fondo transparente si lo tienes) y escenario (JPG/PNG)

Indica posición y acabado

"sobre mesa de madera clara, luz natural de ventana, reflejo sutil en la superficie"

Genera y refina

Genera varias variantes y escoge la más realista; si la sombra o el reflejo no convencen, acláralo en la siguiente iteración

💡

Prompts recomendados

🎯 Prompts curados por categoría para que puedas copiar, pegar y adaptar según tus necesidades específicas.

📦

Producto

Composición de producto: smartphone sobre superficie de mármol blanco, luz lateral fría profesional, sombras suaves definidas, reflejo sutil en la superficie; formato 2000px lado mayor; estilo publicitario limpio y premium

👤

Retrato

Convierte esta foto en retrato corporativo profesional: limpia la piel de forma natural, balance de blancos neutro, fondo gris medio con bokeh suave; respeta rasgos reales, iluminación favorecedora

📊

Infografía

Infografía isométrica sobre ciberseguridad doméstica, tipografía sans serif legible, layout en 2 columnas, paleta azul/gris corporativa, 1920x1080; estilo minimal moderno, iconografía consistente y clara

🎨

Póster

Póster minimalista para evento de IA, fondo blanco cálido, tipografía sans bold negra, acento azul vibrante, formato vertical 1080x1350; composición centrada y jerarquía visual clara

✂️

Edición

Edita esta imagen: elimina el cable del piso y reconstruye el patrón de madera de forma natural; mantiene iluminación original y textura consistente, sin artefactos

💡

Iluminación

Reilumina con iluminación templada lateral desde la izquierda, sombras suaves y naturales, realce de contraste +8%, saturación +5%, sin recorte de highlights

🔄

Fusión

Funde estas dos imágenes (producto + escenario): coloca el termo azul sobre mesa de madera clara, luz natural de ventana, sombra de contacto realista y reflejo sutil

🌈

Variaciones

Genera 4 variaciones de iluminación: amanecer cálido dorado, mediodía neutro brillante, tarde dorada suave y noche con neón azul; conserva encuadre y elementos base

ℹ️Nota: Los prompts se definen en el TypeScript del componente y se renderizan dinámicamente para facilitar el mantenimiento y las pruebas A/B.

🎬

Ejemplos prácticos: del prompt al resultado

🎯 Tutoriales visuales paso a paso para que veas exactamente cómo aplicar los prompts y qué resultados esperar en cada caso de uso.

📱

Ejemplo 1: De catálogo neutro a lifestyle realista

1 Prompt inicial (ficha de producto)

Imagen base para tienda: limpia, de pie, con sombra real.


"Smartphone negro mate DE PIE (upright), vista frontal 3/4, centrado. Fondo blanco puro #FFFFFF sin banding, seamless. Sombra de suelo suave y realista (drop shadow natural, ángulo 35°, opacidad 25–35%). Iluminación de estudio uniforme con softbox, sin hotspots, balance neutro (5600K). Reflejo frontal muy sutil (5–8%) para resaltar el vidrio. Sin props, sin textos, sin branding inventado. Alta resolución y bordes nítidos. No deformar el dispositivo ni alterar su proporción."

Se solicita “DE PIE” explícitamente y sombra coherente.
Neutro y listo para recorte o subida directa al catálogo.

Smartphone de pie sobre fondo blanco, sombra realista — 📸 Imagen de catálogo: fondo blanco puro, sombra de suelo creíble, producto de pie.

2 Configuración recomendada

Modelo

gemini-2.5-flash-image

Resolución

1024×1024

Suficiente para tienda + recorte

Temperature

0.5–0.7

Control de consistencia

3 Edición (cambio claro, sin exagerar colores)

Usa este prompt en modo edición para pasar de “catálogo” a “lifestyle sobrio”:


"Conserva el smartphone con su forma y proporciones intactas. Mantén la posición de pie. Cambia el fondo blanco por una mesa de madera clara mate y pared gris cálido muy suave (#F3F4F6). Iluminación tipo ventana lateral (difusa), sombras suaves y coherentes; añade una sombra de contacto más marcada bajo el borde del teléfono. Introduce un único accesorio discreto a la izquierda (estuche de audífonos blanco cerrado), desenfocado sutil (profundidad de campo ligera). Aplica un ligero color grading neutro (sin tonos magenta/cian fuertes). Realza microdetalle en el borde metálico del teléfono y reduce reflejos especulares en la pantalla. No añadir textos, logotipos inventados ni elementos llamativos. Estética calmada, premium y realista."

Cambio visible: fondo + superficie + luz + prop mínimo.
Se mantiene la lectura del producto para e-commerce.
Sin colores chillones; look premium y natural.

Smartphone de pie en mesa de madera con luz de ventana, accesorio sutil — 🛍️ Escena realista para tienda: mesa, pared suave, luz natural y un único prop desenfocado.

🔍 Comparación rápida

Antes: catálogo en fondo blanco — Antes: catálogo blanco, de pie

Después: lifestyle sobrio con luz de ventana — Después: mesa madera + luz natural

Qué cambió: fondo (blanco → pared suave), superficie (mármol → madera), luz (softbox → ventana difusa), prop mínimo desenfocado, sombra de contacto más real.
Por qué ayuda: mantiene legibilidad de e-commerce y añade contexto premium sin distracciones.

✨ Resultado esperado

Dos versiones coherentes para tu tienda: una de catálogo puro y otra lifestyle realista. El producto se mantiene intacto; el entorno comunica calidad.

✂️

Ejemplo 2: Edición de imagen existente

1 Imagen original

Pantalla de creación de proyecto en Google AI Studio — imagen banana original

Problema: Baby banana sin protagonismo, fondo gris aburrido, luz plana que no resalta textura.

2 Prompt de edición

 "Convierte el plátano en una espada futurista de energía azul, manteniendo la mano que lo sostiene. El cuerpo del plátano debe transformarse en una hoja brillante con textura de plasma, emitiendo destellos de luz azul intensa y reflejos metálicos en los bordes. Las cáscaras abiertas deben convertirse en aletas tecnológicas de aspecto cibernético. Cambia el fondo gris por un paisaje espacial con estrellas y nebulosas púrpuras difuminadas, generando contraste con el resplandor azul de la espada. Asegúrate de que la iluminación de la mano y el resplandor de la hoja coincidan para lograr realismo"

3 Resultado final

Logrado: Baby banana convertida en protagonista: detalle heroico, iluminación que resalta su textura, fondo minimalista que la hace parecer una joya en exhibición.

💡

Tips para replicar estos ejemplos

🔸Sé específico: Menciona materiales, texturas y acabados exactos

🔸Describe la luz: Dirección, intensidad y calidad (suave/dura)

🔸Itera gradualmente: Haz un cambio por vez para evaluar el impacto

🔸Guarda versiones: Documenta qué prompts funcionan mejor

🔸Prueba variaciones: Cambia ángulos y encuadres para más opciones

🔸Verifica calidad: Revisa resolución y compresión antes de usar

⭐

Buenas prácticas y errores frecuentes

✅

Buenas prácticas

•Describe sujeto, luz, ambiente, estilo y tamaño; evita etiquetas inconexas
•Itera con cambios mínimos entre versiones para comparar con criterio
•Especifica orientación y resolución final para evitar recortes no deseados
•Si trabajas con marca, define paleta y referencias visuales desde el inicio
•Documenta: guarda prompts, versiones y decisiones de diseño

❌

Errores a evitar

•Prompts vagos ("hazlo bonito") sin detalle técnico de luz/estilo
•Ignorar un paso de ajuste final (nitidez, compresión, perfil de color)
•No revisar políticas de contenido ni derechos de imagen
•No controlar el peso de archivos al exportar para web

❓

Preguntas frecuentes

🍌 ¿"Nano Banana" es un producto distinto a Gemini?

Es el alias coloquial de la generación nativa de imágenes con el modelo Gemini 2.5 Flash Image. En la práctica, usarás el identificador del modelo de imagen vigente en tus llamadas a la API.

🎨 ¿Necesito saber diseño?

No es imprescindible, pero ayuda comprender conceptos básicos de luz, composición y color. Con descripciones claras puedes obtener resultados muy dignos y mejorar con iteración.

💼 ¿Se puede usar en flujos profesionales?

Sí, integrándolo con SDKs y estableciendo controles de calidad visual, políticas de derechos y versiones de exportación para web/impresión.

📱 ¿Esto es lo mismo que "Gemini Nano" en Android?

No. Gemini Nano es el modelo on-device para Android. Aquí nos centramos en la generación/edición de imágenes vía API (Gemini 2.5 Flash Image).

🍌 Dale superpoderes a tus imágenes con Nano Banana

Genera una imagen de catálogo impecable y edítala con precisión milimétrica. Cambios claros y profesionales sin colores exagerados: luz natural, superficies reales y detalles que venden.

Ideal para e-commerce • Cambios significativos en segundos • Mantén la estética de marca sin estridencias

📚 Referencias / Lecturas recomendadas

🔗Documentación oficial del modelo de imagen de Gemini (identificadores y cuotas vigentes)
🔗Guías de prompting para generación/edición de imágenes y políticas de uso