Introducción
"Nano Banana" es el apodo con el que se conoce, de manera informal, a la generación nativa de imágenes del modelo Gemini 2.5 Flash Image de Google. Más allá del nombre curioso, el aporte real es que puedes crear o editar imágenes describiendo con palabras lo que quieres lograr.
Desde un retrato con fondo desenfocado hasta un póster con estética retro o una composición de producto sobre un escenario específico. La gran ventaja para personas sin experiencia es que no hay que partir de herramientas complejas: puedes comenzar desde el navegador, en Google AI Studio, y en minutos tener resultados aprovechables.
Si ya programas, la API te permite integrar flujos de generación y edición en aplicaciones web, paneles internos o pipelines creativos. Este artículo explica las dos rutas: sin código para validar ideas de inmediato, y con código para llevarlo a producción con JavaScript o Python.
¿Qué es "Nano Banana" y por qué es útil?
Cuando hablamos de "Nano Banana" nos referimos a la capacidad del modelo de Google para generar y editar imágenes a partir de instrucciones en lenguaje natural. Mientras que otras herramientas requieren múltiples pasos en editores como Photoshop, aquí describes el resultado deseado y el modelo se encarga del resto.
🎯 Es especialmente útil para quienes necesitan:
- 🔸Prototipar ideas visuales para redes, blogs y landing pages.
- 🔸Preparar bocetos de branding o estilos fotográficos antes de una sesión real.
- 🔸Hacer retoques rápidos en imágenes existentes (eliminar objetos, corregir color, desenfoque selectivo).
- 🔸Construir catálogos de producto con variantes de iluminación, fondo y encuadre.
Requisitos y configuración inicial
🔑 Cuenta y clave
Crea tu API key en Google AI Studio y guárdala como variable de entorno GEMINI_API_KEY
🛤️ Elección de ruta
Comienza con el flujo sin código (AI Studio) para validar, luego pasa a integración con código
🎯 Modelo correcto
Usa el identificador gemini-2.5-flash-image
en tus solicitudes
⚖️ Licencias y políticas
Respeta usos permitidos, privacidad y marcas de agua invisibles (SynthID) aplicadas en contenido generado
🎨 Generación sin código en Google AI Studio
Empieza a crear imágenes con Gemini 2.5 Flash Image directamente desde el navegador, sin instalar SDKs. Sigue estos pasos con capturas y notas claras para principiantes.
- 1
Accede y crea tu cuenta
Entra a Google AI Studio con tu cuenta de Google. En la pantalla inicial, haz clic en “Use Google AI Studio/ Try Gemini”
botón “Try Gemini”. - 2
Acepta los terminos y condiciones
Terminos y condiciones. - 3
Selecciona el modelo correcto
Abre el selector de modelos y elige
gemini-2.5-flash-image-preview
. Evita confundirlo congemini-pro
(texto) ogemini-1.5
(multimodal).✔ Generación de imágenes
gemini-2.5-flash-image-preview
Texto
gemini-pro
Multimodal
gemini-1.5
Modelos de generación - 4
Escribe un prompt claro (descripción)
Indica sujeto, luz, ambiente, estilo y tamaño. Evita frases vagas como “hazlo bonito”. Sé específico.
Plantilla orientativa
Sujeto principal + entorno + tipo de luz + estilo/estética + encuadre + resolución/aspect ratio Ej.: “Taza de café cerámica blanca sobre mesa de madera clara, luz lateral suave, estilo editorial realista, encuadre cercano, formato cuadrado 1024x1024”.
Prompt - 5
Configura los parámetros clave
Ajusta estos controles en el panel lateral de AI Studio:
Resolución
- 512×512 → rápido, pruebas.
- 1024×1024 → balance recomendado.
- 2048×2048 → máxima calidad (más tiempo).
Temperature (creatividad)
- 0.3 → resultados consistentes.
- 0.5–0.7 → balance.
- 1.0 → más variedad, menos control.
Relación de aspecto
- 1:1 → cuadrado (producto, catálogo).
- 16:9 → horizontal (web, slides).
- 9:16 → vertical (reels/historias).
Consejo: comienza con 1024×1024 y Temperature 0.5. Si buscas estilos más creativos, sube gradualmente la Temperature.
- 6
Genera, evalúa y refina
Haz clic en Run. Cuando aparezca el resultado:
- Evalúa luz, encuadre y texturas.
- Refina el prompt con cambios puntuales: “incrementa contraste de sombras”, “bokeh más suave en fondo”, “mantén textura natural de piel”.
- Repite hasta lograr coherencia con tu objetivo.
botón “Run” y primer resultado
🔍 Ejemplo guiado (listo para replicar)
Prompt
Retrato corporativo realista de mujer joven en oficina moderna,
bokeh cálido de fondo, luz lateral suave tipo softbox,
encuadre medio, formato 1024x1024.
Parámetros
- Resolución: 1024×1024
- Temperature: 0.5
- Aspect Ratio: 1:1
Refinamientos típicos
- “mantén textura natural de la piel”
- “reduce brillo en frente y mejillas”
- “bokeh ligeramente más suave”

imagen creada con NanoBanana
✅ Checklist antes de descargar
- La luz y el color se ven naturales y consistentes.
- No hay artefactos en bordes de objetos o cabello.
- La resolución y el aspecto (1:1, 16:9, 9:16) son los que necesitas.
- Guardaste el prompt/alias para repetir el estilo.
🛠️ Si algo sale mal
Sombras extrañas o poco realistas
Añade: “sombras suaves y coherentes con luz lateral”, “reflejos sutiles, sin halo”.
Piel demasiado plastificada
Añade: “mantén textura natural de piel”, “evita suavizado excesivo”. Baja la Temperature a 0.4–0.5.
Fondo con ruido o bokeh inconsistente
Indica: “bokeh uniforme y suave”, “fondo limpio sin artefactos”. Prueba 1024×1024 o mayor.
Nota: respeta las políticas de uso de contenido y privacidad. El contenido generado puede incluir marcas de agua invisibles (SynthID) para trazabilidad.
Integración con JavaScript (SDK oficial)
Cuando necesites automatizar o incorporar la generación de imágenes a un sitio o herramienta interna, la integración con JavaScript es muy directa. La idea general es: instancias el cliente con tu API key, envías la descripción (y opcionalmente una imagen) y guardas el binario devuelto como archivo.
🔄 Flujo de trabajo explicado para principiantes
📄 Ejemplo completo en JavaScript
//🚀 Generación de imágenes con Gemini 2.5 Flash Image
// Instalación: npm i @google/genai
// Configuración: export GEMINI_API_KEY="tu_clave_aqui"
import { GoogleGenAI, toGenerativePart } from "@google/genai";
import fs from "node:fs";
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
// ✨ Función para generar imágenes desde texto
async function generarImagen() {
const prompt = `Ilustración de un café humeante en taza cerámica blanca
sobre mesa de madera clara, luz lateral suave, estilo editorial,
formato 1:1 2048x2048, alta calidad`;
const response = await ai.models.generateContent({
model: "gemini-2.5-flash-image",
contents: [{ role: "user", parts: [{ text: prompt }] }]
});
// 💾 Guardar imágenes generadas
const parts = response.candidates?.[0]?.content?.parts ?? [];
parts.forEach((part, index) => {
if (part.inlineData) {
fs.writeFileSync(
`cafe_generado_${index}.png`,
Buffer.from(part.inlineData.data, "base64")
);
console.log(`✅ Imagen ${index + 1} guardada exitosamente`);
}
});
}
// 🎨 Función para editar imágenes existentes
async function editarImagen() {
const prompt = `Elimina la cuchara del plato y aumenta ligeramente
el contraste del café, mantén la iluminación natural`;
const imageBytes = fs.readFileSync("./cafe_original.jpg");
const imagePart = toGenerativePart(imageBytes, "image/jpeg");
const response = await ai.models.generateContent({
model: "gemini-2.5-flash-image",
contents: [{
role: "user",
parts: [{ text: prompt }, imagePart]
}]
});
// 💾 Guardar versión editada
const parts = response.candidates?.[0]?.content?.parts ?? [];
parts.forEach((part, index) => {
if (part.inlineData) {
fs.writeFileSync(
`cafe_editado_${index}.png`,
Buffer.from(part.inlineData.data, "base64")
);
}
});
}
// 🚀 Ejecutar flujo completo
generarImagen()
.then(() => editarImagen())
.then(() => console.log('🎉 Proceso completado'))
.catch(console.error);
Integración con Python (SDK oficial)
En Python el patrón es idéntico: crea el cliente, envía la descripción y guarda la imagen. Si trabajas en ciencia de datos, esta ruta es cómoda para incorporar el modelo a notebooks o scripts de preproducción.
📄 Ejemplo completo en Python
# 🐍 Generación de imágenes con Python
# Instalación: pip install -U google-genai
# Configuración: export GEMINI_API_KEY="tu_clave_aqui"
import os
import base64
from pathlib import Path
from google import genai
from google.genai.types import Part
# 🔧 Configuración del cliente
client = genai.Client(api_key=os.environ.get("GEMINI_API_KEY"))
def generar_poster():
"""✨ Genera un póster minimalista para evento de IA"""
prompt = """Póster minimalista para evento de IA, fondo blanco cálido,
tipografía sans bold negra, acento azul vibrante, formato vertical 1080x1350,
composición centrada, jerarquía visual clara, estilo moderno"""
try:
response = client.models.generate_content(
model="gemini-2.5-flash-image",
contents=[prompt]
)
# 💾 Guardar imágenes generadas
for i, part in enumerate(response.candidates[0].content.parts):
if hasattr(part, "inline_data") and part.inline_data:
filename = f"poster_ia_{i}.png"
Path(filename).write_bytes(
base64.b64decode(part.inline_data.data)
)
print(f"✅ {filename} guardado exitosamente")
except Exception as e:
print(f"❌ Error generando póster: {e}")
def editar_poster():
"""🎨 Edita el póster agregando efectos visuales"""
if not Path("poster_ia_0.png").exists():
print("❌ No se encontró el póster base")
return
prompt = """Agrega un degradado sutil azul en el fondo y una sombra
suave al texto principal, mantén el estilo minimalista"""
try:
img_bytes = Path("poster_ia_0.png").read_bytes()
response = client.models.generate_content(
model="gemini-2.5-flash-image",
contents=[
Part.from_text(prompt),
Part.from_bytes(img_bytes, "image/png")
]
)
# 💾 Guardar versión editada
for i, part in enumerate(response.candidates[0].content.parts):
if hasattr(part, "inline_data") and part.inline_data:
filename = f"poster_editado_{i}.png"
Path(filename).write_bytes(
base64.b64decode(part.inline_data.data)
)
print(f"✅ {filename} guardado exitosamente")
except Exception as e:
print(f"❌ Error editando póster: {e}")
if __name__ == "__main__":
print("🚀 Iniciando generación de póster...")
generar_poster()
print("🎨 Aplicando ediciones...")
editar_poster()
print("🎉 Proceso completado")
REST con cURL: prueba mínima
Si prefieres no instalar SDKs, puedes usar cURL para enviar una solicitud REST y decodificar la respuesta base64 en tu lenguaje favorito.
📄 Ejemplo con cURL
# 🌐 Solicitud REST con cURL
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-image:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-H "Accept: application/json" \
-d '{
"contents": [{
"parts": [{
"text": "Infografía isométrica de ciberseguridad, estilo limpio y moderno, paleta azul/gris, tipografía legible, iconografía consistente, formato 1920x1080, alta resolución"
}]
}],
"generationConfig": {
"temperature": 0.7,
"maxOutputTokens": 2048
}
}' | jq '.candidates[0].content.parts[0].inlineData.data' | base64 -d > infografia.png
Edición por texto: qué pedir y cómo pedirlo
💡 La edición funciona mejor cuando das instrucciones concretas y, si es necesario, limitas el área afectada con descripciones claras.
🗑️ Eliminar objetos
"Elimina el cable que cruza por el piso y reconstruye el patrón de la madera"
💡 Reiluminación suave
"Iluminación templada lateral desde la izquierda, sombras suaves, tono cálido"
🎨 Corrección de color
"Balance de blancos neutro, contraste +8%, saturación +5%, sin recortar"
🌀 Desenfoque de fondo
"Bokeh suave en el fondo y nitidez leve en el sujeto principal, mantén ojos y manos bien definidos"
Fusión de múltiples imágenes (multi-image fusion)
La fusión permite combinar un sujeto con un escenario nuevo de forma coherente, ajustando perspectiva e iluminación. Esto agiliza muchísimo catálogos de producto y previsualizaciones de campañas.
Prepara tus archivos
Sujeto (PNG con fondo transparente si lo tienes) y escenario (JPG/PNG)
Indica posición y acabado
"sobre mesa de madera clara, luz natural de ventana, reflejo sutil en la superficie"
Genera y refina
Genera varias variantes y escoge la más realista; si la sombra o el reflejo no convencen, acláralo en la siguiente iteración
Prompts recomendados
🎯 Prompts curados por categoría para que puedas copiar, pegar y adaptar según tus necesidades específicas.
Producto
Composición de producto: smartphone sobre superficie de mármol blanco, luz lateral fría profesional, sombras suaves definidas, reflejo sutil en la superficie; formato 2000px lado mayor; estilo publicitario limpio y premium
Retrato
Convierte esta foto en retrato corporativo profesional: limpia la piel de forma natural, balance de blancos neutro, fondo gris medio con bokeh suave; respeta rasgos reales, iluminación favorecedora
Infografía
Infografía isométrica sobre ciberseguridad doméstica, tipografía sans serif legible, layout en 2 columnas, paleta azul/gris corporativa, 1920x1080; estilo minimal moderno, iconografía consistente y clara
Póster
Póster minimalista para evento de IA, fondo blanco cálido, tipografía sans bold negra, acento azul vibrante, formato vertical 1080x1350; composición centrada y jerarquía visual clara
Edición
Edita esta imagen: elimina el cable del piso y reconstruye el patrón de madera de forma natural; mantiene iluminación original y textura consistente, sin artefactos
Iluminación
Reilumina con iluminación templada lateral desde la izquierda, sombras suaves y naturales, realce de contraste +8%, saturación +5%, sin recorte de highlights
Fusión
Funde estas dos imágenes (producto + escenario): coloca el termo azul sobre mesa de madera clara, luz natural de ventana, sombra de contacto realista y reflejo sutil
Variaciones
Genera 4 variaciones de iluminación: amanecer cálido dorado, mediodía neutro brillante, tarde dorada suave y noche con neón azul; conserva encuadre y elementos base
ℹ️Nota: Los prompts se definen en el TypeScript del componente y se renderizan dinámicamente para facilitar el mantenimiento y las pruebas A/B.
Ejemplos prácticos: del prompt al resultado
🎯 Tutoriales visuales paso a paso para que veas exactamente cómo aplicar los prompts y qué resultados esperar en cada caso de uso.
Ejemplo 1: De catálogo neutro a lifestyle realista
1 Prompt inicial (ficha de producto)
Imagen base para tienda: limpia, de pie, con sombra real.
"Smartphone negro mate DE PIE (upright), vista frontal 3/4, centrado. Fondo blanco puro #FFFFFF sin banding, seamless. Sombra de suelo suave y realista (drop shadow natural, ángulo 35°, opacidad 25–35%). Iluminación de estudio uniforme con softbox, sin hotspots, balance neutro (5600K). Reflejo frontal muy sutil (5–8%) para resaltar el vidrio. Sin props, sin textos, sin branding inventado. Alta resolución y bordes nítidos. No deformar el dispositivo ni alterar su proporción."
- Se solicita “DE PIE” explícitamente y sombra coherente.
- Neutro y listo para recorte o subida directa al catálogo.

imagen creada con NanoBanana
2 Configuración recomendada
Modelo
gemini-2.5-flash-image
Resolución
1024×1024
Suficiente para tienda + recorte
Temperature
0.5–0.7
Control de consistencia
3 Edición (cambio claro, sin exagerar colores)
Usa este prompt en modo edición para pasar de “catálogo” a “lifestyle sobrio”:
"Conserva el smartphone con su forma y proporciones intactas. Mantén la posición de pie. Cambia el fondo blanco por una mesa de madera clara mate y pared gris cálido muy suave (#F3F4F6). Iluminación tipo ventana lateral (difusa), sombras suaves y coherentes; añade una sombra de contacto más marcada bajo el borde del teléfono. Introduce un único accesorio discreto a la izquierda (estuche de audífonos blanco cerrado), desenfocado sutil (profundidad de campo ligera). Aplica un ligero color grading neutro (sin tonos magenta/cian fuertes). Realza microdetalle en el borde metálico del teléfono y reduce reflejos especulares en la pantalla. No añadir textos, logotipos inventados ni elementos llamativos. Estética calmada, premium y realista."
- Cambio visible: fondo + superficie + luz + prop mínimo.
- Se mantiene la lectura del producto para e-commerce.
- Sin colores chillones; look premium y natural.

imagen creada con NanoBanana
🔍 Comparación rápida


- Qué cambió: fondo (blanco → pared suave), superficie (mármol → madera), luz (softbox → ventana difusa), prop mínimo desenfocado, sombra de contacto más real.
- Por qué ayuda: mantiene legibilidad de e-commerce y añade contexto premium sin distracciones.
✨ Resultado esperado
Dos versiones coherentes para tu tienda: una de catálogo puro y otra lifestyle realista. El producto se mantiene intacto; el entorno comunica calidad.
Ejemplo 2: Edición de imagen existente
1 Imagen original

imagen creada con NanoBanana
Problema: Baby banana sin protagonismo, fondo gris aburrido, luz plana que no resalta textura.
2 Prompt de edición
"Convierte el plátano en una espada futurista de energía azul, manteniendo la mano que lo sostiene. El cuerpo del plátano debe transformarse en una hoja brillante con textura de plasma, emitiendo destellos de luz azul intensa y reflejos metálicos en los bordes. Las cáscaras abiertas deben convertirse en aletas tecnológicas de aspecto cibernético. Cambia el fondo gris por un paisaje espacial con estrellas y nebulosas púrpuras difuminadas, generando contraste con el resplandor azul de la espada. Asegúrate de que la iluminación de la mano y el resplandor de la hoja coincidan para lograr realismo"
3 Resultado final

imagen creada con NanoBanana
Logrado: Baby banana convertida en protagonista: detalle heroico, iluminación que resalta su textura, fondo minimalista que la hace parecer una joya en exhibición.
Tips para replicar estos ejemplos
Buenas prácticas y errores frecuentes
Buenas prácticas
- •Describe sujeto, luz, ambiente, estilo y tamaño; evita etiquetas inconexas
- •Itera con cambios mínimos entre versiones para comparar con criterio
- •Especifica orientación y resolución final para evitar recortes no deseados
- •Si trabajas con marca, define paleta y referencias visuales desde el inicio
- •Documenta: guarda prompts, versiones y decisiones de diseño
Errores a evitar
- •Prompts vagos ("hazlo bonito") sin detalle técnico de luz/estilo
- •Ignorar un paso de ajuste final (nitidez, compresión, perfil de color)
- •No revisar políticas de contenido ni derechos de imagen
- •No controlar el peso de archivos al exportar para web
Preguntas frecuentes
🍌 ¿"Nano Banana" es un producto distinto a Gemini?
Es el alias coloquial de la generación nativa de imágenes con el modelo Gemini 2.5 Flash Image. En la práctica, usarás el identificador del modelo de imagen vigente en tus llamadas a la API.
🎨 ¿Necesito saber diseño?
No es imprescindible, pero ayuda comprender conceptos básicos de luz, composición y color. Con descripciones claras puedes obtener resultados muy dignos y mejorar con iteración.
💼 ¿Se puede usar en flujos profesionales?
Sí, integrándolo con SDKs y estableciendo controles de calidad visual, políticas de derechos y versiones de exportación para web/impresión.
📱 ¿Esto es lo mismo que "Gemini Nano" en Android?
No. Gemini Nano es el modelo on-device para Android. Aquí nos centramos en la generación/edición de imágenes vía API (Gemini 2.5 Flash Image).
🍌 Dale superpoderes a tus imágenes con Nano Banana
Genera una imagen de catálogo impecable y edítala con precisión milimétrica. Cambios claros y profesionales sin colores exagerados: luz natural, superficies reales y detalles que venden.
Ideal para e-commerce • Cambios significativos en segundos • Mantén la estética de marca sin estridencias
📚 Referencias / Lecturas recomendadas
- 🔗Documentación oficial del modelo de imagen de Gemini (identificadores y cuotas vigentes)
- 🔗Guías de prompting para generación/edición de imágenes y políticas de uso