El experto opina: 'La curiosa historia de Nano-Banana'

Esta semana volvemos a contar con un invitado especial que ya ha participado anteriormente en el blog de Serban Group como experto en Inteligencia Artificial: Mike Mingo.

En el post de hoy Mike nos habla del recién estrenado modelo de IA para creación y edición de imágenes de Google: Nano-Banana. ¿Quieres conocer el secreto de su éxito? ¡Sigue leyendo!

Mike Mingo - Experto en IA

¿Como harán las empresas creadoras de modelos de IA para probar sus modelos, a escala, con usuarios reales? Eso mismo me preguntaba yo.

Resulta que, una vez tienen el modelo entrenado, lo lanzan de manera pública, pero de forma anónima. Así, sin conocer el autor, el modelo se expone a una especie de "cata ciega", compitiendo con otros en un espacio público, donde los usuarios interactúan con ellos y dan su valoración. Uno de esos lugares, quizá el mas popular, se llama LMArena.

Un misterioso modelo, llamado Nano-Banana, llegó a LMArena para pulsar su calidad, ver si era bueno y ajustar lo necesario. Nano-Banana pasó a liderar de inmediato la lista como mejor modelo en las categorías de generación de imágenes y edición de imágenes. En ese momento no se sabía qué empresa estaba detrás pero, dada la calidad, todos apuntaban a alguna de las grandes (OpenAI, Google, Claude, Meta…):

¿Quién está detrás de Nano-Banana?

El pasado 28 de agosto de 2025, Google presentó oficialmente su nuevo modelo y efectivamente era Nano-Banana. El nombre anónimo que usó en LMArena ganó tanto respeto entre el ecosistema que decidieron dejarlo como un “alias”, aunque el nombre real del modelo (ahora disponible para el público general) era Gemini 2.5 Flash Image.

Su increíble subida en popularidad previa al lanzamiento sin duda ayudó a Google a dar notoriedad a su nuevo modelo. Si se trató de una estrategia de Marketing por su parte desde luego resultó exitosa; de hecho si accedemos a Gemini, podemos ver un icono de banana en el apartado de generación de contenido con imagen:

¿Qué resulta tan revolucionario en Nano-Banana?

Si bien la capacidad de generar imágenes es muy buena, lo que realmente ha supuesto un salto de calidad sin precedentes es su capacidad de edición.

Hasta ahora, si le pedíamos a un modelo editar una imagen, especialmente con rostros humanos, obteníamos la edición solicitada pero a coste de arruinar la expresión de las personas. Esto es debido a que, al dictar al modelo un cambio sobre una imagen (por ejemplo: “Ponle un sobrero de cowboy a la persona de la derecha”), el modelo deshace la imagen, y la vuelve a construir (esta vez con el sombrero). Este proceso conocido como “Diffusion” hace que los rostros cambien la expresión, dejando a veces irreconocibles a las personas.

Veámoslo con un ejemplo real:

Como podemos observar, en la imagen editada con otra IA que no es Nano-Banana la edición no solo afecta al sujeto al que se le aplica, si no que altera los rostros del resto de personas que aparecen en la fotografía. Con Nano-Banana la imagen permanece intacta salvo por el sujeto de la derecha que es al único al que le afectan los cambios solicitados.

El problema de los modelos anteriores, por tanto, es que no son capaces de editar solo una parte de la imagen. El modelo debería trabajar solo la parte concreta que le hemos solicitado, dejando el resto de la imagen intacta y eso precisamente es lo que hace Nano-Banana y la razón principal de su éxito.

Me parece importante señalar que Adobe, empresa líder en la edición de imágenes, con productos tan conocidos como Adobe Photoshop, cayó en bolsa un 1,7% el mismo día del lanzamiento de Nano-Banana, lo que supuso alrededor de 2.800 millones de dólares de capitalización bursátil perdida. Algunos expertos lo atribuyen al impacto que este tipo de editores de imágenes basados en IA pueden tener, haciendo accesible la edición avanzada de imágenes a cualquier usuario.

Momentos clave para los modelos de imagen

Hace un tiempo nos llegaba DeepSeek desde China, haciendo perder un valor aproximado de 589.000 millones de dólares a Nvidia en un día (una caída del 17%) puedes leer la noticia completa aquí.

Luego fue OpenAI con su nuevo modelo de generación de imágenes que tuvo un gran éxito mediático gracias a su capacidad de convertir fotos al reconocido "estilo Ghibli".

Ahora llega Gemini 2.5 Flash Image (Nano Banana) y revoluciona la edición de imágenes. Desde mi punto de vista, es apasionante estar viviendo esta evolución, en la que prácticamente cada mes tenemos una novedad que sacude los cimientos de industrias consolidadas.

Aquí otro ejemplo de edición de imagen con Nano-Banana donde yo mismo hago de conejillo de indias:

¿Qué será lo próximo?

¿Cuál será la próxima “víctima” de la IA? Hay muchos candidatos. Siguiendo con la generación de imágenes, quizá el paso natural sea la edición de videos. Es cierto que ya existen modelos que pueden generar videos, pero todavía son muy limitados. Por eso, pienso que uno de los siguientes “efectos Nano Banana” puede ir por este camino y que la próxima revolución tenga que ver con la edición de video.

Claramente, la IA se encuentra en crecimiento exponencial, acelerado por las inmensas inversiones de las grandes empresas tecnológicas. Mi sensación es que cada vez serán mejores, mas intuitivos y fáciles de usar y de hecho alcanzarán (mejor dicho: superarán) a los humanos en muchas de las tareas cotidianas. Coches y camiones conduciendo solos es otro ejemplo en el que ya se está trabajando y que esta a punto de ser realidad.

Por ahora seguiremos aprovechando todo el potencial de la IA y atentos a todas las novedades diarias de este apasionante mundo.

Automation & AI

Copiar enlace

Servicios profesionales

Sobre nosotros

Actualidad

Biblioteca digital

El experto opina: 'La curiosa historia de Nano-Banana'

¿Quién está detrás de Nano-Banana?

¿Qué resulta tan revolucionario en Nano-Banana?

Momentos clave para los modelos de imagen

¿Qué será lo próximo?