La opinión del experto: 'La IA actual es aún cine mudo'

 

La innovación entra dentro del ADN de Serban Group y eso lo aplicamos también en nuestro blog. Por eso, en esta ocasión, le hemos dado una vuelta a nuestro formato clásico de publicaciones para dar voz a un experto en uno de los temas más candentes del momento: la Inteligencia Artificial. 

 

El invitado especial con el que contamos en este post es Mike Mingo, experto en Inteligencia Artificial. Mike nos presenta aquí sus reflexiones sobre lo que estamos viviendo actualmente en el mundo de la IA y lo que nos espera en un futuro ¿quieres saber qué será? ¡sigue leyendo!

 

 

Mike Mingo - Experto en IA

 

IA: Todo va a cambiar

Hasta hace muy poco, la inteligencia artificial (IA) era un concepto lejano, casi exclusivo de películas de ciencia ficción o laboratorios de élite. Pero hoy, está en nuestros teléfonos, en nuestras búsquedas, en nuestros correos... y, sobre todo, en nuestras conversaciones.

 

Los chatbots nos abrieron lo ojos. Herramientas como ChatGPT, Claude o Gemini nos permiten interactuar con máquinas de una forma natural, casi humana. Ya no se trata solo de dar órdenes por comandos o hacer clics en menús. Ahora hablamos, preguntamos, debatimos, escribimos... y obtenemos respuestas coherentes, útiles y muchas veces brillantes.

 

Interactuamos en lenguaje natural… escrito. En una era en la que los jóvenes cada vez leen menos, un chatbot no parece el medio adecuado para tener una relación fluida Humano - Máquina.

 

La verdadera revolución vendrá cuando superemos la barrera del texto. Cuando podamos interactuar con la IA mediante voz, gestos, imágenes, emociones. Cuando no necesitemos escribirle a una máquina, sino simplemente comunicarnos con ella, como con otra persona.

 

En la comunicación Humano - Humano hay mucho más que palabras escritas, o imágenes o videos generados. Ni siquiera vale solo con la voz y sus tonos, silencios, risas… Solo piensa en lo diferente que es una sesión de trabajo en Teams o Zoom sin cámara, o con cámara. Todos hemos estado en esas llamadas donde, de pronto alguien enciende la cámara, y la comunicación cambia al instante. Se vuelve mucho más rica. Nuestro cerebro es multimodal, porque lleva miles de años siéndolo. En una comunicación percibe tonos, gestos cómplices, desaprobación, ira, felicidad… todo eso no llegaría en un canal de texto, uno de video o uno de voz, sino en la combinación de todos.

 

cita-0408-2

 

Siento que, haciendo el símil con el cine, ahora mismo estamos viendo cine mudo. En ese cine se entendía visualmente (en blanco y negro) la escena, el lenguaje corporal, y para enfatizarlo aparecería un texto a pantalla completa (“¡No te vayas, quédate!”).

 

Los modelos de IA ya son multimodales, los modos avanzados de voz empiezan a captar y producir variaciones de tono, ritmo, etc. Pronto darán el salto al video, interpretando en tiempo real el sentir del humano. Y así irán conquistando sentidos.

 

Y eso lo va a cambiar todo.

 

Cambiará la educación, la atención médica, el entretenimiento. En especial, el futuro del trabajo será profundamente transformado por esta colaboración entre humanos e inteligencia artificial — una relación que ya está en marcha y de la que ya se ha hablado anteriormente en el blog de Serban Group (te invito a leer más sobre esto aquí). La IA ya no será solo una herramienta; será un interlocutor, un colaborador, un espejo inteligente que nos ayudará a amplificar nuestras capacidades.

 

¿Por qué vemos tantos robots humanoides (con forma humana) últimamente?

 

No es casualidad. El mundo está diseñado para humanos, para la forma física humana. Para que una IA interactúe con el mundo, mejor que adaptar el mundo, adaptemos la IA. Esos robots humanoides tienen su “cerebro” diferente, ya no es el robot tradicional que hace lo que le decimos, sino que tendrá un cerebro basado en IA, que aprende, entiende su entorno, transmite emociones, entiende emociones…

 

La IA está evolucionando de ser una caja de texto, a la que escribimos y nos da respuesta, hacia ser agentes virtuales (sin cuerpo físico) o robots que realmente aprendan, interactúen con nuestro mundo, y evolucionen.

 

Esto es solo el principio: estamos en el momento en que el cine mudo empieza a experimentar con sonido. La transición será tan rápida y profunda que ni siquiera notaremos el salto hasta que estemos totalmente inmersos. La velocidad con la que avanzan los modelos, las interfaces y las integraciones es vertiginosa. Lo que hoy parece asombroso, mañana será básico. La revolución no va a esperar a que estemos listos. Está ocurriendo mientras lees estas líneas. 

 

¿Estamos preparados?

Copiar enlace