ChatGPT pronto “verá, oirá y hablará” con su última actualización de IA

La nueva gran actualización de ChatGPT permitirá que el chatbot interactúe con conversaciones de voz y responda a imágenes. Así es, la inteligencia artificial (IA) podrá escuchar tus preguntas, ver el mundo que te rodea y responder en consecuencia. 

OpenAI, el grupo sin fines de lucro detrás de ChatGPT y DALL-E, anunció la actualización “multimodal” en una publicación de blog el lunes, diciendo que implementará las nuevas funciones de voz e imagen en las versiones de suscripción paga de ChatGPT (llamadas Plus y Enterprise) durante las próximas dos semanas. 

No se mencionó específicamente cuándo podría agregarse a las versiones gratuitas, aunque la publicación decía que estaría disponible para otros grupos de usuarios “poco después”.

Parece que parte de esta actualización será similar a los servicios proporcionados por asistentes virtuales populares como Siri de Apple y Alexa de Amazon, en los que puedes hacer una pregunta y te proporcionarán la información deseada.

Sin embargo, cualquiera que haya jugado con ChatGPT podrá decirle que la IA de la tecnología no es solo un motor de búsqueda estéril. Es capaz de identificar patrones y ofrecer soluciones creativas a problemas complejos, para luego expresarlos de forma conversacional. 

Las nuevas funciones de imagen también podrían aportar otra dimensión a estas capacidades, como explica OpenAI: “Toma una fotografía de un punto de referencia mientras viajas y ten una conversación en vivo sobre lo que tiene de interesante.

Cuando estés en casa, toma fotografías de tu refrigerador y despensa para saber qué hay para cenar (y haz preguntas de seguimiento para obtener una receta paso a paso).

Después de la cena, ayude a su hijo con un problema de matemáticas tomándole una fotografía, rodeando el conjunto de problemas y pidiéndole que comparta pistas con ambos”.

OpenAI añadió que este desarrollo “abre las puertas a muchas aplicaciones creativas y centradas en la accesibilidad”. Sin embargo, agregaron que también traerá “nuevos riesgos, como la posibilidad de que actores maliciosos se hagan pasar por figuras públicas o cometan fraude”.

Entonces, por ahora, la actualización solo permitirá el chat de voz con IA que haya sido entrenada con actores de voz específicos.