ChatGPT se pasa al modo de voz: todos los detalles de GPT-4o
OpenAI ha presentado un nuevo modelo de su bot conversacional que mejora en gran medida el modo de voz conocido hasta la fecha
Hace poco más de un año desde que ChatGPT irrumpiese en internet y se convirtiera en una de las grandes sensaciones de los últimos años en el ámbito tecnológico. El desarrollo del chatbot conversacional de OpenAI hizo a muchos comprender el sinfín de posibilidades que este tipo de herramientas basadas en la Inteligencia Artificial ofrecían en todos los ámbitos.
Un año después de su popularización, el desarrollo de ChatGPT no fue más que la primera piedra en el devenir de una empresa decidida a cambiar la percepción de los usuarios en lo que respecta a la Inteligencia Artificial. Durante este periodo, en OpenAI han ido presentando todo tipo de nuevas herramientas, hasta llegar a la que apunta a revolucionar el mercado de los bots conversacionales: GPT-4o.
La última herramienta de OpenAI que revoluciona lo conocido con ChatGPT
Eran casi innumerables las ventajas que ofrecía ChatGPT: inmediatez, facilidad de acceso, toneladas de información… Una herramienta que parecía inmejorable, hasta que en OpenAI han presentado esta innovadora versión. GPT4o, también conocido como GPT-4 Omni, cuenta con una peculiaridad respecto al ChatGPT original: es capaz de procesar datos de texto, auditivos y visuales de forma simultánea.
Esto da vida al que desde OpenAI han presentado como su modelo más inteligente hasta la fecha, dejando a un lado todo lo que había presentado la empresa previamente. Y es que esta nueva herramienta destaca no solo por su carácter multimodal, sino por poner fin al problema de latencia que hacía acto de presencia en todas las versiones anteriores, lo cual permite llevar a cabo una conversación en tiempo real, reduciendo los tiempos de respuesta hasta los 320 milisegundos.
No obstante, el verdadero aspecto por el que destaca es el nuevo y mejorado modo de voz, que permite a los usuarios comunicarse con la herramienta de una forma verbal y prácticamente inmediata. Y cambia por completo respecto a otros que hemos visto previamente porque los usuarios podrán hacer uso de un lenguaje completamente natural, teniendo una conversación plenamente fluida en la que el usuario no notará la diferencia con una conversación con otra persona.
Ahora, el modo de voz de esta innovadora herramienta permite que los usuarios le interrumpan en plena definición, pero eso no es lo único que destaca respecto a este nuevo modelo. Su humanización lleva a esta plataforma a responder en distintos tonos de voz, responder a todo tipo de preguntas, e incluso llegar a reír o cantar.
Se trata de una funcionalidad completamente gratuita a la cual podremos acceder a través de la propia plataforma de ChatGPT, que revoluciona por completo el modo de voz que existía en el desarrollo de las distintas plataformas de chatbots. De hecho, incluso podría llevar a cabo una traducción simultánea a tiempo real, simplemente con que el usuario le pida que traduzca lo que está contando en un momento dado, sin necesidad de comandos especiales.
Un invento que, sin lugar a dudas, se trata del avance más grande desde la creación de ChatGPT para OpenAI, y que apunta a revolucionar por completo el ámbito no solo de los bots conversacionales, sino del mundo de la tecnología a nivel global.