À medida que Apple e Google transformam seus assistentes de voz em chatbots, a OpenAI está transformando seu chatbot, o ChatGPT, em um assistente de voz.
Na segunda-feira, 13/05, a startup de inteligência artificial de São Francisco revelou uma nova versão do ChatGPT que pode receber e responder a comandos de voz, imagens e vídeos.
Esta versão, baseada em um sistema de IA chamado GPT-4o, processa áudio, imagens e vídeo muito mais rápido do que as versões anteriores da tecnologia. A aplicação será disponibilizada gratuitamente, tanto para smartphones quanto para computadores desktop.
“Mira Murati, a diretora de tecnologia da empresa, afirmou que estamos observando o futuro da interação entre nós e as máquinas.”
GPT-4o: como é o novo ChatGPT
Este novo app faz parte de um esforço mais amplo para combinar chatbots conversacionais, como o ChatGPT, com assistentes de voz, como o Google Assistant e a Siri da Apple. Enquanto o Google integra seu chatbot Gemini ao Google Assistant, a Apple está preparando uma nova versão da Siri que será mais conversacional.
A OpenAI anunciou que compartilhará gradualmente a tecnologia com os usuários “nas próximas semanas.” Esta é a primeira vez que o ChatGPT é oferecido como uma aplicação de desktop.
O que o GPT-4o tem de novo em relação ao ChatGPT anterior
Velocidade e eficiência: a nova versão, o GPT-4o, é bem mais rápida no processamento de áudio, imagens e vídeo em comparação com as versões anteriores. Isso indica uma melhoria considerável na eficiência e na rapidez com que o sistema pode lidar com multimídia.
Multimodalidade: antes, o ChatGPT focava predominantemente em texto. Com a nova atualização, ele agora pode interagir com uma gama mais ampla de formatos, incluindo voz e imagem, o que o torna mais versátil e útil em diversas situações cotidianas.
Acessibilidade: pela primeira vez, o ChatGPT está sendo oferecido como uma aplicação de desktop, além de estar disponível para dispositivos móveis. Isso aumenta a acessibilidade do chatbot para usuários que preferem ou necessitam utilizar um computador desktop em seus fluxos de trabalho ou lares.
Integração com assistente de voz: Com essa transformação, o ChatGPT passa a se assemelhar mais a assistentes de voz tradicionais, como Siri e Google Assistant, ao permitir comandos de voz. Essa é uma evolução esperada do produto para incorporar funcionalidades de assistentes pessoais inteligentes, tornando-o uma ferramenta mais integral e interativa.
Recursos mais impressionantes do novo ChatGPT
Além das atualizações apresentadas, o GPT-4o impressiona pelos seus novos recursos para “conversar” com os usuários de forma mais fluida e semelhante à experiência humana.
Nessa nova versão, o ChatGPT é capaz de entender e utilizar textos, áudios e imagens simultaneamente em suas interações — e até reconhece expressões faciais. Ele leva cerca de apenas 320 milissegundos para entender e responder às falas dos usuários.
Quando o GPT-4o estará disponível?
A OpenAI já começou o lançamento no GPT-4o na segunda, 13 de maio, e está liberando a novidade gradualmente para o público. Em um anúncio no Twitter, já é possível visualizar as capacidades dessa nova ferramenta, como resolver operações matemáticas, cantar e brincar em jogos simples.
GPT-4o será pago?
O GPT-4o e todos os seus novos recursos estarão disponíveis para todos os usuários, inclusive, quem não assina a versão paga. Contudo, os assinantes do ChatGPT Plus terão acesso a um limite maior de usos da nova versão.
Saiba de tudo que mais importa em marketing digital: acompanhe o blog da Macfor e assine a newsletter BRING ME DATA.