O ChatGPT, IA generativa da OpenIA, está evoluindo com recursos de interação por voz e pesquisa de imagens. Venha entender todas as novidades que estão prestes a chegar na ferramenta!
O ChatGPT, aquele famoso chatbot alimentado por inteligência artificial, está evoluindo.
Até agora, ele era basicamente uma caixa de texto com a qual você poderia trocar mensagens.
Mas agora, as coisas estão mudando para melhor!
A OpenAI decidiu dar um upgrade no ChatGPT, e permitir que você interaja com ele de maneiras totalmente novas.
Agora, além de digitar mensagens, você poderá falar em voz alta para o bot ou enviar imagens para receber respostas.
Essas mudanças ocorrerão nas próximas semanas para os usuários que pagam pelo ChatGPT e, em breve, estarão disponíveis para todos os usuários/utilizadores.
Conversando por voz
A função de conversa por voz com o ChatGPT é bem simples de usar. Basta tocar em um botão, falar sua pergunta, e a ferramenta converterá o som em texto, processará sua pergunta e responderá, também em voz alta.
Isso nos lembra das interações com assistentes virtuais como Alexa ou Google Assistant. A diferença é que, graças à tecnologia aprimorada da OpenAI, as respostas devem ser ainda melhores.
A tecnologia por trás disso é alimentada em parte pelo modelo Whisper da OpenAI, que desempenha um papel crucial na conversão de fala em texto.
Além disso, a empresa está lançando um novo modelo de conversão de texto em fala, que é capaz de gerar áudios muito próximos aos de um ser humano. Você ainda terá a opção de escolher entre cinco vozes diferentes para o ChatGPT.
Os desafios éticos
Essa funcionalidade de voz não é útil apenas para bater-papo; ela tem uma ampla possibilidade de aplicações.
A OpenAI está trabalhando em parceria com o Spotify para traduzir podcasts para outros idiomas, mantendo a voz original do apresentador. Isso abre as portas para uma série de usos interessantes para vozes sintéticas.
No entanto, a capacidade de criar esses sons realistas a partir de apenas alguns segundos de áudio também traz desafios éticos.
A OpenAI está ciente disso e controla de perto o acesso a essa tecnologia para evitar abusos. A possibilidade de pessoas mal intencionadas passarem por figuras públicas ou cometerem fraudes é uma preocupação válida.
Pesquisa de imagens
Além da interação por voz, o ChatGPT agora pode lidar com imagens.
É como ter seu próprio Google Lens embutido. Basta tirar uma foto de algo que você deseja saber mais e o ChatGPT tentará entender sua pergunta e responder com base na imagem.
Você pode até usar a ferramenta de desenho do aplicativo para esclarecer ainda mais suas dúvidas.
Uma coisa interessante aqui é que, ao contrário de fazer uma pesquisa, receber uma resposta errada e depois de fazer outra pesquisa, você pode simplesmente comunicar suas necessidades ao bot e aprimorar a resposta ao longo da conversa.
No entanto, a pesquisa de imagens também apresenta desafios. Por exemplo, ao perguntar ao ChatGPT sobre pessoas, a OpenAI limitou a capacidade do bot de fazer declarações diretas sobre indivíduos, tanto por razões de precisão quanto de privacidade.
Isso significa que o bot não será capaz de responder perguntas como “Quem é essa pessoa?” quando se trata de uma foto de alguém.
O ChatGPT da OpenAI está evoluindo constantemente para oferecer recursos mais avançados e úteis.
À medida que a IA continua a se desenvolver, é importante encontrar um equilíbrio entre inovação e responsabilidade. Estamos ansiosos para ver como essas novas funcionalidades serão usadas e quais outras surpresas a OpenAI nos reserva no futuro.
Outros artigos interessantes: