O Gemini, o modelo de inteligência artificial (IA) da Google, recebeu uma atualização substancial com o lançamento do Gemini 2.0. Esta nova versão traz melhorias significativas em várias áreas, desde o processamento de dados até à forma como interage com outros serviços Google.
O Gemini 2.0 Flash é a estrela desta atualização, oferecendo respostas praticamente instantâneas quando comparado com a geração anterior. A Google afirma que conseguiu duplicar a velocidade de processamento, algo particularmente notável quando se considera que o modelo também se tornou mais eficiente em termos energéticos.
Esta melhoria na velocidade não é apenas um número impressionante — representa um avanço significativo para aplicações em tempo real, especialmente em interações por voz. Para além disso, a maior eficiência energética traduz-se diretamente numa melhor autonomia quando utilizado em dispositivos móveis.
O novo modelo demonstra capacidades melhoradas em áreas como programação, matemática e raciocínio lógico. Uma das novidades mais interessantes é a capacidade de executar código diretamente e processar respostas de API de forma autónoma.
Um assistente mais inteligente e versátil
Uma das maiores novidades do Gemini 2.0 é a sua evolução para um “agente inteligente”. Esta funcionalidade permite-lhe realizar tarefas complexas de várias etapas de forma mais autónoma, desde planear viagens até interagir com diversos serviços Google.
O modelo agora integra-se com o Google Flights e pode mostrar disponibilidade de hotéis nos destinos pesquisados. Embora ainda não possa fazer reservas automaticamente, esta funcionalidade demonstra o potencial para futuras integrações mais profundas com diversos serviços.
As capacidades multimodais também foram significativamente melhoradas. O Gemini 2.0 pode agora processar diretamente imagens e áudio, em vez de os converter primeiro para texto como acontecia anteriormente. Esta mudança resulta numa compreensão mais profunda e contextual do conteúdo analisado.
Novos recursos de voz e imagem
Uma das adições mais interessantes ao Gemini 2.0 é a capacidade de comunicar através de voz artificial. A aplicação móvel oferece várias vozes à escolha, permitindo conversas mais naturais e fluidas com a IA.
O processamento de imagem também recebeu melhorias significativas. O modelo consegue agora analisar imagens com maior detalhe e compreensão contextual, identificando não apenas elementos individuais mas também as relações entre eles numa cena.
A funcionalidade de geração de imagens, anteriormente suspensa, está de volta com o Imagen. No entanto, os resultados parecem mais conservadores do que anteriormente, possivelmente para evitar controvérsias relacionadas com preconceitos e imprecisões.
Integração com o ecossistema Google
A Google está a trabalhar para integrar o Gemini 2.0 de forma mais profunda nos seus serviços principais, como Search, Maps e Workspace. Esta integração vai permitir respostas mais personalizadas nas pesquisas, potencialmente utilizando informações dos emails, documentos e histórico de localização do utilizador.
Projetos experimentais como o Astra e o Mariner começam a materializar-se nos novos modelos Gemini. O Astra concentra-se em agentes de código AI, enquanto o Mariner poderá automatizar tarefas como preenchimento de formulários e resumo de páginas web.
As melhorias implementadas no Gemini 2.0 representam um passo importante na evolução da IA da Google, estabelecendo bases sólidas para desenvolvimentos futuros em áreas como assistência virtual, automação de tarefas e integração de serviços.
Outros artigos interessantes: