Numa era onde a tecnologia parece não conhecer limites, a Apple acaba de apresentar uma novidade que promete transformar a forma como interagimos com as imagens digitais. Trata-se do MGIE (MLLM-Guided Image Editing), um modelo de inteligência artificial desenvolvido em colaboração com a Universidade da Califórnia, em Santa Bárbara. Este modelo consegue editar imagens a partir de descrições textuais, abrindo portas para um novo patamar de criatividade e precisão na edição de imagens.
Ao contrário dos modelos existentes, que muitas vezes se limitam a ajustes básicos de cor ou recortes simples, o MGIE destaca-se pela sua capacidade de realizar uma vasta gama de manipulações complexas. Desde a adição de novos objetos numa cena até à alteração de elementos já existentes, este modelo compreende instruções ambíguas e as traduz em edições de imagem coerentes e surpreendentemente precisas.
Uma simples solicitação como “torna esta pizza mais saudável” é interpretada com a adição de toppings de vegetais, demonstrando a capacidade do modelo de entender e aplicar conceitos abstratos às imagens.
Inovação a serviço da criatividade
No cerne do MGIE encontra-se um Modelo de Linguagem Multimodal (MLLM), que analisa pedidos dos utilizadores e fornece instruções precisas para a edição de imagens. Esta abordagem inovadora permite que o modelo lide eficazmente com comandos ambíguos, garantindo resultados de edição realistas e alinhados com as expectativas do utilizador. A diferença fundamental entre o MGIE e os modelos anteriores residem na sua perceção visual aprimorada.
Enquanto modelos como o LGIE se limitam a uma única modalidade, o MLLM do MGIE tem acesso à imagem de entrada e a uma compreensão intermodal, facilitando instruções mais descritivas e precisas.
Uma ferramenta aberta à comunidade
A Apple tomou a decisão estratégica de disponibilizar o MGIE como um projeto de código aberto no GitHub, oferecendo acesso ao código, dados e modelos pré-treinados. Para além disso, uma demonstração web está disponível nos espaços do Hugging Face, permitindo aos utilizadores experimentar diretamente as capacidades de edição de imagem do modelo.
Embora a empresa ainda não tenha anunciado planos específicos para a integração do MGIE nos seus produtos, a disponibilização do modelo como open-source sublinha o compromisso da Apple com a inovação aberta e colaborativa no campo da inteligência artificial.
O futuro da IA nos dispositivos Apple
Durante a recente chamada de resultados trimestrais da Apple, Tim Cook, o CEO da empresa, confirmou o desenvolvimento contínuo de funcionalidades baseadas em IA para os dispositivos da marca. Espera-se que estes avanços sejam anunciados ainda este ano e poderão abranger diversos serviços da Apple, como a Siri, Mensagens e Apple Music.
Com a integração de funcionalidades de IA generativa, os utilizadores podem aguardar melhorias significativas, incluindo o resumo de textos, sugestões personalizadas e uma funcionalidade aprimorada em todo o ecossistema da Apple.
Este avanço representa mais um passo da Apple na vanguarda da inovação tecnológica, reforçando a sua posição como líder na criação de ferramentas que não apenas melhoram a experiência do utilizador, mas também expandem as fronteiras do que é possível fazer com a tecnologia atual.
À medida que a comunidade global se adapta e explora as capacidades do MGIE, estamos apenas a começar a vislumbrar o impacto que esta ferramenta poderá ter no mundo da edição de imagens e, possivelmente, em muitos outros domínios ainda por explorar.
Outros artigos interessantes: