O modelo de Inteligência Artificial, nomeado de Seamless M4T, consegue suportar a tradução de áudios e textos em cerca de 100 idiomas, além de uma tradução simultânea de fala em 35 línguas. Venha conhecer o novo recurso da Meta!
Nesta terça-feira, dia 22, a Meta, empresa de Mark Zuckerberg, anunciou o lançamento de uma novidade capaz de traduzir conteúdos, de texto e áudio, para uma imensa diversidade de idiomas. O modelo de IA foi chamado de Seamless M4T.
Com a proposta de combater barreiras linguísticas e possibilitar a comunicação em tempo real, a ferramenta pode suportar quase 100 diferentes idiomas, bem como a fala simultânea em 35 deles
O modelo foi gerado com a ajuda de tecnologias já existentes, mas que agora foram combinadas de uma maneira nova.
Sobre o recurso, Mark Zuckerberg, presidente da empresa, afirmou seu desejo de aplicar seu modelo de IA para facilitar a comunicação em todo o mundo do metaverso, ambiente virtual interconectado desenvolvido pela marca.
No momento, a Meta está disponibilizando o modelo de inteligência para uso público e não comercial.
Mas esse não é o primeiro recurso desse tipo lançado pela empresa nos últimos tempos!
Apenas em 2023, contamos com a estreia do Llama, um modelo de linguagem IA que concorre diretamente com o ChatGPT da OpenIA, recebendo o apoio de outras gigantes do mercado como a Microsoft e a Alphabet, do Google.
Um ecossistema de IA aberto
O que torna os modelos da Meta tão visados pelo público são serem, em sua maioria, disponibilizados de forma gratuita na internet.
Zuckerberg já declarou acreditar que um ecossistema aberto seja favorável para a Meta a longo prazo, uma vez que isso possibilita a terceirização da criação de ferramentas e conteúdos pelo próprio público.
Contudo, por mais interessante que seja a ideia do código aberto, ela também esbarra em problemas legais, os quais ainda passam por estruturação nos governos mundiais.
Em relação ao modelo Seamless M4T, especificamente, representantes da Meta afirmaram que os dados coletados para o treinamento da inteligência vieram de “áudios brutos originados de um repositório publicamente acessível de dados rastreados da web”.
Sem especificar qual seria esse repositório, afirmaram apenas terem acumulado cerca de 4 milhões de horas para o aprendizado de máquina.
Já em relação às informações textuais, os representantes disseram terem coletado dados criados até o ano passado em páginas online e abertas como Wikipedia e sites associados.
De acordo com o relatório liberado pela empresa, o Seamless M4T se baseia no Massively Multilingual Speech, sendo esse um framework da Meta focado no reconhecimento de fala, idiomas e sintetização de voz para mais de 1.100 línguas.
Além do lançamento da marca de Zuckerberg, outras empresas também entram na disputa por um tradutor universal.
Entre elas, o Google investe Universal Speech Model em uma iniciativa para abranger as 1.000 línguas mais faladas ao redor do mundo.
O Mozilla também apresenta o projeto Common Voice, no qual pretende treinar o algoritmo de inteligência para facilitar o reconhecimento de diversos idiomas pela fala.
Amazon, Microsoft, OpenAI são outras das empresas focadas em construir modelos semelhantes ao Seamless M4T. Entretanto, o modelo da Meta ainda é o mais ambicioso até o momento, por combinar ferramentas de tradução e transcrição em um único lugar.
Em declaração para o site TechCrunch, a Meta disse que seu recurso “reconhece implicitamente os idiomas de origem sem a necessidade de um modelo de identificação de idioma separado.”
Outros artigos interessantes: