Os utilizadores já podem escolher bloquear o GPTBot e manter os seus sites fora do rastreio do ChatGPT. Venha descobrir como fazer isso!
A Inteligência Artificial (IA) é um assunto cada vez mais em alta que alegra e preocupa os utilizadores ao mesmo tempo.
Enquanto muitos se empolgam com as possibilidades que o aprendizado pode gerar, como o desenvolvimento de ideias com muito mais facilidade, outros chamam a atenção para como os nossos dados vêm sendo usados pelas plataformas.
Pensando em proteger essas informações e dar mais segurança para aqueles que navegam na web, a OpenAI agora permite que você bloqueie o rastreamento do seu site pelo GPTBot.
A ferramenta, que é usada para treinar modelos do GPT, poderá ser barrada pelos operadores do site ao proibirem especificamente o rastreamento do bot.
“Páginas da Web rastreadas com o agente do usuário GPTBot podem potencialmente ser usadas para melhorar modelos futuros” afirmou a empresa em uma postagem de seu blog.
O texto ainda explica que ao permitir o rastreamento feito pelo robô da plataforma, os sites vão poder “ajudar os modelos de IA a se tornarem mais precisos e melhorar suas capacidades gerais e segurança”.
Vale deixar claro que a restrição de leitura para o treinamento da IA não interfere nos dados já coletados.
Ou seja, caso acione o bloqueio hoje em seu site, as informações fornecidas anteriormente se manterão no aprendizado de máquina do ChatGPT, por exemplo.
Como bloquear o OpenIA?
Fazer o bloqueio do OpenIA no seu site é bem simples, basta restringir o rastreador GPTBot no arquivo Robots.txt de seu site.
Outra opção é bloquear seu endereço de IP, assim garante que não terá seus dados coletados.
Sobre o aprendizado de máquina
As inteligências artificiais estão ganhando grande velocidade de crescimento muito por conta da rápida aprendizagem de máquina possibilitada com a internet.
São bilhões de dados sendo absorvidos diariamente que, com o tempo, vão aprimorando os resultados oferecidos pelas IAs.
Esse é o procedimento de treinamento de grandes modelos de linguagem, como é o caso do ChatGPT da OpenIA, mas também do Bard do Google.
Contudo, a empresa responsável pelo GPTBot ainda não confirmou de onde coleta tais dados, se são fornecidos de redes sociais, documentos com direitos autorais ou outros meios.
As incertezas fizeram com que sites como Twitter e Reddit pressionassem as empresas de IA a criar controles para a extração de informações, buscando reprimir o uso gratuito de suas postagens para o treinamento de máquina.
Além disso, legisladores chamam a atenção para possíveis problemas com privacidade e consentimento de dados.
A regulamentação das inteligências artificiais ainda é um assunto com poucas atualizações até o momento.
Para além do bloqueio proposto pela OpenIA, outra alternativa que vem sendo explorada é o emprego de marcas d’água em produções feitas por máquina, de modo a diferenciá-las dos conteúdos humanos.
Esse é um tema que ainda está no ínicio de seus desenvolvimento e pode render ainda boas conversas. Mas e você, o que acha disso tudo?
Vai restringir o uso do seu site para o GPTBot? Nos conte nos comentários!
Outros artigos interessantes: