Pular para o conteúdo principal

Estudo identifica três tipos de plágios produzidos pelo ChatGPT

Estudos mostram como modelos de linguagem natural podem ser fonte de má conduta acadêmica e indicam formas de prevenir o problema

FABRÍCIO MARQUES | revista Pesquisa FAPESP
jornalista

Pesquisadores da Universidade do Estado da Pensilvânia (Penn State), nos Estados Unidos, investigaram até que ponto modelos de linguagem natural como o ChatGPT, que usam inteligência artificial para formular uma prosa realista e articulada em resposta a perguntas de usuários, conseguem gerar conteúdo que não se caracterize como plágio. Isso porque esses sistemas processam, memorizam e reproduzem informações preexistentes, baseadas em gigantescos volumes de dados disponíveis na internet, tais como livros, artigos científicos, páginas da Wikipédia e notícias.

O grupo analisou 210 mil textos gerados pelo programa GPT-2, da startup OpenAI, criadora do ChatGPT, em busca de indícios de três diferentes tipos de plágio: a transcrição literal, obtida copiando e colando trechos; a paráfrase, que troca palavras por sinônimos a fim de obter resultados ligeiramente diferentes; e o uso de uma ideia elaborada por outra pessoa sem mencionar sua autoria, mesmo que formulada de maneira diferente.

A conclusão do estudo foi de que todos os três tipos de cópia estão presentes. E, quanto maior é o conjunto de parâmetros usados para treinar os modelos, mais frequentemente a má conduta foi registrada.

 
A análise utilizou dois tipos de modelos — os pré-treinados, baseados em um amplo espectro de dados, e os de ajuste fino, aprimorados pela equipe da PennState a fim de concentrar e refinar a análise em um conjunto menor de documentos científicos e jurídicos, artigos acadêmicos relacionados à Covid-19 e solicitações de patentes. 

A escolha desse tipo de conteúdo não foi ocasional — nesses textos, a prática de plágio é considerada muito problemática e não costuma ser tolerada.

No material gerado pelos pré-treinados, a ocorrência mais prevalente foi de transcrições literais, enquanto nos de ajuste fino eram mais comuns paráfrases e apropriação de ideias sem referência à fonte. 

“Constatamos que o plágio aparece com diferentes sabores”, disse um dos autores do trabalho, Dongwon Lee, cientista da computação da Faculdade de Tecnologia e Ciências da Informação da Penn State, conforme o serviço de notícias Eurekalert.

Inteligência
artificial
eleva o
patamar
do plágio

O ChatGPT é um entre vários sistemas baseados em inteligência artificial e ganhou grande notoriedade porque foi disponibilizado para uso público. Desde novembro, já foi testado por mais de 100 milhões de pessoas e impressionou por sua capacidade de gerar textos coerentes que mimetizam a escrita dos seres humanos. Uma das polêmicas que levantou envolveu justamente a originalidade de suas respostas e o receio de que se transforme em uma fonte de má conduta acadêmica.

“As pessoas perseguem grandes modelos de linguagem porque, quanto maior um modelo fica, mais suas habilidades aumentam”, disse o autor principal do trabalho, Jooyoung Lee, estudante de doutorado na Faculdade de Ciências e Tecnologia da Informação da Penn State. 

Ferramentas de escrita de inteligência artificial conseguem criar respostas únicas e individualizadas a perguntas apresentadas por usuários, mesmo extraindo as informações de um banco de dados. Essa habilidade, contudo, não livra a ferramenta de ser uma fonte de plágio, mesmo em formatos mais difíceis de detectar. “Ensinamos os modelos a imitar a escrita humana, mas não os ensinamos a não plagiar”, afirmou Lee.

Várias ferramentas estão sendo desenvolvidas para detectar conteúdo gerado por softwares de inteligência artificial. A própria OpenAI desenvolveu um programa capaz de apontar textos feitos por robôs, (disponível em openai-openai-detector.hf.space/). Há outras do gênero na internet, como o Writer AI Content Detector (writer.com/ai-content-detector/) e o Content at Scale (contentatscale.ai/ai-content-detector/).

Como os sistemas de linguagem natural estão em desenvolvimento, também será necessário atualizar continuamente a tecnologia para rastrear sua produção.

Uma equipe da Escola de Engenharias e Ciências Aplicadas da mesma PennState mostrou ser possível treinar as pessoas para identificar esses textos, sem precisar depender exclusivamente de programas detectores. 

Apresentado em fevereiro em um congresso da Associação para o Avanço da Inteligência Artificial realizado em Washington, Estados Unidos, o estudo liderado pelo cientista da computação Chris Callison-Burch mostrou que essas ferramentas já são muito eficientes em produzir prosa fluente e seguir as regras gramaticais. “Mas eles cometem tipos distintos de erros que podemos aprender a identificar”, disse ao blog Penn Engineering Today o cientista da computação Liam Dugan, aluno de doutorado da Penn State e um dos autores do artigo.

> Com informação da Universidade do Estado da Pensilvânia.

• ChatGPT não estimula o pensamento crítico dos estudantes

• ChatGPT se recusa a gerar pedido de dízimo. É enganação, afirma

• O que o ChatGPT diz sobre o ateísmo no Brasil? Veja


Comentários

Post mais lidos nos últimos 7 dias

Vicente e Soraya falam do peso que é ter o nome Abdelmassih

Limpem a boca para falar do Drauzio Varella, cristãos hipócritas!

90 trechos da Bíblia que são exemplos de ódio e atrocidade

Físico afirma que cientistas só podem pensar na existência de Deus como hipótese

Prefeito de São Paulo veta a lei que criou o Dia do Orgulho Heterossexual

Kassab inicialmente disse que lei não era homofóbica

Em vídeo, Malafaia pede voto para Serra e critica Universal e Lula

Malafaia disse que Lula está fazendo papel de "cabo eleitoral ridículo" A seis dias das eleições, o pastor Silas Malafaia (foto), da Assembleia de Deus Vitória em Cristo, gravou um vídeo de 8 minutos [ver abaixo] pedindo votos para o candidato à prefeitura de São Paulo José Serra (PSDB) e criticou a Igreja Universal e o ex-presidente José Inácio Lula da Silva. Malafaia começou criticando o preconceito que, segundo ele, existe contra pastor que emite opinião sobre política, o mesmo não ocorrendo com outros cidadãos, como operários, sindicalistas, médicos e filósofos. O que não pode, afirmou, é a Igreja, como instituição, se posicionar politicamente. “A Igreja é de Jesus.” Ele falou que tinha de se manifestar agora porque quem for para o segundo turno, se José Serra ou se Fernando Haddad, é quase certeza que será eleito, porque Celso Russomanno está caindo nas pesquisas por causa do apoio que tem recebido da Igreja Universal. Afirmou que apoia Serra na expectativa de...

Deputado gay é ameaçado de morte no Twitter por supostos evangélicos

Resposta do deputado Jean Wyllys O militante gay e deputado Jean Wyllys (PSOL) recebeu hoje (18) pelo Twitter três ameaças de morte de supostos evangélicos. Diz uma delas: "É por ofender a bondade de Deus que você deve morrer". Outra: "Cuidado ao sair de casa, você pode não voltar". A terceira: “"A morte chega, você não tarda por esperar".  O deputado acredita que as ameaças tenham partido de fanáticos religiosos. “Esses religiosos homofóbicos, fundamentalistas, racistas e enganadores de pobres pensam que me assustam com ameaças de morte!”, escreveu ele no Twitter. Wyllys responsabilizou os pastores por essas “pessoas doentes” porque “eles as conduzem demonizando minorias”. Informou que vai acionar as autoridades para que os autores da ameaça seja penalizados. Escreveu: "Vou recorrer à Justiça toda vez que alguém disseminar o ódio racista, misógino e homofóbico no Twitter, mesmo que seja em nome de seu deus". Defensor da união civi...

Promotor nega ter se apaixonado por Suzane, mas foi suspenso

Gonçalves, hoje com 45 anos, e Suzane quando foi presa, 23 No dia 15 de janeiro de 2007, o promotor Eliseu José Berardo Gonçalves (foto), 45, em seu gabinete no Ministério Público em Ribeirão Preto e ao som de músicas românticas de João Gilberto, disse a Suzane Louise Freifrau von Richthofen (foto), 27, estar apaixonado por ela. Essa é a versão dela. Condenada a 38 anos de prisão pela morte de seus pais em outubro de 2002, a moça foi levada até lá para relatar supostas ameaças de detentas do presídio da cidade. Depois daquele encontro com o promotor, ela contou para uma juíza ter sido cortejadar.  Gonçalves, que é casado, negou com veemência: “Não me apaixonei por ela”. Aparentemente, Gonçalves não conseguiu convencer sequer o Ministério Público, porque foi suspenso 22 dias de suas atividades por “conduta inadequada” e por também por ter dispensado uma testemunha importante em outro caso. Ele não receberá o salário correspondente a esse período. O Fantástico de ontem apre...

Malafaia diz que vai ‘arrebentar’ candidatura do petista

Malafaia afirmou que não vai dar moleza para o candidato do PT O pastor Silas Malafaia (foto), da Assembleia de Deus Vitória em Cristo, do Rio, afirmou que vai se envolver na campanha do segundo turno das eleições municipais de São Paulo com o propósito de “arrebentar” a candidatura do petista Fernando Haddad por ter sido o mentor do chamado “kit gay” quando foi titular do Ministério da Educação. "Haddad já está marcado pelos evangélicos como o candidato do 'kit gay'”, disse. “Não vamos dar moleza para ele." Ao final do primeiro turno, quando Haddad começou a subir nas pesquisas de intenção de votos, o pastor gravou um vídeo manifestando apoio ao tucano José Serra. Nos próximos dias, Malafaia divulgará outro vídeo com ataques direitos ao petista. No Twitter, ele pede voto para “Serra 45” contra “Haddad, autor do kit gay”. O pastor teve encontro ontem em São Paulo com Serra, que agradeceu o apoio. Também participou do encontro o pastor Jabes de Alencar...

Cinco deuses filhos de virgens morreram e ressuscitam. E nenhum deles é Jesus