Uma nova era pro ChatGPT? GPT-4 pode ter passado pelo famoso Teste de Turing

Pesquisadores avaliaram a capacidade do modelo de linguagem GPT-4 e concluíram que ele passou pelo teste de Turing.

Grupo de pesquisadores afirmam que GPT-4 passou o Teste de Turing conseguindo enganar pessoas que seja humano.
Grupo de pesquisadores afirmam que GPT-4 passou o Teste de Turing conseguindo enganar pessoas que seja humano.

O uso de modelos de linguagem, como o famoso ChatGPT, está cada vez mais comum dentro da sociedade e o modelo cada vez melhor. Desde o lançamento do ChatGPT, a OpenAI já testou novas versões atualizadas que são melhores do que as versões antigas. Recentemente, a empresa disponibilizou o GPT-4o que tem uma performance ainda melhor comparada com as outras versões.

Os modelos são tão bom em conversas e responder perguntas que muitas vezes pode dar a impressão que estamos falando com outro ser humano. O teste se uma inteligência artificial consegue se passar por um ser humano e enganar outros humanos se chama teste de Turing. O teste foi proposto por Alan Turing no seu artigo famoso de 1950 que ele discute sobre máquinas pensantes.

Um novo estudo feito por pesquisadores da Universidade de San Diego concluiu que o modelo de linguagem GPT-4 passa no teste de Turing. Ele conseguiria se passar por um ser humano para enganar outros humanos. O grupo fez um teste com três modelos de linguagem, incluindo o GPT-3, fazendo com que um grupo de pessoas interagissem 5 minutos com cada modelo ou com uma pessoa sem saber.

Artigo de 1950

Em 1950, Alan Turing publicou seu famoso artigo Computing Machinery and Intelligence que se tornou um dos artigos mais importantes das Ciências da Computação. No começo do artigo, ele inicia questionando se máquinas podem pensar dando início a uma discussão sobre uma possível inteligência artificial. Esse artigo é tido como um dos pontapés iniciais da busca por uma inteligência artificial.

No artigo de 1950, Turing se refere a essas máquinas que fariam as mesmas coisas que humanos como máquinas pensantes.

Um dos pontos chaves do artigo é a discussão que Turing se aprofunda sobre a possibilidade de uma máquina pensar. O artigo tem uma abordagem filosófica bastante aprofundada. Chama atenção principalmente pela discussão sobre como máquinas poderiam aprender através de padrões. O aprendizado através de padrões é a base do aprendizado de máquina nos dias atuais.

Teste de Turing

Dentro do artigo também há a proposta de um teste que ficou cohecido como Teste de Turing. A ideia por trás do teste seria avaliar se uma máquina conseguiria se passar por um ser humano e enganar um outro. Fazer um interrogador acreditar que está conversando com outro humano através de mensagens de texto. Caso a máquina fosse bem sucedida nesse teste, ela poderia ser considerada inteligente.

Artigo de Alan Turing foi revolucionário para a área de Ciências da Computação e traz conceitos que são importantes até hoje.
Artigo de Alan Turing foi revolucionário para a área de Ciências da Computação e traz conceitos que são importantes até hoje. Crédito: Hitoric Tech

O teste começou a ganhar força nas décadas seguintes e diversas competições foram criadas onde pesquisadores e empresas levavam suas máquinas para teste. Uma das aplicações do Teste de Turing são os CAPTCHAs (Completely Automated Public Turing test to tell Computers and Humans Apart) utilizados em sites para encontrar possíveis bots.

Modelos de linguagem

Um modelo de linguagem é um model que foi treinado para entender, criar ou interagir com textos. O exemplo mais famoso são os modelos que aprendem a traduzir de uma língua para outra. A ideia é que o modelo de linguagem receba uma entrada, que pode ou não ser um texto, e retorne uma resposta em textos ou frases. A área de especialidade é chamada de processamento de linguagem natural (NLP).

Atualmente, os modelos de linguagem são avançados e conseguem manter uma conversa como responder perguntas e fazer tarefas como resumir um texto. Esses modelos atuais, na maioria, são baseados em redes neurais e uma técnica chamada Transformers. Eles são treinados com uma quantidade grande de textos onde conseguem encontrar padrões, interpretar textos e realizar as tarefas.

Quais modelos passam no teste?

Considerando os modelos atuais de linguagem, um grupo de pesquisadores da Universidade de San Diego propuseram submeter o GPT-3.5 e GPT-4 ao Teste de Turing. A ideia do grupo era colocar pessoas para conversar 5 minutos através de textos com um indivíduo. Esses indivíduo poderia ser uma pessoa real ou algum modelo de linguagem que estava sendo testado.

No artigo, eles concluíram que o GPT-4 conseguiu enganar as pessoas na metade das vezes. Para confirmar o teste, o grupo também utilizou o chatbot Eliza que tem uma performance de cerca de 22%. Dessa forma, o estudo conclui que GPT-4 teria passado pelo Teste de Turing mas os humanos ainda conseguem identificar outros humanos melhor na maioria das vezes.

GPT-4

O GPT-4 é uma versão atualizada dos modelos de linguagem que alimenta o ChatGPT. Esses modelos foram criados pela empresa OpenAI e está na quarta geração. Recentemente a OpenAI anunciou que o ChatGPT teria como modelo uma versão ainda mais otimizada do GPT-4 chamada GPT-4o. Uma das maiores diferenças é a capacidade do GPT-4 de criar textos mais longos e mais coesos.

Além disso, o ChatGPT também possui uma interface que consegue fazer buscas na internet conseguindo responder perguntas atuais. Isso é um avanço em comparação ao GPT-3 que foi um dos primeiros a ser usado no ChatGPT quando este foi introduzido mas só tinha informações até o ano de 2022.

Referência da notícia:

Jones & Bergen 2024 People cannot distinguish GPT-4 from a human in a Turing test arXiv