A Máquina contra o Humano TESTE DE TURING
Podem
as máquinas pensar? O teste criado por Alan Turing em 1950 propõe uma resposta
simples: uma máquina pode ser considerada inteligente quando consegue fazer-se
passar por humana numa conversa.
Um estudo feito
pela Universidade da Califórnia em San Diego revela que “quando solicitado a
adotar uma persona humana, o GPT-4.5 foi considerado humano 73%
das vezes: significativamente mais frequentemente do que os interrogadores
selecionaram o participante humano real”. Segundo a OpenAI,
os eu modelo “dá a sensação de estar a falar com uma pessoa atenciosa”.
Mas será que este modelo de IA consegue mesmo enganar um humano no
famoso teste de Turing — em que uma pessoa, na posição de
interrogador, tenta distinguir entre respostas de humanos e máquinas?
Sim, e não foram poucos os que caíram.
Na base deste estudo está o teste de
Turing, proposto em 1950 pelo matemático Alan Turing. No artigo
pioneiro “Computing
Machinery and Intelligence”, Turing fez uma pergunta: podem as
máquinas pensar? Para resolver isto, o académico criou um teste simples que
mede se uma máquina consegue imitar um humano de forma convincente.
A ideia é esta: um humano conversa com dois
participantes sem os ver – um humano e uma máquina. Se o interrogador não
conseguir identificar qual é a máquina apenas pelas respostas, a máquina
passa no teste.
Como se chega ao número de 520 mil milhões de euros?
Os programas da UE apoiaram startups europeias com 12
mil milhões de euros.
As startups que foram alvo desse investimento
angariaram adicionalmente 70 mil milhões de euros em capital de risco.
Nestas rondas de investimento, as startups visadas
conseguiram uma avaliação total de mercado de cerca de 520 mil milhões de
euros.
Este valor representa 10% de todas as startups
apoiadas por capital de risco na Europa.
Quando conversamos com um modelo de inteligência
artificial (IA), é normal perguntarmos se já chegámos ao momento em que
os chatbots estão tão desenvolvidos que conseguem fazer alguém pensar
que está a falar com uma pessoa, em vez de uma máquina.
Exemplo disso é a evolução do famoso ChatGPT. Lançado
no final de 2022, o GPT-3.5 já demonstrava boas capacidades na compreensão de
contexto. Meses depois, a OpenAI lançou o GPT-4, que reduziu significativamente
os erros de raciocínio e resolveu problemas complexos que a versão anterior não
conseguia.
Quem foi o primeiro a passar no teste?
Nos primeiros anos, o teste de Turing parecia
impossível de superar. Os programas iniciais, como o ELIZA nos anos 1960,
criaram breves momentos de ilusão, mas falharam rapidamente com perguntas
mais difíceis.
O teste evoluiu com a tecnologia. Havia até uma
competição, a Loebner Prize, que começou em 1991 e oferecia prémios para quem
criasse programas que se aproximassem do objetivo de Turing.
Em 2014, o chatbot Eugene Goostman causou
debate ao supostamente passar no teste (o primeiro a fazê-lo), mas muitos
especialistas questionaram o resultado, já que o programa se apresentava como
um adolescente ucraniano com inglês limitado – uma estratégia que os críticos
consideraram uma forma de justificar as limitações do sistema.
A verdade é que Alan Turing disse que podia
considerar-se que um computador pensa quando consegue enganar os 30%
dos interrogadores numa conversa online de cinco minutos. Eugene Goostman
conseguiu-o, ao convencer 33% dos 30 elementos do júri.
O teste ainda é útil nos dias de hoje?
Os últimos anos trouxeram muitas mudanças. Com os
novos modelos de linguagem, tudo mudou. Os sistemas atuais superam as
limitações anteriores e mostram capacidades de entender contextos e gerar texto
natural. Os modelos de IA já não seguem apenas regras pré-programadas, mas
aprendem padrões a partir de vastas quantidades de texto.
Esta evolução levanta questões sobre o valor do teste
original. Há quem ache que o teste de Turing já não serve como única medida de
inteligência artificial. As empresas criaram versões mais avançadas, como
o teste Winograd Schema, que analisa a compreensão de ambiguidades
linguísticas, e métodos que incluem interpretação visual.
Há ainda quem diga que passar no teste de Turing não
significa verdadeira compreensão, apenas capacidade de simular respostas. Ou
seja, a capacidade de dar respostas que parecem inteligentes sem entender
realmente o seu significado. O GPT-4.5, por exemplo, além de respostas
tecnicamente corretas, também consegue demonstrar nuances que tradicionalmente
associamos à comunicação humana: humor, referências culturais, e até a capacidade
de admitir incerteza ou corrigir-se – características que antes eram
exclusivas dos humanos.
Notabanca; 01.05.2025

Sem comentários:
Enviar um comentário