quinta-feira, 1 de maio de 2025

A Máquina contra o Humano TESTE DE TURING

Podem as máquinas pensar? O teste criado por Alan Turing em 1950 propõe uma resposta simples: uma máquina pode ser considerada inteligente quando consegue fazer-se passar por humana numa conversa.

Um estudo feito pela Universidade da Califórnia em San Diego revela que “quando solicitado a adotar uma persona humana, o GPT-4.5 foi considerado humano 73% das vezes: significativamente mais frequentemente do que os interrogadores selecionaram o participante humano real”. Segundo a OpenAI, os eu modelo “dá a sensação de estar a falar com uma pessoa atenciosa”. Mas será que este modelo de IA consegue mesmo enganar um humano no famoso teste de Turing — em que uma pessoa, na posição de interrogador, tenta distinguir entre respostas de humanos e máquinas?

Sim, e não foram poucos os que caíram.

Na base deste estudo está o teste de Turing, proposto em 1950 pelo matemático Alan Turing. No artigo pioneiro “Computing Machinery and Intelligence”, Turing fez uma pergunta: podem as máquinas pensar? Para resolver isto, o académico criou um teste simples que mede se uma máquina consegue imitar um humano de forma convincente.

A ideia é esta: um humano conversa com dois participantes sem os ver – um humano e uma máquina. Se o interrogador não conseguir identificar qual é a máquina apenas pelas respostas, a máquina passa no teste.

Como se chega ao número de 520 mil milhões de euros?

Os programas da UE apoiaram startups europeias com 12 mil milhões de euros.

As startups que foram alvo desse investimento angariaram adicionalmente 70 mil milhões de euros em capital de risco.

Nestas rondas de investimento, as startups visadas conseguiram uma avaliação total de mercado de cerca de 520 mil milhões de euros.

Este valor representa 10% de todas as startups apoiadas por capital de risco na Europa.

Quando conversamos com um modelo de inteligência artificial (IA), é normal perguntarmos se já chegámos ao momento em que os chatbots estão tão desenvolvidos que conseguem fazer alguém pensar que está a falar com uma pessoa, em vez de uma máquina.

Exemplo disso é a evolução do famoso ChatGPT. Lançado no final de 2022, o GPT-3.5 já demonstrava boas capacidades na compreensão de contexto. Meses depois, a OpenAI lançou o GPT-4, que reduziu significativamente os erros de raciocínio e resolveu problemas complexos que a versão anterior não conseguia.

Quem foi o primeiro a passar no teste?

Nos primeiros anos, o teste de Turing parecia impossível de superar. Os programas iniciais, como o ELIZA nos anos 1960, criaram breves momentos de ilusão, mas falharam rapidamente com perguntas mais difíceis.

O teste evoluiu com a tecnologia. Havia até uma competição, a Loebner Prize, que começou em 1991 e oferecia prémios para quem criasse programas que se aproximassem do objetivo de Turing.

Em 2014, o chatbot Eugene Goostman causou debate ao supostamente passar no teste (o primeiro a fazê-lo), mas muitos especialistas questionaram o resultado, já que o programa se apresentava como um adolescente ucraniano com inglês limitado – uma estratégia que os críticos consideraram uma forma de justificar as limitações do sistema.

A verdade é que Alan Turing disse que podia considerar-se que um computador pensa quando consegue enganar os 30% dos interrogadores numa conversa online de cinco minutos. Eugene Goostman conseguiu-o, ao convencer 33% dos 30 elementos do júri.

O teste ainda é útil nos dias de hoje?

Os últimos anos trouxeram muitas mudanças. Com os novos modelos de linguagem, tudo mudou. Os sistemas atuais superam as limitações anteriores e mostram capacidades de entender contextos e gerar texto natural. Os modelos de IA já não seguem apenas regras pré-programadas, mas aprendem padrões a partir de vastas quantidades de texto.

Esta evolução levanta questões sobre o valor do teste original. Há quem ache que o teste de Turing já não serve como única medida de inteligência artificial. As empresas criaram versões mais avançadas, como o teste Winograd Schema, que analisa a compreensão de ambiguidades linguísticas, e métodos que incluem interpretação visual.

Há ainda quem diga que passar no teste de Turing não significa verdadeira compreensão, apenas capacidade de simular respostas. Ou seja, a capacidade de dar respostas que parecem inteligentes sem entender realmente o seu significado. O GPT-4.5, por exemplo, além de respostas tecnicamente corretas, também consegue demonstrar nuances que tradicionalmente associamos à comunicação humana: humor, referências culturais, e até a capacidade de admitir incerteza ou corrigir-se – características que antes eram exclusivas dos humanos.

Notabanca; 01.05.2025

 

Sem comentários:

Enviar um comentário