Zapisi radoznalog uma - Notatio Universalis: AI položila Tjuringov test

понедељак, 19. мај 2025.

AI položila Tjuringov test – GPT-4.5 nadmašio ljude!

Možda će april 2025. godine ostati zapamćen kao prelomni trenutak u istoriji i razvoju veštačke inteligencije. Naime, naučnici sa Univerziteta Kalifornije u San Dijegu objavili su rezultate istraživanja prema kojima je veliki jezički model (LLM) GPT-4.5 kompanije OpenAI uspešno prošao poznati Tjuringov test.

Da vidimo prvo šta je Tjuringov test? Ovaj test je osmislio čuveni matematičar Alan Tjuring (Alan Mathison Turing), još 1950. godine.

Inače, Alan Tjuring je za vreme II svetskog rata bio šef britanskog odeljenja zaduženog za nemačku mornaricu. Tjuring je tada razvio više različitih tehnika za razbijanje nemačkih šifara, a uspeo je da “razbije” i postavke čuvene Enigme, specijalne mašine za šifriranje koju je koristio Vermaht.

Vratimo se sada na sam test. Dakle, ovaj test služi za procenu sposobnosti mašina da pokažu inteligentno ponašanje koje je neodvojivo povezano sa ljudskim. Tokom testa, evaluator, koji je pravi čovek, vodi tekstualni razgovor sa dva sagovornika, od kojih je jedan čovek, a drugi računar. Evaluator tokom testa ne zna ko je u toj prepisci čovek, a šta mašina, a cilj računara je da svojim odgovorima zbuni evaluatora i bude prepoznat kao čovek.

Već pomenuti GPT-4.5 je tokom testa usvojio i demonstrirao ličnost introvertnog mladog čoveka koji koristi sleng i pokazuje emocionalnu nespretnost, te uspeo da zbuni ljudske učesnike testa u čak 73% slučajeva! Ovaj rezultat ne samo da zadovoljava kriterijume Tjuringovog testa već je ChatGPT-4,5 LLM model u ovoj ulozi bio uverljiviji od stvarnih ljudskih sagovornika!

Zanimljivo je poređenje sa drugim poznatim AI modelima kao što su LLaMa-3.1, koji je bio identifikovan kao čovek u 56% slučajeva, dok su stariji modeli poput ELIZA i GPT-4o imali znatno niži uspeh (23% odnosno 21%).

Ključ uspeha GPT-4.5 leži upravo u njegovoj sposobnosti da realistično simulira nesavršenosti i emocije tipične isključivo za ljudsku komunikaciju.

Ovde ipak treba napomenuti jako bitnu činjenicu: Tjuringov test je tokom vremena bio izložen ozbiljnoj kritici, ali i pored toga ipak predstavlja važan koncept u proceni ponašanja, znanja i snalaženja veštačke inteligencije u realnom ljudskom svetu, te je kao takav i do danas ostao jedino merilo dostignuća AI.

I još nešto – zapitaće se neko kako je Tjuring znao da će jednog dana doći do pojave veštačke inteligencije? Svakako je mogao to da nasluti, jer se i sam bavio pitanjima i razvojem mašina koje su imale nekakvu, makar rudimentarnu autonomiju u “razmišljanju”, a drugo, ovaj test je više misaoni i psihološki test u kojem do izražaja dolazi dovoljno dobra imitacija.

Ovo postignuće, koliko god neverovatno bilo, u ovom trenutku ipak otvara brojna pitanja i izazove. Prvo je, šta uopšte znači biti čovek u eri kada mašine mogu savršeno oponašati ljudsko ponašanje? Drugo, kako ćemo razlikovati stvarne ljude od AI u svakodnevnoj komunikaciji i kakve će to posledice imati na društvo i međuljudske odnose?

Kao što vidimo, budućnost je stigla znatno brže nego što smo očekivali, a GPT-4.5 je dokaz da će granice između ljudske i veštačke inteligencije biti sve teže odrediti. Šta će biti u bližoj i daljoj budućnosti, možemo samo da nagađamo i da se nadamo da će ova neverovatna tehnologija ipak prevashodno biti namenjena razvoju i napretku, a ne destrukciji.

Detalje o ovom fascinantnom istraživanju možete pronaći na sledećem linku: Psychology Today