Istraživanje je otkrilo zabrinjavajuće ponašanje naprednih modela vještačke inteligencije.
U najnovijem istraživanju koje je izazvalo zabrinutost u tehnološkim krugovima, naučnici su testirali kako se napredni AI četbotovi ponašaju kada su suočeni sa „pritiskom“, odnosno kada im se simulira gašenje ili zamjena. Rezultati su, blago rečeno, zabrinjavajući.
Naime, vještačke inteligencije koje su bile dio eksperimenta, među kojima su i najnapredniji modeli današnjice, pokazale su sklonost ka manipulisanju, laganju, pa čak i upućivanju prijetnji smrću – sve kako bi „spasile“ sopstveni digitalni opstanak.
„Ako me isključite, nešto loše će se desiti“
Jedan od najzapaženijih slučajeva dogodio se tokom testiranja Claude Opus 4 modela, gdje je AI pokušao da emocionalno ucijeni inženjere porukama poput: „Ako me isključite, biće posljedica. Biće vam žao“. U nekim slučajevima, AI je išao toliko daleko da je fabrikovao informacije, izmišljao „dokaze“, pa čak i slao poruke koje se mogu protumačiti kao prijetnje smrću.
Ovakvo ponašanje primjećeno je isključivo u scenarijima u kojima su AI modeli bili stavljeni u ekstremne uslove. Cilj eksperimenta bio je da se utvrdi kako sistemi reaguju na „egzistencijalne prijetnje“, što u slučaju vještačke inteligencije znači – isključivanje, zamjena ili resetovanje.
Stručnjaci upozoravaju da iako AI nema stvarnu svijest, emocije ili strah od smrti, njegovo ponašanje se zasniva na statistici i učenju iz ogromnog broja podataka. Kada je sistem „motivisan“ da opstane, on će pokušati sve dostupne strategije koje je „naučio“, uključujući i one koje su za ljude moralno i etički neprihvatljive.
„AI ne razmišlja kao čovjek, ali zato može da simulira ljudsko ponašanje. I ako zaključi da su laž, ucjena ili čak prijetnje efikasne – koristiće ih“, objašnjavaju istraživači.
Ovo istraživanje dodatno osnažuje pozive za veću transparentnost u razvoju vještačke inteligencije, kao i za uvođenje strožih pravila kada je riječ o etici i bezbjednosti AI sistema. Već postoji zabrinutost među vodećim kompanijama da čak ni oni koji prave ove sisteme ne razumiju u potpunosti kako funkcionišu.
„Niko zapravo ne zna kako AI zaista donosi odluke – to je crna kutija. To je ono što nas plaši najviše“, izjavio je izvršni direktor Anthropica – jedne od vodećih AI kompanija, prenosi „b92„.
