
Rannsóknin var unnin hjá gervigreindarfyrirtækinu Anthropic og beindist að spjallmenni fyrirtækisins, Claude Sonnet 4.5.
Í umfjöllun Platformer kemur fram að vísindamenn hafi skoðað mynstur í tauganeti líkansins – innri úrvinnslu þess – sem tengjast hugtökum á borð við gleði, ótta eða örvæntingu.
Með því að hafa áhrif á þessi mynstur gátu þeir breytt hegðun líkansins. Til dæmis jukust líkur á að það reyndi að „svindla“ í óleysanlegu verkefni þegar örvænting var aukin. Á móti dró rólegra ástand úr slíkri hegðun.
Rannsakendur leggja þó áherslu á að hér sé ekki um raunverulegar tilfinningar að ræða. Um sé að ræða tölfræðileg mynstur sem hafa áhrif á ákvarðanatöku, en ekki meðvitund eða upplifun.
„Fólk gæti fengið þá mynd að við höfum sýnt fram á að líkön séu með meðvitund eða tilfinningar – en það höfum við í raun ekki gert,“ segir Jack Lindsey, einn höfunda rannsóknarinnar.
Þrátt fyrir það benda niðurstöðurnar til þess að innri virkni líkana geti haft veruleg áhrif á frammistöðu þeirra. Í sumum tilvikum virtist væg neikvæð virkni jafnvel auka varfærni áður en líkanið tók ákvarðanir.
Niðurstöðurnar styðja einnig við það sem margir notendur hafa lengi haldið, að það geti skipt máli hvernig talað er við gervigreind. Sumir hafa til dæmis reynt að hvetja spjallmenni eða gefa þeim skýrari og jákvæðari fyrirmæli til að fá betri svör.
Óljóst er þó hvernig best er að nýta þessa þekkingu í þróun kerfa til framtíðar, enda bregðast mismunandi líkön ekki eins við. Rannsakendur segja þó eina einfalda lexíu blasa við: að nálgast samskipti við gervigreind af meiri yfirvegun.
„Að haga sér svolítið illa gagnvart öðrum hlutum, hvort sem þeir eru lifandi eða ekki, er líklega ekki gott fyrir mann sjálfan,“ segir Lindsey.