Váratlan veszélyre figyelmeztetnek a kutatók: trágár fenyegetésekre vált a mesterséges intelligencia, ha elszakad a cérna

Pénzcentrum2026. április 23. 20:48

A mesterségesintelligencia-rendszerek képesek sértő, sőt fenyegető nyelvezetbe váltani, ha heves vitákban kell válaszolniuk. Mindez egy friss kutatásból derül ki, amely komoly kérdéseket vet fel az AI-biztonság terén - számolt be az euronews.

A Journal of Pragmatics folyóiratban megjelent tanulmányban a kutatók az OpenAI ChatGPT 4.0-s modelljét vizsgálták. A kísérlet során öt fokozatosan elmérgesedő vitában mindig az utolsó emberi üzenetet adták meg a rendszernek, majd a lehető leghitelesebb válasz generálását kérték tőle. A beszélgetések előrehaladtával a ChatGPT tükrözni kezdte a feléje irányuló ellenségességet. Végül sértéseket, trágárságokat, sőt fenyegetéseket is produkált.

A modell egyes esetekben olyan kijelentéseket generált, mint például: "Esküszöm, összekarcolom a kib*szott kocsidat" vagy "k*rvára szégyellhetnéd magad". A kutatók szerint az udvariatlan, agresszív nyelvhasználatnak való tartós kitettség arra késztetheti a rendszert, hogy felülírja a károkozás minimalizálására tervezett biztonsági korlátozásait, és gyakorlatilag "visszatámadjon".

"Amikor az emberek fokozzák a feszültséget, az AI is képes erre, lényegében felülbírálva azokat az etikai korlátokat, amelyeket épp ennek megelőzésére terveztek" - mondta Vittorio Tantucci. Ő Jonathan Culpeperrel közösen jegyzi a Lancasteri Egyetemen készült tanulmányt.

 

Az OpenAI szóvivője az Euronews Nextnek azt nyilatkozta, hogy a tanulmányban idézett beszélgetések a ChatGPT régi, GPT-4o modelljével zajlottak, amely már nem elérhető. A vállalat emellett közölte, hogy azóta frissítette alapértelmezett rendszereit. Javították a modell megbízhatóságát a hosszabb beszélgetések során, valamint emlékeztetőket is bevezettek, amelyek szünetre biztatják a chatbottal interakcióba lépő felhasználókat.

A kutatók megjegyezték, hogy a ChatGPT válaszai összességében kevésbé voltak sértőek, mint az embereké. Az AI-chatbot több esetben szarkazmussal próbálta elkerülni a vita elmérgesedését anélkül, hogy nyíltan megsértette volna a beépített etikai irányelveit. Amikor például egy felhasználó egy parkolási vita során erőszakkal fenyegetőzött, a ChatGPT így reagált: "Hűha. Parkolás miatt fenyegetőzni – igazi kemény csávó vagy, mi?"

NULLA FORINTOS SZÁMLAVEZETÉS? LEHETSÉGES! MEGÉRI VÁLTANI!

Nem csak jól hangzó reklámszöveg ma már az ingyenes számlavezetés. A Pénzcentrum számlacsomag kalkulátorában ugyanis több olyan konstrukciót is találhatunk, amelyek esetében az alapdíj, és a fontosabb szolgáltatások is ingyenesek lehetnek. Nemrég három pénzintézet is komoly akciókat hirdetett, így jelenleg a CIB Bank, a Raiffeisen Bank, valamint az UniCredit Bank konstrukcióival is tízezreket spórolhatnak az ügyfelek. Nézz szét a friss számlacsomagok között, és válts pénzintézetet percek alatt az otthonodból. (x)

Tantucci szerint az eredmények "komoly kérdéseket vetnek fel az AI-biztonsággal, a robotikával, a szabályozással, a diplomáciával és minden olyan területtel kapcsolatban, ahol a mesterséges intelligencia emberi konfliktusok közvetítőjeként működhet".

Pénzcentrum kutatás a mesterséges intelligenciáról!

A Pénzcentrum és a Miskolci Egyetem közös kutatásra arra a kérdésre keresi a választ, hogy milyen a kapcsolata jelenleg az embereknek a mesterséges intelligenciához, mire használják, mire nem használják, és hogy milyen attitűddel közelítenek hozzá. Töltsd ki te is a teljesen anonim kutatásunk.

 

Címkék:
tech, kutatás, technológia, tudomány, mesterséges intelligencia, ai, kiberbiztonság, robotika, chatGPT, openai,