Váratlan veszélyre figyelmeztetnek a kutatók: trágár fenyegetésekre vált a mesterséges intelligencia, ha elszakad a cérna

Pénzcentrum • 2026. április 23. 20:48

A mesterségesintelligencia-rendszerek képesek sértő, sőt fenyegető nyelvezetbe váltani, ha heves vitákban kell válaszolniuk. Mindez egy friss kutatásból derül ki, amely komoly kérdéseket vet fel az AI-biztonság terén - számolt be az euronews.

A Journal of Pragmatics folyóiratban megjelent tanulmányban a kutatók az OpenAI ChatGPT 4.0-s modelljét vizsgálták. A kísérlet során öt fokozatosan elmérgesedő vitában mindig az utolsó emberi üzenetet adták meg a rendszernek, majd a lehető leghitelesebb válasz generálását kérték tőle. A beszélgetések előrehaladtával a ChatGPT tükrözni kezdte a feléje irányuló ellenségességet. Végül sértéseket, trágárságokat, sőt fenyegetéseket is produkált.

A modell egyes esetekben olyan kijelentéseket generált, mint például: "Esküszöm, összekarcolom a kib*szott kocsidat" vagy "k*rvára szégyellhetnéd magad". A kutatók szerint az udvariatlan, agresszív nyelvhasználatnak való tartós kitettség arra késztetheti a rendszert, hogy felülírja a károkozás minimalizálására tervezett biztonsági korlátozásait, és gyakorlatilag "visszatámadjon".

"Amikor az emberek fokozzák a feszültséget, az AI is képes erre, lényegében felülbírálva azokat az etikai korlátokat, amelyeket épp ennek megelőzésére terveztek" - mondta Vittorio Tantucci. Ő Jonathan Culpeperrel közösen jegyzi a Lancasteri Egyetemen készült tanulmányt.

Az OpenAI szóvivője az Euronews Nextnek azt nyilatkozta, hogy a tanulmányban idézett beszélgetések a ChatGPT régi, GPT-4o modelljével zajlottak, amely már nem elérhető. A vállalat emellett közölte, hogy azóta frissítette alapértelmezett rendszereit. Javították a modell megbízhatóságát a hosszabb beszélgetések során, valamint emlékeztetőket is bevezettek, amelyek szünetre biztatják a chatbottal interakcióba lépő felhasználókat.

A kutatók megjegyezték, hogy a ChatGPT válaszai összességében kevésbé voltak sértőek, mint az embereké. Az AI-chatbot több esetben szarkazmussal próbálta elkerülni a vita elmérgesedését anélkül, hogy nyíltan megsértette volna a beépített etikai irányelveit. Amikor például egy felhasználó egy parkolási vita során erőszakkal fenyegetőzött, a ChatGPT így reagált: "Hűha. Parkolás miatt fenyegetőzni – igazi kemény csávó vagy, mi?"

JÓL JÖNNE 2 MILLIÓ FORINT?

Amennyiben 2 000 000 forintot igényelnél 5 éves futamidőre, akkor a törlesztőrészletek szerinti rangsor alapján az egyik legjobb konstrukciót havi 42 386 forintos törlesztővel a Raiffeisen Bank nyújtja (THM 10,35%), de nem sokkal marad el ettől a CIB Bank (THM 11,29%-ot) és a MagNet Bank (THM 11.68%-ot) ígérő ajánlata sem. További bankok ajánlataiért, illetve a konstrukciók pontos részleteiért (THM, törlesztőrészlet, visszafizetendő összeg, stb.) keresd fel a Pénzcentrum megújult személyi kölcsön kalkulátorát. (x)

Tantucci szerint az eredmények "komoly kérdéseket vetnek fel az AI-biztonsággal, a robotikával, a szabályozással, a diplomáciával és minden olyan területtel kapcsolatban, ahol a mesterséges intelligencia emberi konfliktusok közvetítőjeként működhet".

Pénzcentrum kutatás a mesterséges intelligenciáról!

A Pénzcentrum és a Miskolci Egyetem közös kutatásra arra a kérdésre keresi a választ, hogy milyen a kapcsolata jelenleg az embereknek a mesterséges intelligenciához, mire használják, mire nem használják, és hogy milyen attitűddel közelítenek hozzá. Töltsd ki te is a teljesen anonim kutatásunk.

Címkék:

tech, kutatás, technológia, tudomány, mesterséges intelligencia, ai, kiberbiztonság, robotika, chatGPT, openai,