14 °C Budapest
Data connection speed line. Futuristic network representation. Graphic concept for your design

Bajban az AI-szektor: teljesen összezavarhatják az álinformációk a mesterséges intelligenciát

2024. augusztus 9. 15:13

Az AI világa a legértékesebb erőforrás kifogyásának küszöbén áll - ez a valódi adat. Ez a helyzet heves vitát  generál az iparág vezetői között, mert egyesek szerint a szintetikus, lényegében "hamis" adatok alternatívát jelenthetnek, mások szerint ez nem megoldás - írja a Business Insider.

Az OpenAI és a Google évek óta az internetről származó adatokat használnak mesterséges intelligencia eszközeik és funkcióik alapjául szolgáló nagyméretű nyelvi modellek (LLM) betanításához. Ezek az LLM-ek az emberek által évszázadokon keresztül előállított szövegek, videók és egyéb online médiamegjelenések tömkelegét emésztették meg - legyen szó akár kutatási tanulmányokról, regényekről vagy YouTube-klipekről. Mostanra azonban a "valódi", ember által generált adatok kínálata kezd kifogyni.

Az Epoch AI nevű kutatócég előrejelzése szerint a szöveges adatok 2028-ra elfogyhatnak. Eközben azok a vállalatok, amelyek az internet minden szegletéből kibányászták a felhasználható adatokat - és ennek érdekében néha megszegték a szabályzatukat -, egyre szigorúbb korlátozásokkal szembesülnek.

Egyesek számára ez nem feltétlenül jelent problémát. Mivel az ember által generált használható adatok kútja kiapad, egyre több vállalat vizsgálja a szintetikus adatokat használatát. A kutatók mégis vitatkoznak arról, hogy a szintetikus adatok jelentik-e a csodafegyvert.

Egy oxfordi és cambridge-i kutatócsoport által nemrégiben közzétett tanulmány felfedezte, hogy az AI által generált adatokkal táplált modell végül halandzsát produkált. "Ez egy válsághelyzet" - mondta Gary Marcus, AI-elemző és pszichológia emeritus professzor a New York-i Egyetemről, aki szerint a szintetikus adat néhány problémát megoldhat, de van ennél nagyobb gond is. "ezek a rendszerek nem igazán érvelnek vagy terveznek" - mondta.

Az olyan vállalatok mint OpenAI és Google több tízmillió dollárt fizet pl. a Reddit és hírportálok adatainak hozzáféréséért friss adatforrásként működve modellek képzéséhez. Azonban, ha elfogynak a valós adatok, akkor a szintetikus adatok felé fordulhatnak a cégek. Ezeket mesterséges intelligencia rendszerek generálják és valós adatokon alapulnak. Júniusban Nvidia kiadott olyan AI-modellt mely képes mesterséges adathalmazokat létrehozni az AI-fejlesztéshez, júliusban pedig a kínai Tencent technológiai óriás Persona Hub nevű szintetikus adatgenerátort hozott létre hasonló feladat ellátására.

NULLA FORINTOS SZÁMLAVEZETÉS? LEHETSÉGES! MEGÉRI VÁLTANI!

Nem csak jól hangzó reklámszöveg ma már az ingyenes számlavezetés. A Pénzcentrum számlacsomag kalkulátorában ugyanis több olyan konstrukciót is találhatunk, amelyek esetében az alapdíj, és a fontosabb szolgáltatások is ingyenesek lehetnek. Nemrég három pénzintézet is komoly akciókat hirdetett, így jelenleg a CIB Bank, a Raiffeisen Bank, valamint az UniCredit Bank konstrukcióival is tízezreket spórolhatnak az ügyfelek. Nézz szét a friss számlacsomagok között, és válts pénzintézetet percek alatt az otthonodból. (x)

Kutatók azonban figyelmeztettek: a szintetikus adatok túlhasználata visszafordíthatatlan hibákat is okozhat, modellösszeomláshoz vezethet. Jathan Sadowski, a Monash Egyetem senior elemzője ezt a jelenséget Habsburg AI-nak nevezte el, utalva ezzel az osztrák dinasztiáról egyes történészek által terjesztett nézetre, hogy a belterjesség végül elpusztította őket. Az AI kedvezőtlen mutálódására utalt ezzel, ha túl sok AI-által generált szintetikus adatot használnak a fejlesztéshez.

Kérdés azonban, hogy mi számít túl soknak. Egy áprilisi tanulmány eredményei szerint a saját generált adatokon edzett modellek nem feltétlenül omlanak össze, ha vegyesen kapnak valósi és szintetikus adatot. A hibrid adatbázisok jelenthetnek így megoldást. 

Címlapkép: Getty Images
NEKED AJÁNLJUK
NAPTÁR
Tovább
2026. április 6. hétfő
Vilmos, Bíborka
15. hét
Április 6.
Húsvéthétfő
KONFERENCIA
Tovább
AI in Energy 2026
Átlátható adat és energia
AgroFood 2026
Élelmiszeripari konferencia május 19-én
Portfolio Investment Day 2026
Éve Signature előfizetéssel INGYENES részvétel!
Hitelezés 2026
Lakossági hitelek: fenntartható növekedés vagy túlhevülés?
Women's Money & Mindset Day 2026
Hogyan gondolkodnak a nők pénzről, kockázatról és jövőről?
EZT OLVASTAD MÁR?