30 °C Budapest
Data connection speed line. Futuristic network representation. Graphic concept for your design

Bajban az AI-szektor: teljesen összezavarhatják az álinformációk a mesterséges intelligenciát

2024. augusztus 9. 15:13

Az AI világa a legértékesebb erőforrás kifogyásának küszöbén áll - ez a valódi adat. Ez a helyzet heves vitát  generál az iparág vezetői között, mert egyesek szerint a szintetikus, lényegében "hamis" adatok alternatívát jelenthetnek, mások szerint ez nem megoldás - írja a Business Insider.

Az OpenAI és a Google évek óta az internetről származó adatokat használnak mesterséges intelligencia eszközeik és funkcióik alapjául szolgáló nagyméretű nyelvi modellek (LLM) betanításához. Ezek az LLM-ek az emberek által évszázadokon keresztül előállított szövegek, videók és egyéb online médiamegjelenések tömkelegét emésztették meg - legyen szó akár kutatási tanulmányokról, regényekről vagy YouTube-klipekről. Mostanra azonban a "valódi", ember által generált adatok kínálata kezd kifogyni.

Az Epoch AI nevű kutatócég előrejelzése szerint a szöveges adatok 2028-ra elfogyhatnak. Eközben azok a vállalatok, amelyek az internet minden szegletéből kibányászták a felhasználható adatokat - és ennek érdekében néha megszegték a szabályzatukat -, egyre szigorúbb korlátozásokkal szembesülnek.

Egyesek számára ez nem feltétlenül jelent problémát. Mivel az ember által generált használható adatok kútja kiapad, egyre több vállalat vizsgálja a szintetikus adatokat használatát. A kutatók mégis vitatkoznak arról, hogy a szintetikus adatok jelentik-e a csodafegyvert.

Egy oxfordi és cambridge-i kutatócsoport által nemrégiben közzétett tanulmány felfedezte, hogy az AI által generált adatokkal táplált modell végül halandzsát produkált. "Ez egy válsághelyzet" - mondta Gary Marcus, AI-elemző és pszichológia emeritus professzor a New York-i Egyetemről, aki szerint a szintetikus adat néhány problémát megoldhat, de van ennél nagyobb gond is. "ezek a rendszerek nem igazán érvelnek vagy terveznek" - mondta.

Az olyan vállalatok mint OpenAI és Google több tízmillió dollárt fizet pl. a Reddit és hírportálok adatainak hozzáféréséért friss adatforrásként működve modellek képzéséhez. Azonban, ha elfogynak a valós adatok, akkor a szintetikus adatok felé fordulhatnak a cégek. Ezeket mesterséges intelligencia rendszerek generálják és valós adatokon alapulnak. Júniusban Nvidia kiadott olyan AI-modellt mely képes mesterséges adathalmazokat létrehozni az AI-fejlesztéshez, júliusban pedig a kínai Tencent technológiai óriás Persona Hub nevű szintetikus adatgenerátort hozott létre hasonló feladat ellátására.

NULLA FORINTOS SZÁMLAVEZETÉS? LEHETSÉGES! MEGÉRI VÁLTANI!

Nem csak jól hangzó reklámszöveg ma már az ingyenes számlavezetés. A Pénzcentrum számlacsomag kalkulátorában ugyanis több olyan konstrukciót is találhatunk, amelyek esetében az alapdíj, és a fontosabb szolgáltatások is ingyenesek lehetnek. Nemrég három pénzintézet is komoly akciókat hirdetett, így jelenleg a CIB Bank, a Raiffeisen Bank, valamint az UniCredit Bank konstrukcióival is tízezreket spórolhatnak az ügyfelek. Nézz szét a friss számlacsomagok között, és válts pénzintézetet percek alatt az otthonodból. (x)

Kutatók azonban figyelmeztettek: a szintetikus adatok túlhasználata visszafordíthatatlan hibákat is okozhat, modellösszeomláshoz vezethet. Jathan Sadowski, a Monash Egyetem senior elemzője ezt a jelenséget Habsburg AI-nak nevezte el, utalva ezzel az osztrák dinasztiáról egyes történészek által terjesztett nézetre, hogy a belterjesség végül elpusztította őket. Az AI kedvezőtlen mutálódására utalt ezzel, ha túl sok AI-által generált szintetikus adatot használnak a fejlesztéshez.

Kérdés azonban, hogy mi számít túl soknak. Egy áprilisi tanulmány eredményei szerint a saját generált adatokon edzett modellek nem feltétlenül omlanak össze, ha vegyesen kapnak valósi és szintetikus adatot. A hibrid adatbázisok jelenthetnek így megoldást. 

Címlapkép: Getty Images
NEKED AJÁNLJUK
Te is szégyenlős vagy a szaunában? Itt a megnyugtató megoldás! (x)

Van, aki meztelenül, törölközőbe csavarva kényelmetlenül érzi magát, míg szintetikus anyagból készült fürdőruhában beülni a gőzbe több okból sem szerencsés.

Nemes Jeles László Napszállta című filmje óta nem volt ilyen a hazai mozikban: óriási siker a magyar Kickstarteren

A Fekete pont című film kampánya hatalmas sikert aratott a Brancs közösségi finanszírozási platformon, amely minden előzetes várakozást felülmúlt.

Ezt a különleges térképet nem árt, ha megveszed a gyereknek iskolakezdésre

A legkisebbek számára is érthetővé és elérhetővé tenné a tudományt a korábban a NASA-ban is dolgozó Hargitai Henrik bolygó- és felszínalaktan-kutató.

Ilyen zseniális ötletekről pitchelnek majd a fiatalok a kezdő vállalkozóknak szóló verseny döntőjében

72 csapat regisztrált arra a befektetői pitch versenyre, amelynek döntőjét augusztus 3-án rendezik Budapesten a IV. Mindset Meetup keretében.

Erről ne maradj le!
NAPTÁR
Tovább
2024. szeptember 7. szombat
Regina
36. hét
Ajánlatunk
KONFERENCIA
Tovább
REA 2024 SUMMIT – Powered by Pénzcentrum
A magyar Real Estate Agent találkozó a Kalmárok közreműködésével
Future of Finance 2024
Mi lesz a szerepe a pénzügyekben az AI-nak?
Sustainable World 2024
Zöld finanszírozási lehetőségek, befektetési döntések, ESG megfelelés
EZT OLVASTAD MÁR?