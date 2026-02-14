Kínai technológiai óriások új mesterséges intelligencia modelljei felveszik a versenyt az amerikai fejlesztésekkel a robotika és videógenerálás területén - állítja a CNBC.

Miközben az amerikai piacok az Anthropic és Altruist szoftverekre gyakorolt hatására figyelnek, a kínai technológiai óriások olyan új MI-modelleket mutattak be a héten, amelyek jelentős előrelépést jelentenek a robotika és videógenerálás területén.

Az Alibaba, a ByteDance, a Kuaishou mind olyan új MI-modelleket jelentettek be, amelyek bizonyítják, hogy a kínai cégek lépést tartanak amerikai versenytársaikkal. Ez azután történt, hogy a Google DeepMind vezetője, Demis Hassabis a CNBC-nek nyilatkozva elmondta, a kínai MI-modellek csupán "hónapokkal" vannak lemaradva a nyugati versenytársaktól.

Az Alibaba DAMO Akadémiája bemutatta a RynnBrain nevű MI-modellt, amely arra készült, hogy segítse a robotokat a fizikai világ megértésében és a tárgyak azonosításában. Egy videós bemutatón az Alibaba egy csipeszkezű robotot mutatott be, amely képes volt megszámolni a narancsokat, felvenni és kosárba helyezni azokat, valamint tejet kivenni a hűtőből.

A ByteDance Seedance 2.0 nevű videógeneráló MI-modellje képes realisztikus videót létrehozni egyszerű szöveges utasítás alapján, de a felhasználók más videókat és képeket is felhasználhatnak az utasításokban. A CNBC által megtekintett, Seedance 2.0-val készült videók meglehetősen realisztikus képeket és videókat mutatnak, amelyeket teljes egészében MI generált.

Billy Boman, egy stockholmi kreatív reklámügynökség vezetője, aki MI-generált tartalmakat készít, használta a Seedance 2.0-t. Elmondása szerint az MI videógenerálás jelentős fejlődésen ment keresztül az elmúlt két évben. "2023-ban nehéz volt valakit futva vagy sétálva ábrázolni. Most viszont már bármit meg tudok csinálni - nyilatkozta Boman a CNBC-nek.

Eközben a Kuaishou a múlt héten kiadta a Kling 3.0 videógeneráló modelljét, ami a ByteDance versenytársa. A modell jelentős fejlesztéseket tartalmaz a konzisztencia, a fotorealisztikus kimenet terén, valamint akár 15 másodperces videók készítésére és natív hangkeltésre is képes több nyelven, nyelvjárásban és akcentusban.

Az sem véletlen, hogy a Zhipu AI részvényei megugrották csütörtökön, miután kiadta a GLM-5 nyílt forráskódú nyelvi modellt, amely fejlett kódolási képességekkel rendelkezik. A vállalat szerint a modell megközelíti az Anthropic Claude Opus 4.5 teljesítményét a kódolási tesztekben, miközben felülmúlja a Google Gemini 3 Pro-t bizonyos teszteken.