13 °C Budapest

Bármilyen nyelven beszélhetsz, azonnal

MTI
2012. november 12. 10:02

Saját hangunkon beszélhetünk folyékonyan kínaiul, franciául vagy bármely más, számunkra idegen nyelven a Microsoft új fejlesztésének segítségével, amely a hangzó beszédet alakítja át "gépi szinkrontolmácsként" a választott nyelvre.

A Galaxis útikalauz stoposoknak című Douglas Adams-regény kitalált élőlénye, amelyet bárki a fülébe dugva azonnal megért minden nyelvet már nem a jövő zenéje. Rick Rashid, a Microsoft szoftveróriás kutatási igazgatójának blogbejegyzéséből kiderül, hogy a program jelenlegi állapotában ugyan még számos hibát ejt, mégis sokkal jobb, mint bármely korábbi hasonló próbálkozás. Rashid az októberi, Tiencsinben tartott bemutatón néhány mondatát mandarin nyelven mondta el a program segítségével.

A fejlesztők számára a legnagyobb kihívást a beszélő megértése jelenti - idézi az igazgatót a TechNewsDaily.com című online magazin. Ezen a problémán már azóta dolgoznak, mióta a számítógép létezik. A több generációnyi fejlesztés mai eredménye például az Egyesült Államok bizonyos bankjaiban működő telebankrendszer, amelyben a komputer ismeri fel a hívó által bemondott bankszámlaszámot. az ilyen rendszerekben a beszédfelismerés azonban csak a számnevekre és esetenként néhány menüpontra - például "átutalás", "nyitva tartás" - korlátozódik.

Sokkal nehezebb azonban a kötetlen beszéd digitális "megértése". Egészen mostanáig az efféle programok a beszédnek legfeljebb 75-80 százalékát voltak képesek értelmezni - mondta Rashid. A Microsoft ezt az arányt igyekezett javítani a Deep Neural Networks rendszerének segítségével, amelyben a processzorok úgy kapcsolódnak egymáshoz, mint az emberi és állati agysejtek. A Google ugyanezt a technikát használta a nyáron egy olyan számítógép megépítéséhez, amely meg tudja tanulni macskákról készül képek felismerését.

Rashid szerint az új fejlesztés mára a szabad beszélt nyelv 86-88 százalékát felismeri. "Még mindig távol van a tökéletestől, mégis ez a legdrámaibb fejlődés az 1979 óta". Miután a rendszer felismeri, hogy mit mond angolul a felhasználó, a Microsoft fordítóprogramja átalakítja azt kínai szavakká, majd a szórendet a nyelvtani szabályok szerint megváltoztatja. A megfelelő hangszín eléréséhez Rashidnak egy órányi beszédére volt szükség, valamint fel kellett vennie egy mandarin anyanyelvű személy néhány órás beszédét is.

HR BLOGGER
coachco  |  2026.04.14 16:58
Régen írtam blogbejegyzést. Valahogy nem volt hozzá kedvem. De arra jutottam, így négy év után ezt a...
legacykft  |  2026.04.08 14:55
Egyre több olyan szakemberrel találkozunk, akik csoportokkal dolgoznak, legyen szó önismereti folyam...
hrdoktor  |  2026.03.24 15:00
A menopauza beköszönte sokféle testi panasszal járhat, ezek közül az egyik leggyakoribb az alvás min...
laskainelli  |  2026.01.18 19:19
Van az a reggel, amikor arra ébredsz, hogy már megint vele álmodtál. Pedig már napok, hetek teltek e...
kovacstunde  |  2025.11.15 08:00
Pár nappal ezelőtt Gabi barátnőmmel beszélgettünk, éppen ennek a cikknek a gondolataival voltam elfo...
NAPTÁR
Tovább
2026. április 20. hétfő
Tivadar
17. hét
Ajánlatunk
KONFERENCIA
Tovább
AI in Energy 2026
Átlátható adat és energia
AgroFood 2026
Élelmiszeripari konferencia május 19-én
Portfolio Investment Day 2026
Éve Signature előfizetéssel INGYENES részvétel!
Hitelezés 2026
Lakossági hitelek: fenntartható növekedés vagy túlhevülés?
Women's Money & Mindset Day 2026
Hogyan gondolkodnak a nők pénzről, kockázatról és jövőről?
EZT OLVASTAD MÁR?