JÖVŐ

Feltámasztották Albert Einsteint - elárasztották az Instát és a TikTokot az életre kelt régi fotók, és ez nemcsak egy játék

A politikai kampányokban és a háborús propagandában jöhetnek a teljesen hihető hamisított videók, de a színészek jövője is veszélybe került, nem is beszélve az influenszerekről. Eljött a félrevezetések kora.

Szerző: Gábor János, Címlapkép: ByteDance/OmniHuman-1 - szmo.hu
2025. február 24.

Az Instagramon és a TikTokon egyre több olyan reklám jön szembe, amin életre kelnek a régi fényképek. A TikTokot birtokló ByteDance kutatói is kifejlesztettek egy olyan mesterséges intelligencia-rendszert, amely egyetlen fotóból képes élethű videókat generálni. Az eredetileg csak pillanatképen látható személy a generált videón megtévesztő természetességgel beszél, énekel, gesztikulál vagy mozog. Az új AI-modell készítői szerint ez az áttörés forradalmasíthatja a digitális szórakoztatást vagy a kommunikációt. És a világhírű Einstein-portré alább látható életre keltése láttán nehéz lenne vitatni, hogy igazuk lesz.

Einstein életre kel

Bár a videó hangja nem a Nobel-díjas elméleti fizikustól származik, hanem – a New York Post szerint – Jaak Panksepp neurológus és állati érzelmekkel foglalkozó kutató bő egy évtizeddel ezelőtti beszédéből vágták ki, az eredmény valóban lenyűgöző. Úgy tűnik, hogy az egyébként teljes testalakot életre keltő, OmniHuman névre keresztelt rendszer alaposan túlszárnyalhatja a korábbi AI modelleket, amelyek csak arcot vagy felsőtestet tudtak animálni a fényképekből.

„A humán animációs technológiák az utóbbi években komoly fejlődésen mentek át, de a meglévő módszerek még mindig nehezen skálázhatók általános videógeneráló modellekké, ami korlátozza a valódi alkalmazhatóságukat” – jegyzik meg tanulmányukban a ByteDance tudósai. A szakemberek meghatározása szerint „teljes körű, multimodális mozgáskondicionálású emberi videógeneráló keretrendszert” alkottak, ami egyetlen kép, valamint a mozgási jelek (ezen belül a hang, a videó vagy mindkettő) alapján hoz létre „emberi videókat”.

Így készült az új AI

Az OmniHuman vegyes adatokkal történő tanulási stratégiát alkalmaz, kihasználja a vegyes adatok skálázhatóságát, hogy leküzdje a magas minőségű adatok hiányát, ami a korábbi módszereket jelentősen visszafogta. Ezzel a ByteDance AI-ja valóban képes lehet felülmúlni a meglévő megoldásokat, például az OpenAI Soráját, hiszen tényleg rendkívül élethű videókat készít emberekről, még egészen gyenge bemeneti jelek, különösen hang alapján.

Az OmniHuman bármilyen képarányú képet támogat (portré, felsőtest, alsótest vagy teljes test), és különböző helyzetekben is élethű, kiváló minőségű eredményt nyújt – foglalják össze a kutatók.

A csapat több mint 18.700 órányi, hús-vér emberekről készült videó felhasználásával képezte ki az OmniHumant, egy olyan új módszert alkalmazva, ami képes kombinálni többféle inputot, így szöveget, hangot és testmozgást. Ez a tréningstratégia teszi lehetővé, hogy az új AI jóval nagyobb és változatosabb adathalmazokból tanuljon, mint a korábbi megoldások.

Az OmniHuman ráadásul különböző bemeneti képekkel kompatibilis, és megőrzi a mozgás stílusát, például a jellegzetes szájmozgásokat. Mindemellett kiemelkedőnek tűnik akkor is, ha objektumokat kell használnia: képes olyan videókat generálni, amelyeken egy személy énekel, miközben hangszereken játszik, vagy természetes gesztikulációt végez, különböző tárgyakat tartva. Óriási előnye továbbá, hogy pózalapú videógenerálást is végrehajt, illetve együttesen vezérli a pózt és a hangot.

Ő sem létezik

Ez a technológia új mérföldkő lehet az AI-alapú médiaalkotásban, és képes például beszédet mondó vagy hangszeren játszó embereket ábrázoló videók előállítására. Az OmniHuman a tesztek során több minőségi mutatóban is felülmúlta a meglévő rendszereket – emeli ki a VentureBeat, hozzátéve: a fejlesztést egyre kiélezettebb verseny hívta életre, hiszen olyan óriásvállalatok dolgoznak hasonló technológiákon, mint a Google, a Meta és a Microsoft. A ByteDance áttörése előnyt jelenthet, pláne akkor, ha beépíti azt az általa kiadott – és az USÁ-ban jelenleg nehéz helyzetben lévő – TikTok rendszerébe. Nem nehéz arra következtetni, hogy az OmniHuman ezzel a távlati céllal készülhetett.

Milyen hatással lesz a ByteDance AI-ja a tartalomgyártásra?

Bár az OmniHuman széles körben egyelőre nem hozzáférhető, a fejlesztők több tucatnyi videót tettek közzé arról, hogy a tartalomkészítők milyen lehetőségekre számíthatnak tőle. Érdemes ugyanakkor megjegyezni, hogy az AI nem feltétlenül fogja a javukat szolgálni, és erre a Forbesnak nyilatkozó szakértők is egyértelműen rávilágítottak.

„Nagyon lenyűgözőek” – mondta a ByteDance kutatóinak videóiról Freddy Tran Nager, a Dél-Kaliforniai Egyetem Annenberg Kommunikációs és Újságírói Iskolájának klinikai adjunktusa. „Ha arra gondolnánk, hogy feltámasztjuk Humphrey Bogartot, és szerepeltetjük egy filmben, nem vagyok biztos benne, hogy jól nézne ki, de egy kis képernyőn, különösen telefonon, nagyon meggyőzőek.”

Az eszköz a ByteDance-t – és ezáltal a TikTokot – egyértelműen a legrealisztikusabb AI-generált videókért folytatott verseny élmezőnyébe helyezi, hiszen a digitális alakok egyre több helyen bukkannak fel: virtuális influencerként reklámoznak termékeket, tisztviselők digitális verzióiként segítenek eligazodni a közszolgáltatások használatában, vagy éppen hírességek deepfake verzióiként lépnek kapcsolatba az emberekkel – nem egyszer komoly bajt is okozva.

Kellenek még egyáltalán humán influencerek?

Nager szerint egy olyan eszköz, amely egyetlen fotóból képes videókat létrehozni, számos felhasználási lehetőséget kínálhat: a diákok például eldönthetnék, hogy milyen formában kapják meg az információt egy online kurzuson:

„Szeretném, ha Marilyn Monroe tanítana statisztikát. Vagy egy bábfigura. Vagy Breki, a béka”

– hozott fel néhány példát. Tekintettel azonban az OmniHuman nyilvánvaló kapcsolatára a TikTokkal, a szakértő azt is el tudja képzelni, hogy a kiégett tartalomgyártók a saját virtuális másukat használnák fel a videóikban, vagy

a TikTok mondhatja azt is: Tudjátok mit? Mostantól magunk is létrehozhatunk videókat. Kinek van még szüksége emberekre?

Samantha G. Wolfe, a New Yorki Egyetem Kultúra-, Oktatás- és Fejlődéskutató Intézetének adjunktusa szintén lát veszélyeket az OmniHumanhoz hasonló eszközökben. „Létrehozni valamit pusztán egy képből, és úgy megjeleníteni, mintha valóban beszélne és mozogna, technológiai szempontból lenyűgöző, de rengeteg potenciálisan negatív következménye is lehet. Egy üzleti vagy politikai vezető hamisított verziója például, ha olyasmit mond, ami nem igaz, óriási hatással lehet egy vállalatra vagy akár egy egész országra.”

Ahogy az AI által generált videók egyre kifinomultabbá válnak, úgy nőnek a kockázatok is. „Minél inkább hasonlítanak a valóságra, minél inkább úgy tűnik, mintha valódi emberek lennének, annál nagyobb a valószínűsége, hogy az emberek elhiszik, amit mondanak” – magyarázta Wolfe. A szakértő véleményét sajnos több közelmúltban történt eset is igazolja.

Emlékezetes, hogy tavaly néhány országban villámgyorsan terjedtek szét politikai deepfake-ek, jellemzően a választásokat megelőző időszakokban.

A tajvani voksolás napján például egy vélhetően a Kínai Kommunista Párthoz köthető csoport tett közzé mesterséges intelligencia által generált, félrevezető hangfelvételt, amelyben egy helyi politikus támogatását fejezte ki ellenfele, a Kína-barát jelölt mellett. Moldovában szintén a kampány alatt jelentek meg deepfake videók az ország elnökéről, Maia Sandutról, amint éppen lemond a tisztségéről, míg Dél-Afrikában maga Eminem „biztosította támogatásáról” az egyik ellenzéki pártot a választások előtt.

A deepfake-ek ennél is gyakrabban válnak pénzügyi bűncselekmények eszközévé. A fogyasztókat hírességek hamisított videóival verik át úgy, hogy megtévesztő befektetési lehetőségeket ajánlanak, de bizonyos vállalatokat is dollármilliós károk érhetnek deepfake csalások miatt. A Deloitte szerint a generatív AI segítségével végrehajtott csalások 2023-ban több mint 12 milliárd dolláros kárt okoztak, csak az Egyesült Államokban, és ez az összeg 2027-re elérheti a 40 milliárd dollárt.

Elon Musktól minden hihető

Az OmniHuman ugyan nem az első AI-eszköz, amely egyetlen fotóból képes videókat generálni, de az mindenképpen megkülönbözteti a többitől, hogy a mögötte álló csapat hatalmas mennyiségű adathoz fér hozzá – jelentette ki Nager.

„Ha valaha készítettél TikTok-videót, jó esély van rá, hogy már egy olyan adatbázisban vagy, amelyet virtuális emberek létrehozására fognak használni.”

A tudós állítására reagálva a ByteDance szóvivője azt írta a Forbesnak, hogy a modellt nem a vállalat termékeiből származó adatokból képezték ki. Hozzátette: ha az OmniHuman nyilvánosan elérhetővé válik, tartalmazni fog olyan védelmi mechanizmusokat, amelyek megakadályozzák a káros vagy félrevezető tartalmak létrehozását, de olyan átláthatósági intézkedéseket is bevezetnek hozzá, amelyek egyértelművé teszik, hogy az adott tartalmat AI generálta.

Nem túl megnyugtató belegondolni, de úgy fest, igaz, hogy egyelőre az AI-kat üzemeltető cégek adott szavára vagyunk kénytelenek hagyatkozni, ha a káros hamisítványok megfékezéséről van szó. A deepfake-eket egyre nehezebb felismerni, és bár egyes közösségi médiumok és keresőmotorok tettek lépéseket a terjedésük korlátozására, az interneten elérhető hamis tartalmak mennyisége riasztó ütemben növekszik.

A Jumio ID-ellenőrző cég 2024 májusában végzett felmérése szerint az emberek 60 százaléka találkozott deepfake tartalommal az elmúlt évben, és a válaszadók 72 százaléka aggódik amiatt, hogy bármikor félrevezethetik őket. A kutatásban résztvevők többsége éppen ezért teljes mellszélességgel támogatja a mesterséges intelligencia által generált hamis tartalmak szabályozását célzó jogszabályokat.

KÖVESS MINKET:

Népszerű

Ajánljuk

KÉK HÍREK

Drámai videón, ahogy rendőrök megmentenek egy fiatal lányt, aki kimászott a Margit híd peremére

A rendőröket március 21-én kora este riasztották, hogy egy fiatal kimászott a híd korlátján.

KULT

Herceg helyett bandita, beszélő Kuka, üvegkoporsó sehol – Vajon megérdemli a Hófehérke a gyűlöletáradatot?

Szinte példa nélküli a Hófehérke esete, már hogy ennyivel a premierje előtt teljesen leírjon előre egy filmet a széles közönség. A végeredmény azonban sokakat meglephet.

KÉK HÍREK

Két holttestet találtak egy battonyai házban, gyilkosság történhetett

Az 52 éves nő és az 55 éves férfi holttestét hétfő reggel találták meg a rendőrök. Emberölés miatt kezdtek nyomozni.

Címlapról ajánljuk

JÖVŐ

„A legsötétebb nap” – Trump környezetvédelmi ügynöksége eltörli a legfontosabb környezetvédelmi szabályokat

Több tucat szabályozást vonnak vissza. Az ügynökség új vezetője szerint véget ér a "zöld átverés" kora, és a jövőben azon dolgoznak majd, hogy megszűnjön a jogi felhatalmazásuk a szén-dioxid és más üvegházhatású gázok szabályozására.

Címlapkép: Win McNamee/Getty Images) - szmo.hu
2025. március 13.

A Trump-kormányzat bejelentette, hogy visszavonja az ország több tucat környezetvédelmi szabályozását, köztük a kipufogógázokra és gyárkéményekre vonatkozó szennyezési határértékeket, a vizes élőhelyek védelmét és az üvegházhatású gázok szabályozásának jogi alapját.

Lee Zeldin, a Környezetvédelmi Ügynökség (E.P.A.) vezetője egy online videóban azt mondta, hogy az ügynökség célja a jövőben az, hogy „csökkentse az autóvásárlás, az otthoni fűtés és a vállalkozások költségeit”. A videóban nem beszélt a környezet vagy a közegészség védelméről, amire az ügynökség létrejött.

Zeldin bejelentette, hogy visszavonnak több mint két tucat levegő- és vízszennyezés elleni szabályt.

Az E.P.A. a tervek szerint enyhítené az erőművek szén-dioxid-kibocsátási korlátozásait. A jelenlegi előírások szerint a széntüzelésű erőműveknek és az új gázerőműveknek 2039-ig 90 százalékkal kellene csökkenteniük a kibocsátásukat. A gépjárművekre vonatkozó kibocsátási normákat is átírnák, így nem lenne kötelező, hogy 2032-re az új autók és könnyű teherautók többsége elektromos vagy hibrid legyen. Eltörölnék a koromkibocsátási határértékeket, amelyeket légzőszervi betegségekkel és idő előtti halálozásokkal hoztak összefüggésbe.

A Biden-kormányzat egyik szabályozása előírta, hogy a széntüzelésű erőművek higanykibocsátását 70 százalékkal csökkentsék, mivel a higany káros a gyermekek fejlődésére. Az új tervek szerint ezt is eltörölnék. Nem működne többé a „jó szomszédság szabály”, amely arra kötelezte az államokat, hogy kezeljék az általuk kibocsátott, más államokba sodródó szennyezést. Emellett eltörölnék azokat az intézkedéseket, amelyek a szegényebb és kisebbségi közösségek védelmét helyezik előtérbe.

A klímaváltozás hatásainak számszerűsítésére használt „szén-dioxid társadalmi költségét” is jelentősen csökkentenék. Ezt az értéket a szabályozások gazdasági hatásainak mérlegelésekor használják.

Zeldin szerint az E.P.A. a jövőben nem venné figyelembe a környezeti politikák társadalmi költségeit, például azt, hogy az erdőtüzeket, aszályokat, viharokat és más katasztrófákat mennyire súlyosbíthatják a szennyezések.

Az egyik legfontosabb változás az lenne, hogy az E.P.A. eltörölné a 2009-es veszélyeztetettségi megállapítást, amely alapján az üvegházhatású gázok veszélyt jelentenek a közegészségre. Ha ezt visszavonnák, az ügynökség gyakorlatilag nem tudná szabályozni a klímaváltozást okozó kibocsátásokat. Zeldin erről a videóban úgy fogalmazott, hogy

az ügynökség azon dolgozik majd, hogy megszűnjön a jogi felhatalmazásuk a szén-dioxid és más üvegházhatású gázok szabályozására. A videóban ezt „a klímaváltozás vallásának szent gráljaként” emlegette.

Zeldin a bejelentést „az Egyesült Államok történetének legnagyobb deregulációs bejelentésének” nevezte, és azt mondta: „Ma véget ér a zöld átverés, és az E.P.A. hozzájárul az amerikai aranykor eljöveteléhez.”

Trump már korábban is kampányolt azzal, hogy lazítaná a fosszilis tüzelőanyag-ipart érintő szabályozásokat, és „fúrjunk, fúrjunk, fúrjunk” jelszóval hirdette energiapolitikáját. Visszatérése óta befagyasztotta a Kongresszus által jóváhagyott klímavédelmi programok finanszírozását, elbocsátotta az időjárási és klíma-előrejelzéseken dolgozó tudósokat, és csökkentette azokat az állami támogatásokat, amelyek a fosszilis tüzelőanyagokról való átállást segítették elő.

Az Egyesült Államok a világ történetének legnagyobb szén-dioxid-kibocsátója, és a tudósok szerint ez az üvegházhatású gáz a klímaváltozás fő mozgatórugója. A tavalyi év volt a legmelegebb a feljegyzések kezdete óta, és az országban 27 olyan természeti katasztrófa történt, amelyek egyenként legalább 1 milliárd dolláros kárt okoztak – míg 1980-ban ez a szám csupán három volt.

Sheldon Whitehouse, Rhode Island demokrata szenátora a New York Timesnak azt mondta „ma jött el az a nap, amiért Trump nagy olajipari támogatói fizettek”. Szerinte az E.P.A. lépései támadást jelentenek a tiszta levegő, a tiszta víz és a megfizethető energia ellen. „Zeldin igazgató nyilvánvalóan hazudott, amikor azt mondta, hogy tiszteletben tartja a tudományt és meghallgatja a szakértőket” – tette hozzá.

Gina McCarthy, aki az Obama-kormányzat idején vezette az E.P.A.-t, azt mondta, hogy ez „az E.P.A. történetének legsötétebb napja”.

Szerinte ezeknek a szabályoknak a visszavonása „nem csupán szégyen, hanem fenyegetés mindannyiunk számára”.

# Csináld másképp

Te mit csinálnál másképp? - Csatlakozz a klímaváltozás hatásairól, a műanyagmentességről és a zero waste-ről szóló facebook-csoportunkhoz, és oszd meg a véleményedet, tapasztalataidat!

KÖVESS MINKET:

Ajánljuk

KÉK HÍREK

Napokig verhette élettársa a 64 éves pedagógust, akinek holttestét szombat délelőtt találták meg Ráckeresztúron

A háromgyerekes anya két éve fogadta be a férfit, de a szomszédok szerint gyakran hallották, hogy veszekedtek, verekedtek egymással.

KÉK HÍREK

A Fólia nevű dizájnerdrogot fogyaszthatta a férfi, aki fadoronggal vert halálra két embert Fonón

Egy bolti eladót és egy utcán sétáló asszonyt támadott meg, majd a nő segítségére siető idős férfit is bántalmazta. A támadó barátai megdöbbentek a hír hallattán.

KÉK HÍREK

A gránátrobbanás két sérültjénél járt Szalay-Bobrovniczky Kristóf: „a katona jobban van, a sebesült hölgy jelenleg nincs életveszélyes állapotban”

A honvédelmi miniszter a kórházban azt ígérte, hogy az újdörögdi baleset mindkét sérültjének minden támogatást megadnak.

JÖVŐ

A ChatGPT a saját gyerekei megölésével vádolt meg egy ártatlan férfit

Stimmelt a férfi neve, a szülővárosa, a gyerekek száma, a nemük, csak az nem, hogy a háromból kettőt meggyilkolt. Ja, és a harmadikat is megpróbálta eltenni láb alól. Legalábbis a mesterséges intelligencia szerint.

Maier Vilmos, képünk illusztráció, fotó: Unsplash/Nik - szmo.hu
2025. március 20.

Az osztrák Noyb nevű adatvédelmi jogvédő szervezet újabb panaszt nyújtott be az OpenAI ellen, mert a ChatGPT egy norvég férfit tévesen gyilkossággal vádolt meg, írja az Engadget. A mesterséges intelligencia azt állította róla, hogy

21 év börtönt kapott két gyermeke meggyilkolásáért és egy harmadik megölésének kísérletéért, miközben ez nem igaz.

A ChatGPT a valós adatokat is összekeverte a hamis állításokkal: helyesen adta meg a férfi szülővárosát, valamint gyermekei számát és nemét. A Noyb szerint ezzel egyértelműen megsértette az adatvédelmi szabályokat.

Nem ez az első eset, hogy a ChatGPT valótlan vádakkal illet ártatlan embereket. Korábban egy férfit csalással, egy bírósági tudósítót gyermekbántalmazással, egy jogászprofesszort pedig szexuális zaklatással hozott összefüggésbe – derül ki a magazin cikkéből.

Az OpenAI eddig azzal védekezett, hogy a ChatGPT figyelmezteti a felhasználókat a hibák lehetőségére, de a jogvédők szerint ez nem elég. A kérdés most az, hogyan reagál a cég az újabb panaszra – és hogy egy mesterséges intelligencia megúszhatja-e annyival, hogy „bocsánat, tévedtem”.

(via Telex)

Kapcsolódó

Balogh Petya a mesterséges intelligenciáról: Amíg nem viszket, nem vakarjuk - én bízom abban, hogy a végén minden jól alakul majd

A Cápák között zsűritagja és a téma egyik legjobb hazai szakértője azt mondja, az emberiség szuperképessége, hogy idővel minden technológiát megszelídít. De az biztos, hogy ami most történik, átformálja az életünket.

KÖVESS MINKET:

Ajánljuk

KÉK HÍREK

Többmillió forintot érő fülbevalókat nyelt le egy tolvaj Orlandóban – 12 napig vártak rá a rendőrök, hogy előkerüljenek az ékszerek

Egy amerikai férfi több mint egymillió dollár értékű ékszert lopott el egy orlandói üzletből, majd amikor a rendőrök elfogták, lenyelt két pár fülbevalót. Végül az ékszerek visszakerültek a boltba - kiderült, hogyan.

KÉK HÍREK

Fotók: Betörték az ablakot és vízzel kevert kutyaürüléket öntöttek a Mi Hazánk képviselőjének autójába

Kisberk Szabolcs szerint a támadás nem véletlen, hiszen hónapok óta foglalkozik a gyömrői horrormenhelyként hírhedtté vált Kutya Mentsvár Menhely ügyével, és több illegális menhelyet és állatkínzót is leleplezett.

KULT

Igazi horror szülőknek, amit mindenkinek látnia kellene – az év sorozatát rakta le a Netflix a Kamaszokkal

Te mit tennél, ha a 13 éves, tini gyerekedet hajnalok hajnalán elvinné a rendőrség, mert egy gyilkossággal vádolják? Hinnél a saját fiadnak, még akkor is, ha minden ellene szól? Stephen Graham és Jack Thorne legújabb sorozata nagy gyomros a szülőknek és figyelemfelhívás a fiataloknak!

JÖVŐ

Balogh Petya: A kínai DeepSeek semennyire nem veszélyes, sőt, egy demokratikusabb irányba viszi az AI-fejlesztést

Az olcsó kínai AI megjelenése megrengette az amerikai tőzsdét. Balogh Petya szerint azonban ennél jobb nem is történhetett volna. Lehet, hogy a nagy amerikai techcégek, amelyek ezért a monopóliumért versenyeztek, most veszítettek, de a világ mindenképpen nyert.

Fischer Gábor, Címlapkép: RTL - szmo.hu
2025. január 30.

Komoly pánikot váltott ki Amerikában, hogy egy kínai cég olyan mesterséges intelligenciával állt elő, amelyik töredékáron készült, és mégis hasonló teljesítményt nyújt, mint a ChatGPT. A DeepSeek mindössze 5,6 millió dollárba került. A hírre az amerikai tőzsde a történelem egyik legnagyobb részvényzuhanásával reagált. A mesterséges intelligenciákhoz drága chipeket gyártó NVidia egyetlen nap alatt 600 milliárd dollárt veszített az értékéből. Ez 17%-os esés, igaz, az első pánik után másnap 8%-ot erősödtek a cég részvényei.

De a DeepSeek rávilágított arra, mennyire törékeny az amerikai óriáscégek előnye Kínával szemben a mesterséges intelligencia terén.

Donald Trump úgy reagált, végsősoron jó dolog történt, mert hosszabb távon olcsóbban lehet majd fejleszteni. Hogyan lehet, hogy ilyen olcsón ki tudott jönni a DeepSeek, és ez az esemény milyen hatással lesz a mesterséges intelligencia fejlesztésére? A kérdéseinkre Balogh Petya válaszolt, aki az STRT Holding Nyrt igazgatósági elnöke, és befektetéseik mellett csapatával tavaly több ezer cégvezetőnek tartott oktatást az AI fejlődéséről és várható üzleti hatásairól. Kiderült, őt kifejezetten feldobták az új fejlemények.

– Örülünk, és miért örülünk?

– Azért, mert az egyik nagy dilemmája a technológiának az utóbbi évtizedekben, hogy több olyan technológia volt, ami nagyon nyitottnak, nagyon szabadnak és demokratizálónak indult, és végül egy-egy monopólium rátelepedett. Maga a webes böngészés és információszerzés is szabadnak indult, hiszen bárki tud weboldalt csinálni, de aztán kiderült, ahhoz, hogy bárkinek a weboldalát megtaláljuk, csak egy darab játékos lett a Google, akin keresztül ezt hatékonyan és jól lehetett megoldani.

Úgyhogy végül is a webet a Google monopóliumba tudta ezzel hajtani, és a webes kereséseknek, hirdetéseknek ő lett a vámszedője. És most már ott tartunk, hogy akár a tranzakció értékének a negyede, ötöde hirdetési költség formájában ennél a vámszedőnél landol.

Ugyanígy a social médiában a Meta, azaz a Facebook anyacége, az Instagram és más platformok révén szintén monopóliumot alakított ki, és most arra törekszik, hogy a TikTokot is megszerezze, ezzel tovább erősítve pozícióját. Tehát egy szabadnak, nyitottnak indult technológiából végül monopólium lett. A mesterséges intelligencia kapcsán ez azért veszélyes, akárcsak a Google kapcsán, hogy aki a tudáshoz való hozzáférést vezérli, annak nemcsak brutális gazdasági, hanem hihetetlen politikai befolyásoló ereje is lesz. Nem véletlen, hogy amikor Trump először nyert, akkor azt egyértelműen egy, a Facebookot ügyesen használó csapatnak, a Cambridge Analyticának köszönhette jelentős mértékben, mert a Facebookot, mint manipulatív eszközt a politikai célokra fegyverként bevetve tudtak a szavazókra hatni.

Ha ugyanez történik a mesterséges intelligenciában, akkor lesz egy cég, amely eldöntheti, hogy egy-egy kérdésben mit tudjon az egész emberiség.

És akkor jön egy kis kínai játékos, aki pedig megmutatja, hogy több nagyságrenddel olcsóbban közel olyan színvonalat tud előállítani. És nem elég, hogy megcsinálja ezt, és árban versenyezne vele, hanem a teljes fejlesztését, az összes programkódot, a teljes adatbázist, a létrejövő mesterséges intelligenciát mindenestől bedobja a közösbe.

– Ez neki miért jó?

– Érdekes, hogy nem ők kezdték ezt a játékot, hanem nyílt forráskódú fejlesztésben is sokan kísérletezgettek, hogy tudnak-e valami hasonlót csinálni, mint a ChatGPT, de a legnagyobb játékos az utóbbi években ebben a Meta lett, a Facebook anyacége. A cég még nem tudja, hogyan fog üzleti hasznot húzni, de azt tudja, hogy nem szeretné, ha a három nagy monopóliumból valaki más nyerje meg a versenyt. Ezért egy Llama nevű modellt tett elérhetővé, amely szintén ingyenesen hozzáférhető.

Ez egyfajta válasz volt a nagy monopóliumokra: egy esély arra, hogy a piac demokratizálódjon.

Most a kínaiak rájöttek arra, hogy mindabból a kutatási eredményből, amit az emberiség az utóbbi években a témában felhalmozott, hogyan lehet nagyon olcsón, nagyon könnyen, közel olyan szintű mesterséges intelligenciát előállítani, mint egy évvel ezelőtt a csúcstechnológia volt. És ez nekik kevesebb, mint 6 millió dollárba került, és egy kis csapattal csinálták meg, ráadásul egy kis kutatócsapattal. Innentől ez továbbfejleszthető, újra tréningezhető.

Pár millió dollárnyi energiát elégetve egy szerverteremben, a kommunista propagandát kiszedve, bárki tud csinálni egy saját változatot, mert ott van hozzá minden készen.

És ami még izgalmasabb, hogy amennyiben valaki erre építve egy új dolgot akar fejleszteni, akkor már ingyen elérhető ez a lépcső, és innen már csak a következő lépésre kell költeni. Azaz hirtelen a nyílt forráskódú, a mindenki által hozzáférhető, mindenki által ingyen használható technológia, ha nem is leelőzte, de majdnem utolérte a csúcstechnológiát.

– Ez nagyon szépen hangzik, hogy innentől kezdve bárki a saját képére és hasonlatosságára szabva újabb és újabb AI-okat tud létrehozni. Na, de ezt mégiscsak egy nem éppen baráti hatalom fejlesztette ki. Biztos, hogy nem veszélytelen ránk nézve, hogy ez az AI Kínából jön?

– Szerintem semennyire nem veszélyes. Nyilván a DeepSeek-ként elérhető modellben vannak olyan témák, amik a kínai központi narratívát tartalmazzák, és ha csak egy olcsó konkurenciája lenne a ChatGPT-nek, ha nem adtak volna ki semmit nyílt forráskódra, akkor ez egy olcsóbb, csak éppen egy másik ország aktuális narratíváját közvetítő modell lenne, amiben lehetne egyfajta társadalmi, kulturális, politikai veszély. De igazából mindegyik nagy nyelvi modell tud eszköz lenni arra, hogy valakinek a narratíváját közvetítse.

Úgyhogy a demokratikusabb világ irányába mind üzleti, mind társadalmi oldalról nem az vezet, hogy egy olyan modell nyerjen, aminek az értékeivel jobban egyetértek, hanem az, hogy ebből egy sokszereplős piac jöjjön létre, amiben sokféle modell van, és kialakul a modellek között egy verseny, mert ingyen elérhető most már nagyon sokféle modell.

Ennek adott egy újabb lökést most a DeepSeek is, de ez egyben azt is jelenti, hogy nagyon hamar fog valaki csinálni majd egy ugyanilyen tudású, szintén ingyenes, akár ingyen hozzáférhető, de a kínai helyett például egy európai narratívát közvetítő modellt. És igazából ez benne a jó. A társadalom érdeke nem abban van, hogy az amerikai vagy a kínai narratívát hordozó modell győzzön, hanem hogy nagyon sokféle modell legyen, és legyen köztük verseny.

– Nagyon sok esetben tetten értük azt, hogy a kínaiak elég kreatívan értelmezik a licencjogot. Biztosak vagyunk benne, hogy ez a DeepSeek teljesen originális fejlesztés, és nem részben ipari kémkedés eredménye?

– A mesterséges intelligencia területén az az izgalmas, hogy nagyon felgyorsultak az események, de a technológia nagyja bárki által elérhető tudományos publikációkban zajlik. A szédítő gyorsaságról tavaly nyáron volt egy személyes élményem: kijött egy új kutatási publikáció, ami újfajta algoritmust javasolt arra, hogy hogyan lehetne hatékonyabban képeket generálni. Majd pár nappal később megjelent a forráskód, ami ezt megvalósította, szintén ingyen hozzáférhetően, mert valaki ezt elolvasta és implementálta, ezután megint csak pár nappal később már le lehetett tölteni egy olyan ingyenes, közösség által fejlesztett szoftvert, ami ezt tudta, és pár héttel később pedig a fizetős szoftverekbe is beépült ez az új megoldás. Talán az OpenAI az egyetlen, aki a nevével ellentétben szinte semmit nem publikál, vagy nagyon keveset csak. A 60-as években az Intel, akkori nevén Fairchild Semiconductor marketingvezetője megfigyelte, hogy kétévente duplázódik az ugyanannyi dollárért eladott tranzisztoroknak a száma. Kétévente tudnak mindig duplázni és újra duplázni. Akkor 100 tranzisztor volt nagyjából egy mikrochipben. Gordon Moore volt ez az ember, és róla nevezték el Moore törvényét. Ha ez a jóslata akkor igaz, akkor most, mivel 60 év alatt 30-szor duplázott a technológia, a 100 darab tranzisztorból mára körülbelül 100 milliárdnak kellene lennie.

És így is lett, ha bemegyünk az almás boltba, akkor a 134 milliárd tranzisztorral rendelkező M2 Ultra processzoros Macintosh-t haza tudjuk vinni.

Az AI viszont, ahogy én is kutattam, nem ezen a pályán fejlődik, hanem ennél meredekebb a gyorsulás üteme. Összegyűjtöttem az ezzel kapcsolatos kutatásokat és eredményeket, amiből az rajzolódott ki, hogy a főbb hajtóerejei a mesterséges intelligencia fejlődésének oda mutatnak, hogy jelenleg nagyjából évi 26-szoros az a tempó, ahogy fejlődik.

Azaz évente tudunk olyat, hogy ugyanazt a szintet huszonhatod áron érhetjük el, vagy 26-szor pontosabbat tudunk létrehozni ugyanannyi pénzért. Ez kétéves távon 650-szeres fejlődés, ami eddig soha nem látott tempó az emberiség történelmében.

És ez alapján én azt számolgattam, hogy ha valaki a ChatGPT négyesnek az egy-másfél évvel, majdnem két évvel ezelőtti színvonalát most valaki a kutatási költség huszadáért, huszonötödéért, tehát pontosan olyasmi összegért tudja megvalósítani, mint amennyibe a DeepSeek került, az nagyjából ezen a trendvonalon van rajta. Azaz van-e egy brutális, felfoghatatlan, emberi aggyal beláthatatlan fejlődési tempó, és az, hogy a DeepSeek 6 millió dollárból megcsinálta azt a modellt, ami körülbelül az egy évvel ezelőtti ChatGPT-vel pariban van nagyjából, az pont ennek a brutális fejlődésnek a visszaigazolása.

– De ha innen nézzük, hogy az új kínai AI rajta van ezen a vonalon, akkor valójában nem volt akkora meglepetés, hiszen csak egy korábbi modellel jött ki, ami pontosan ennek megfelelően olcsóbb. Akkor viszont nem értem ezt a nagy tőzsdei pánikot.

– Az ad okot pánikra, az a nagy kérdés merült fel, hogy amit készítenek 5 milliárd dollárból, annak egy éven belül az értéke a huszada lesz. Ez a dilemmája annak a típusú kutatásnak, amit az OpenAI is végez, meg a Google, vagy az Anthropic is.

Ezeket a nagy nyelvi modelleket ennyire drágán fejleszteni fontos és jó cél, csak sosem fog anyagilag megtérülni. Amiért a befektetők ennyi pénzt fektettek ezekbe az alapkutatásokat végző cégekbe, az az a hit volt, hogy a hármójuk közül valamelyik ezt meg fogja nyerni, és monopóliumként ez majd sokszorosan megtérül. De amit a DeepSeek példája mutat, az pontosan az, hogy a tavalyi eredményt újra szinte fillérekért el lehet érni.

Azonban, ha évről évre drasztikusan csökken a belépési küszöb, hogy valaki ugyanezzel foglalkozzon, akkor nem lesz monopólium, és az nem tudja kirabolni az emberiséget, akkor nem tud az OpenAI-ba, vagy a Microsoftba, vagy a Google-be, vagy az Anthropicba fektetett sok milliárd dollár sokszorosan megtérülni. És ez okozta az ijedtséget, hogy ezek a típusú befektetések, amit az alapmodell fejlesztésére fordítanak, valószínűleg sohasem fognak megtérülni. Viszont voltak olyan cégek, amiknek nem esett a részvényárfolyama. Ezek azok voltak, amelyek nem ezzel a típusú alapkutatással foglalkoznak, hanem csak használják a mesterséges intelligenciát.

Egy olyan cég, ami a mesterséges intelligenciát használva szolgáltatást fejleszt egy iparág számára, annak ez a legjobb dolog, ami történhet, hogy hirtelen a költségei, amiből az adott piaci szolgáltatását nyújtani tudja, leesett a huszadára, vagy századára, és le fog majd újra esni, és újra.

És ez azt jelenti, hogy valószínűleg a mesterséges intelligencia körül a nagy megtérülés nem az alapmodellek fejlesztésében lesz, hanem a mesterséges intelligencia modellek ipari, vagy kereskedelmi hasznosításában, azaz a megoldások készítésében.

– Én szőrösszívű kapitalistaként valóban kivonnám a pénzemet az alapkutatásból, viszont ennek az lenne a következménye, hogy lelassul vagy leáll maga a fejlesztés, nem lesznek újabb modellek.

– Igen, és nem. Biztos, hogy emiatt lesz tőkekivonás ezekből a nagyon nagy alapkutató cégekből. A másik oldalról viszont van egy Hugging Face nevű gyűjtőoldal, ahol mesterséges intelligencia modelleket lehet publikálni ingyen. Az a különlegessége ennek az oldalnak, hogy ma már több mint egymillió különböző mesterséges intelligencia modell érhető el ott ingyen, publikusan a közösségbe bedobva, és több mint 3 millió fejlesztő van ebben a közösségben, akik mesterséges intelligencia fejlesztéssel foglalkoznak valamilyen szinten. Tehát nem fog ettől leállni a folyamatos fejlődés, mert már nem néhány szakember, szűk kis csoportokban, elszigetelten viszi előre ezt a tudományágat, hanem nagyon széles fejlesztőbázisa lett, rengeteg ebbe beletanuló szakértővel, akik együtt hozzák az innovációkat és áttöréseket.

Valószínűleg, ha a három nagy játékos visszavesz a fejlesztési tempóból, és kevesebb pénzből gazdálkodva fejleszt újabb és újabb modelleket, akkor is brutális tempóban fog fejlődni ez a terület, de egy sokkal kiegyensúlyozottabb irányban.

Például az Nvidia részvényei azért estek, mert rájöttek a befektetők is, hogy ha nem fog tízmilliárdokat költeni a Google évente AI-hardverek beszerzésére, akkor az a pénz nem fog beáramlani az Nvidiához, így hosszú távon nem tudja azt a profitabilitást, bevételszintet az Nvidia biztosítani. Mert a másik nagy csavar a sztoriban az, hogy a kínaiak azért tudták 6 millió dollárból megoldani a saját fejlesztésüket, mert az amerikaiak blokkolták, hogy a legkorszerűbb chiptechnológiához hozzáférhessenek Kínában, ezért kénytelenek voltak a számukra elérhető, kevésbé fejlett technológiát használva dolgozni.

– Hogy állunk az AI karbonlábnyomával? Bizonyos hírek szerint a legnagyobb környezetterhelést jelenleg ez az iparág okozza.

– Ez nem igaz. A ChatGPT elkér tőlünk 4-5 dollárt 1 millió szótagnyi gondolkodásért. Azért egymillió szótagnyi gondolkodás az sok, tehát azt be lehet látni, hogy annyit olvasni vagy írni, vagy végiggondolni, az nagyon sok gondolkodás, és az pár dollárba kerül. Ez a bizonyos 26-szoros fejlődési tempó, ebben az is benne van, hogy ugyanazt a szintű gépi gondolkodást, amit egy évvel ezelőtt egy dollárnyi energiából tudtunk megcsinálni, azt mostanra kb. a tizedéből. Tehát van egy drasztikus csökkenése az egy egységnyi gondolkodásra eső energiaköltségnek. Az tény, hogy nagyon sok cég rengeteg üzleti alkalmazásban és nagyon sok gondolkodást használ, és ezek nagyon központosítottan, néhány adatközpontban jelentkeznek, és nem mindenkinek otthon a saját számítógépén.

Azaz az energiafelvétel is pontszerűen, központosítottan történik jelenleg. De ez elosztva több százmillió végfelhasználóra, ha mindenki emiatt fél wattal többet fogyasztana a saját háztartásában, mert helyben futtatná ezeket a programokat, észre sem vennénk a teljes energiafelhasználásban ennyi többletet.

Számokra fordítva: az OpenAI néhány százmillió dollárt költ áramra évente, így alig egy ezrelékét használja az Egyesült Államok összes energiafelhasználásának, valószínűleg a teljes AI iparág is kevesebb, mint egy százalékát összesen, miközben a bitcoin globális működése a teljes amerikai fogyasztáshoz képest 2,5-4 százalékot. Az AI rengeteg közvetlen hasznot hajt, többszázmillió embernek segítve naponta, míg a másikkal csak spekulálni lehet. Abba is gondoljunk bele, hogy ha egy emberrel gondolkodtatnánk egymillió szótagnyit, akkor több hétig kellene őt etetni, itatni, energiával ellátni, kiszolgálni az igényeit, feldolgozott élelmiszert az asztalára tenni. Könnyen belátható, hogy csak ez nagyságrendekkel több, mint pár dollár. Ilyen szempontból az egységnyi elvégzett munkára vetített lábnyom messze tört része minden másnak, ráadásul több gondolkodást tud az emberiség végezni, mint korábban. Ráadásul a modellek robbanásszerű fejlődésével, ami akkor is észvesztően gyors marad, ha vissza is vesznek kissé a tempóból, hamarosan eljutunk oda, hogy

minden eszközünkbe, számítógépünkbe, mobiltelefonunkba, hűtőnkbe előbb-utóbb beépül majd az a képesség, hogy helyben tudjon mesterséges intelligenciát futtatni, és így ez az áramfelhasználás sem feltétlenül fog hosszú ideig a nagy adatközpontokban maradni, hanem ennek egyre nagyobb része ki fog kerülni a kliensekhez.

Ilyen körei voltak már a technológiának, amikor hirtelen mindent szerverekre raktunk, aztán meg kiderült, hogy sokkal praktikusabb egyes programokat helyben futtatni, mert már helyben is tudjuk, hiszen olyan okosak a készülékeink. Tehát nem gondolom, hogy ennek a technológiának hosszú távon brutális kell, hogy legyen az energialábnyoma, pontosan a fejlődési tempója teszi lehetővé azt, hogy ez ne így legyen.

Kapcsolódó

Donald Trump: A DeepSeek komoly figyelmeztetés az amerikai techcégeknek

A kínai cég mesterséges intelligenciája olcsóbban ért el kiemelkedő eredményeket, mint az amerikai versenytársai. Az Nvidia rekordveszteséget szenvedett, a techcégek részvényei zuhantak.

KÖVESS MINKET:

Ajánljuk

KULT

Hermányi Mariann a Hunyadi meztelen jeleneteiről: „Elárulom minden nézőnek, hogy ha benéznek a ruhájuk alá, kábé ugyanezt fogják találni”

A színésznő azt is hozzátette, hogy „nekem az a véleményem, hogy maga az arc, ahogy maga az egész test is, egy eszköz.”

KÉK HÍREK

Mi történt? Eltűnhetett egy dél-koreai család egy arizonai autópályás tömegbalesetben

A család három tagja tűnt el a 10 nappal ezelőtti tömegbaleset után. Az arizonai hatóságok szerint a jeges, havas úton 22 jármű, köztük 13 személyautó ütközött össze.

JÖVŐ

DeepSeek: elillant a nagy amerikai tech-cégek fölénye, de a semmiből felbukkant kínai cég körül is egyre több a kérdőjel

A DeepSeek megjelenése felforgatta a mesterséges intelligencia világát, ugyanakkor egyre többen sejtik mögötte a kínai államot, és az amerikaiak kétségbe vonják azt az állítását, mennyiből és hogyan jutott el idáig.

Szerző: Gábor János, Fotó: szmo.hu - szmo.hu
2025. február 02.

Úgy fest, a DeepSeek felrobbantotta az ipar eddig biztosnak hitt narratíváját az AI végtelen energia- és erőforrásigényéről, és akár véget is vethet az „AI-hasznosítással” operáló cégek varázsának a Wall Streeten. A befektetések dollármilliárdjait vonzó nagy nevekkel szemben (mint amilyen az OpenAI mellett az Nvidia, az Alphabet, a Microsoft stb.) most megjelent egy új kínai szereplő, és rámutat: egyáltalán nem biztos, hogy az USA meg tudja tartani vezető szerepét a technológia fejlesztésében.

A DeepSeek nagyméretű nyelvi modellje lényegében egy olcsóbb, hatékonyabb ChatGPT, amely a kínaiak állítása szerint az OpenAI költségvetésének töredékéből és sokkal kevesebb (ráadásul elavultabb, exportkorlátozások előtti) Nvidia chippel készült, mint bármelyik vezető chatbot.

„Ez hatalmas földrengés az AI szektorban. Mindenki csak néz, és azt mondja: 'nem gondoltuk volna, hogy ez lehetséges’. Most, hogy mégis az, át kell gondolnunk mindent, amit eddig terveztünk” – vallotta be a CNN-nek Gil Luria, a D.A. Davidson befektetési csoport technológiai kutatási vezetője.

Ugyancsak kellemetlen pillanat ez a Trump-adminisztráció számára, hiszen az új elnök gyakorlatilag napokkal a DeepSeek megjelenése előtt jelentett be félbillió dolláros magánszektorból származó amerikai befektetést olyan adatközpontok építésére, amelyekkel az Egyesült Államok megőrizhetné vezető szerepét az AI fejlesztésében. Talán még az USA kormányzatánál is rosszabbul érintheti a kínai nyelvi modell megjelenése az AI-chip szállító Nvidiát, hiszen történelmi veszteséget szenvedett el, miután a részvényeinek értéke a DeepSeek hatására egy nap alatt 17 százalékot, körülbelül 600 milliárd dollárt zuhant.

Forrás: Nvidia

Az Nvidia eddig az AI-forradalom legnagyobb nyertese volt: háromtrillió dolláros vállalattá vált, de ha a kínaiak valóban képesek voltak ChatGPT-szintű modellt alkotni tizedannyi (vagy kevesebb), korábbi generációs processzorral, akkor lehet, hogy az ügyfelei nem fognak a jövőben annyi chipet vásárolni, amennyit a cég remélt. Bár teljesen kizárt, hogy az Nvidia emiatt feltenné a kezét (nincs is rá oka, hiszen a nyelvi modelleken túl önvezető, robotikai és más AI technológiák egész sorához szállít hardvereket), azért elismerte: a DeepSeek modellje „kiváló AI-fejlesztés”, amely „jól illusztrálja, hogy hogyan lehet új modelleket létrehozni”.

A DeepSeek megjelenése tehát arra kényszerítette a befektetőket, hogy átgondolják az AI-ipar jelenlegi és jövőben várható helyzetét.

Az eddigi narratíva szerint az AI fejlesztéséhez folyamatosan növelni kell a számítási kapacitást, de a kínai AI megjelenése „egyértelművé teszi, hogy az adatközpontok nagy mértékű skálázása aligha lesz gazdaságilag kifizetődő” – mondta Luria.

Ugyanakkor a Szeretlek Magyarországnak nyilatkozó Balogh Petya szerint a DeepSeek létezése jó hír, mert demokratikusabb irányba viszi az AI-fejlesztést. Az AI fejlődéséről és várható üzleti hatásairól cégvezetői oktatást is szervező üzletember szerint a kínai nyelvi modellnek köszönhetően nem fog monopol helyzetbe kerülni maroknyi amerikai cég – ahogy az történt az online keresés (Google) vagy éppen a közösségi média esetében (Facebook).

Ha az USA nagytőkés technológiai vállalkozásainak nem is, az AI demokratizálódásának valóban jót tesz, hogy piacra lépett egy sokkal olcsóbban előállított, forráskódját ingyen megosztó alkalmazás. Azt azonban az amerikaiak vitatják, hogy a Deepseek tényleg csak egy kicsi kínai startup lenne, amely mindössze 5,6 millió dollárból létrehozta azt, amit nekik csak sok milliárd dollárból sikerült.

Több amerikai cég is bedobta: adatot lophatott a DeepSeek

A Microsoft és az OpenAI vizsgálatot indított annak kiderítésére, hogy egy, a kínai DeepSeek startuphoz köthető csoport jogosulatlanul szerzett-e adatokat az OpenAI technológiájából – értesült a Bloomberg. A Microsoft biztonsági szakértői azt állítják, már tavaly ősszel észlelték, hogy valakik nagy mennyiségű adathoz juthattak az OpenAI alkalmazásprogramozási felületén keresztül, ami az OpenAI szolgáltatásainak fő hozzáférési pontja a szoftverfejlesztők és ügyfelek számára.

A Microsoft – amely az OpenAI legnagyobb befektetője – állítólag azonnal jelezte a gyanús tevékenységet a cégnek, és az eset már akkor komoly aggodalmat keltett az amerikai technológiai szektorban.

David Sacks, a Fehér Ház mesterséges intelligenciáért és kriptovalutákért felelős szakértője a Fox Newsnak adott interjúban azt mondta, valóban „lehetséges”, hogy a DeepSeek amerikai szellemi tulajdont lopott. „Jelentős bizonyítékok utalnak arra, hogy a DeepSeek lényegében kinyerte az OpenAI modelljeiből a tudást” - fogalmazott.

A mesterséges intelligencia iparban elterjedt gyakorlat az ún. „desztillálás”, ami lehetővé teszi egy meglévő modellből származtatott, hatékonyabb rendszer kialakítását. Ez általában teljesen legális folyamat – egészen addig, amíg nem egy cég zárt, védett technológia adatait használják fel, mert az már komoly jogi problémákat vethet fel. A OpenAI felhasználási feltételei világosan kimondják, hogy az általuk generált adatokat tilos felhasználni versenytárs technológia létrehozására. Persze, hogy a Deepseek esetében mindez ténylegesen megtörtént-e, arra egyelőre nincs egyértelmű bizonyíték.

„Tudjuk, hogy a Kínai Népköztársaságban aktívan dolgoznak azon, hogy lemásolják a fejlett amerikai AI-modelleket” – nyilatkozta Liz Bourgeois, az OpenAI szóvivője a The New York Timesnak. „Jelenleg vizsgáljuk, hogy a DeepSeek jogosulatlanul használta-e fel a modelljeinket, és ha több információval rendelkezünk, megosztjuk azt.”

Nem is egy kicsi cég?

A Deepseek megjelenése azért robbant ekkorát, mert ha igaz, amit állítanak, akkor az eddig gondoltnál nagyságrendekkel kevesebből is elő lehet állítani mesterséges intelligenciát, nincs szükség óriási mennyiségű fejlett chipre, különleges videókártyákra, hatalmas adatközpontokra. Azt állítják, erre egy kicsi startup is képes lehet.

A 2019-ben alapított Deepseek mögött egy Liang Wenfeng nevű üzletember és a High-Flyer Quant nevű hedge fund áll. Liang Wenfeng szerint a DeepSeek működése radikálisan eltér a nagyobb tech-cégekétől: míg például az Alibaba több százezer alkalmazottat foglalkoztat, ők egy kutatóintézetre hasonlítanak, amelyet főként frissen végzett egyetemisták és doktorandusz hallgatók alkotnak. Liang szerint a hagyományos tech-mamutok „nem biztos, hogy alkalmasak a jövő AI-iparának formálására” a magas költségek és merev szervezeti struktúrák miatt.

Ugyanakkor a Forbes arról ír, hogy egyáltalán nem biztos, hogy a DeepSeek tényleg annyira kicsi, amekkorának láttatni próbálja magát. Egyes források szerint

egy hatalmas hardverfarmot építettek, amiben legalább 10 ezer, de akár 50 ezer Nvidia Tensor A-100 grafikus kártya is dolgozhat. Ez pedig több százmillió dollárba kerül.

Az is furcsa, hogy a cégnek nincsenek kereskedelmi tervei, látszólag nem érdeklik őket a bevételek. Az amerikaiak szerint mindez arra utal, hogy a vállalkozás mögött valójában a kínai állam állhat, amely így próbál globális pozíciókat elfoglalni a mesterséges intelligencia-elsőségért folyó versenyben.

Lopás nélkül nincs is AI?

Persze az is lehet, hogy mindez csak egy kommunikációs ellencsapás az amerikai techcégek részéről, ráadásul az ő esetükben sem egyértelmű, hogy jogilag tiszta megoldásokkal képezték ki saját modelljeiket.

Az OpenAI például több tucatnyi perrel néz szembe, amelyekben azzal vádolják, hogy szabálytalanul használt fel jogvédett internetes tartalmakat a modelljei kiképzéséhez.

A The New York Times is pert indított az OpenAI és partnere, a Microsoft ellen, mivel állításuk szerint cikkeik millióit használták fel a chatbot képzésére, ami a hírforrások konkurenciájává válhat.

Egy nemrég készült jelentés ráadásul arra is rámutatott, hogy az OpenAI YouTube-videók hanganyagaiból szintén leiratot készített, hogy aztán az AI-modelljei továbbfejlesztésére használja fel. Belső levelezések szerint a vezetők tudták, hogy ez szembe mehet a YouTube irányelveivel, ennek ellenére, egy belső csapat – amelynek tagja volt Greg Brockman, az OpenAI elnöke is – több mint egymillió órányi YouTube-videót dolgozhatott fel, hogy aztán a szöveges adatokat a GPT-4 modellbe töltse és ezzel alaposan felhúzza annak tudásbázisát.

Az OpenAI vezérei: Greg Brockman (balra) és Sam Altman. Fotók: Wikipedia

A OpenAI vezérigazgatója, Sam Altman korábban elismerte, hogy a fejlett mesterséges intelligencia modellek betanításához szerzői jogvédelem alatt álló anyagokra van szükség, és kijelentette, hogy enélkül lehetetlen lenne ilyen rendszereket fejleszteni. A kijelentés azonnal felháborodást váltott ki a közösségi médiában, és most vissza is hullik a vállalat fejére:

miközben ők azt kommunikálják, hogy a DeepSeek akár el is lophatta az adataikat, egyre többen vádolják őket képmutatással.

Egy Bluesky-felhasználó így fogalmazott: „nevetséges, hogy az OpenAI, amely minden kérdés nélkül falta fel az adatainkat, most ujjal mutogat a DeepSeekre, amiért pontosan ugyanezt csinálja”. Ed Zitron AI-kritikus pedig így kommentálta az ügyet: „elnézést, de nem bírom abbahagyni a röhögést. Az OpenAI, a vállalat, amely gyakorlatilag az egész internet ellopására épült, most azért panaszkodik, mert a DeepSeek esetleg a ChatGPT válaszaiból tanult.”

Újabb AI-modellek jönnek, a cél az AGI

Miközben mindenki a DeepSeek sikerére és az amerikai AI-cégek befeszülésére figyelt, az Alibaba is bejelentett egy új mesterséges intelligencia modellt, a Qwen 2.5-Max-ot. A kínai tech-óriás szerint az új modell „szinte minden területen felülmúlja a GPT-4o-t, a DeepSeek-V3-at és a Llama-3.1-405B-t [a Meta AI-modelljét]” – idézi az Alibaba Cloud hivatalos WeChat-oldalát a Reuters.

A bejelentés időzítése azt mutatja, hogy az Alibaba komoly nyomást érez a hazai versenytársak részéről, és valószínűleg így volt ezzel a TikTok anyavállalata, a ByteDance is, amikor két nappal a DeepSeek-R1 január 20-i megjelenése után közölte: frissítette saját AI-modelljét, amely szerintük szintén felülmúlja az OpenAI által kifejlesztett terméket. Ezt az állítást igazolták is egy AIME benchmark teszttel, ami azt méri, hogy egy mesterséges intelligencia modell mennyire érti az összetett utasításokat és hogyan reagál rájuk.

Mindez arra utal, hogy bármi is az igazság a DeepSeekről, Amerika komoly versenytársakkal nézhet szembe.

KÖVESS MINKET:

Ajánljuk