Europski AI čipovi i infrastruktura: nova podloga za generativnu umjetnu inteligenciju

Od softvera do silicija: zašto se mijenja fokus europske AI scene

U europskoj raspravi o umjetnoj inteligenciji godinama su dominirali softver, podaci i regulativa. Modeli, datasetovi, etika, GDPR i sada EU AI Act bili su u središtu pažnje. No u pozadini se događa tiha, ali ključna promjena: fokus se seli na hardver.

Europski i britanski startupi za AI čipove u posljednje vrijeme prikupljaju stotine milijuna eura. Inicijative poput EuroHPC Joint Undertaking (EuroHPC JU) i planiranih AI „gigatvornica“ grade novu infrastrukturu za izvođenje velikih jezičnih modela i generativne AI na europskom tlu. Istovremeno, politički cilj tehnološkog suvereniteta postaje sve jasniji: Europa želi smanjiti ovisnost o američkim i azijskim dobavljačima čipova i oblaka.

Hardver više nije samo tehnički detalj, nego strateški resurs. Tko kontrolira računalnu podlogu, ima utjecaj na cijenu, dostupnost i pravila korištenja generativne umjetne inteligencije.

Fractile i Axelera AI: nova generacija europskih AI čipova

Fractile: ubrzano izvođenje velikih modela

Jedan od najvidljivijih primjera novog trenda je britanski startup Fractile, koji je nedavno prikupio oko 220 milijuna dolara za razvoj specijaliziranih čipova za izvođenje (inference) velikih modela. Za razliku od klasičnog pristupa, koji se snažno oslanja na GPU‑ove i vanjsku DRAM memoriju, Fractile spaja računanje i memoriju na istom čipu koristeći SRAM.

Ta arhitektura ima nekoliko ciljeva:

smanjiti ovisnost o skupo plaćenoj i teško dostupnoj DRAM memoriji
ubrzati prijenos podataka između procesorskih jezgri i memorije
povećati propusnost pri izvođenju velikih jezičnih modela (LLM‑ova)
smanjiti ukupnu potrošnju energije po upitu

U praksi to znači da modeli s desecima ili stotinama milijardi parametara mogu raditi uz manja kašnjenja i niži trošak po tokenu. Za pružatelje usluga generativne AI to je izravno pitanje profitabilnosti i skalabilnosti.

Axelera AI: energetski učinkoviti čipovi za edge

Na kontinentalnoj strani Europe, nizozemsko‑talijanski Axelera AI razvija čipove fokusirane na edge AI. Njihovi procesori ciljaju uređaje koji rade blizu izvora podataka: industrijske kamere, robote, maloprodajne sustave, pametne senzorske mreže.

Ključne značajke tog pristupa su:

visoka energetska učinkovitost za rad u ograničenim uvjetima (npr. bez aktivnog hlađenja)
obrada podataka lokalno, bez slanja u oblak
smanjena latencija, što je ključno za industrijsku automatizaciju i sigurnosne sustave
bolja kontrola nad privatnošću i sigurnošću podataka

Axelera AI snažno koristi europske fondove i programe, uključujući suradnje s EuroHPC ekosustavom. Time se stvara most između istraživačkih superračunala i komercijalnih edge uređaja na terenu.

Ograničenja GPU oblaka: zašto su potrebni specijalizirani inference čipovi

Većina današnjih generativnih AI sustava – od chatbota i generatora slika do alata za video i kod – oslanja se na velike GPU klastere u podatkovnim centrima globalnih hiperskalera. Za europske korisnike to donosi nekoliko izazova.

Trošak i dostupnost računske snage

GPU‑ovi koji mogu učinkovito izvoditi LLM‑ove su skupi, a potražnja je globalno veća od ponude. To dovodi do:

visokog troška po upitu, osobito za servise s velikim prometom
rizika nestašice kapaciteta u trenucima vršnog opterećenja
ovisnosti o ograničenom broju dobavljača hardvera i oblaka

Specijalizirani inference čipovi, dizajnirani isključivo za izvođenje već istreniranih modela, ciljaju optimizirati upravo taj dio lanca. Treniranje modela i dalje može ostati na GPU‑ovima ili specijaliziranim akceleratorima, ali izvođenje u produkciji seli se na jeftiniji i energetski učinkovitiji sloj.

Privatnost, suverenitet podataka i regulativa

Za mnoge europske organizacije, posebno u zdravstvu, financijama i javnom sektoru, lokacija i pravni okvir obrade podataka presudni su. Slanje osjetljivih podataka u oblak izvan EU otežava usklađenost s GDPR‑om i nadolazećim zahtjevima EU AI Acta.

Hardver i infrastruktura smješteni unutar EU, pod europskom jurisdikcijom, olakšavaju:

kontrolu nad time gdje se podaci pohranjuju i obrađuju
primjenu lokalnih sigurnosnih standarda i certifikata
uvođenje nadzora i revizije AI sustava prema EU AI Actu

Specijalizirani čipovi za inference, raspoređeni u europskim podatkovnim centrima ili na edge uređajima, omogućuju da generativni modeli rade bliže korisniku – i fizički i pravno.

EuroHPC, AI „gigatvornice“ i zajednička europska infrastruktura

Što donosi prošireni mandat EuroHPC‑a

EuroHPC JU je nastao kao inicijativa za izgradnju europskih superračunala. No njegov mandat je proširen: sada uključuje i razvoj infrastrukture za umjetnu inteligenciju.

Planirane AI „gigatvornice“ zapravo su veliki klasteri namijenjeni razvoju i izvođenju generativnih modela. U okviru tih centara predviđeno je:

kupnja i integracija različitih tipova akceleratora, uključujući nove europske AI čipove
platforme za treniranje i inference LLM‑ova i drugih generativnih modela
usluge za startupove, mala i srednja poduzeća, istraživače i javne institucije
ugrađeni mehanizmi usklađenosti s EU AI Actom, poput logiranja, nadzora i upravljanja rizikom

Cilj je stvoriti neku vrstu zajedničke infrastrukture, analogne energetskim ili prometnim mrežama, ali za računalnu snagu potrebnu za AI.

„AI kontinent“ kao politička ambicija

Uz tehničke projekte, EU gradi i politički narativ „AI kontinenta“. Novi akcijski planovi naglašavaju da Europa ne smije ostati samo regulator, već i proizvođač ključnih tehnologija.

U praksi to znači:

potporu domaćim proizvođačima čipova i sustava
poticaje za razvoj otvorenih i europskih LLM‑ova
ulaganja u podatkovne centre s visokim energetskim standardima
povezivanje istraživačkih institucija i industrije oko zajedničkih AI platformi

AI „gigatvornice“ i novi AI čipovi dio su iste slagalice: stvaranje ekosustava u kojem europske tvrtke mogu razvijati i koristiti generativnu AI bez potpunog oslanjanja na inozemnu infrastrukturu.

Što ovo znači za poduzeća koja već koriste generativnu AI

Za većinu tvrtki ovo nije akademska rasprava o arhitekturi čipova. Radi se o vrlo praktičnim pitanjima: koliko će koštati AI usluga, koliko će biti brza, gdje će se izvoditi i kako će zadovoljiti regulativu.

Strategijski izbor: „običan“ oblak ili specijalizirani AI hardver

U idućih nekoliko godina poduzeća će se sve češće suočavati s izborom između klasičnih cloud usluga i specijalizirane AI infrastrukture u Europi. Pri tome će ključni kriteriji biti:

cijena po upitu – osobito kod velikog volumena generiranja teksta, slike ili koda
latencija i pouzdanost – važni za interaktivne aplikacije i ugrađene sustave
usklađenost s EU AI Actom – posebno za „visokorizične“ AI primjene
lokacija podataka – presudna u reguliranim sektorima

Specijalizirani inference čipovi u europskim podatkovnim centrima, kao i edge uređaji s ugrađenim LLM‑ovima, mogli bi postati konkurentna alternativa globalnim GPU oblakima, osobito kada se uračunaju troškovi usklađenosti i sigurnosti.

Modeli usluga: od zakupa kapaciteta do gotovih edge rješenja

Za poslovne korisnike već se naziru različiti modeli korištenja nove europske AI infrastrukture:

zakup inference kapaciteta u superračunalnim ili AI centrima, uz mogućnost izvođenja vlastitih ili licenciranih modela
specijalizirane AI instance u oblaku, temeljene na europskim čipovima, optimizirane za određene tipove zadataka (npr. multimodalni modeli, pretraživanje, preporuke)
edge uređaji s ugrađenim LLM‑ovima, koji omogućuju lokalno generiranje teksta, analizu slike ili govora bez stalne veze s oblakom
hibridni scenariji u kojima se treniranje odvija u velikim centrima, a inference dijelom u oblaku, dijelom na rubu mreže

Za tvrtke koje već eksperimentiraju s generativnom AI ovo je trenutak za planiranje arhitekture sljedeće generacije: gdje će se modeli trenirati, gdje će se izvoditi, kako će se skalirati i kojim hardverskim slojem će se osigurati otpornost na promjene cijena i dostupnosti GPU‑ova.

Kako se pripremiti: pitanja koja treba postaviti već danas

Europski AI čipovi i infrastruktura još su u nastajanju, ali odluke koje se danas donose o arhitekturi sustava vrijedit će godinama. Nekoliko praktičnih pitanja može pomoći u orijentaciji:

Koji dio našeg AI opterećenja je treniranje, a koji inference u produkciji?
Koliko nas košta jedan upit prema modelu danas i kako će taj trošak rasti sa skalom?
U kojim slučajevima trebamo strogu kontrolu nad lokacijom i obradom podataka?
Možemo li dio funkcionalnosti premjestiti na edge uređaje s lokalnim modelima?
Koje europske pružatelje AI hardvera i infrastrukture vrijedi pratiti ili testirati u pilot‑projektima?

Odgovori na ta pitanja pomoći će definirati strategiju koja nije vezana isključivo uz jedan tip hardvera ili jednog dobavljača oblaka.

Zaključak: hardver kao nova poluga europske AI strategije

Generativna umjetna inteligencija dugo se promatrala kroz prizmu modela, parametara i datasetova. No bez prikladne hardverske podloge, ti modeli ostaju skupi, spori ili teško primjenjivi u osjetljivim okruženjima.

Novi val europskih AI čip startupa, zajedno s inicijativama poput EuroHPC‑a i AI „gigatvornica“, pokazuje da se karta mijenja. Europa pokušava spojiti regulativnu snagu s vlastitom infrastrukturom i silicijem. Za poduzeća to otvara prostor za brže, jeftinije i usklađenije generativne AI usluge – pod uvjetom da na vrijeme počnu razmišljati o hardveru kao o strateškom, a ne samo tehničkom pitanju.

Europski AI čipovi izlaze iz sjene: nova hardverska podloga generativne umjetne inteligencije

Od softvera do silicija: zašto se mijenja fokus europske AI scene

Fractile i Axelera AI: nova generacija europskih AI čipova

Fractile: ubrzano izvođenje velikih modela

Axelera AI: energetski učinkoviti čipovi za edge