Od softvera do silicija: zašto se mijenja fokus europske AI scene
U europskoj raspravi o umjetnoj inteligenciji godinama su dominirali softver, podaci i regulativa. Modeli, datasetovi, etika, GDPR i sada EU AI Act bili su u središtu pažnje. No u pozadini se događa tiha, ali ključna promjena: fokus se seli na hardver.
Europski i britanski startupi za AI čipove u posljednje vrijeme prikupljaju stotine milijuna eura. Inicijative poput EuroHPC Joint Undertaking (EuroHPC JU) i planiranih AI „gigatvornica“ grade novu infrastrukturu za izvođenje velikih jezičnih modela i generativne AI na europskom tlu. Istovremeno, politički cilj tehnološkog suvereniteta postaje sve jasniji: Europa želi smanjiti ovisnost o američkim i azijskim dobavljačima čipova i oblaka.
Hardver više nije samo tehnički detalj, nego strateški resurs. Tko kontrolira računalnu podlogu, ima utjecaj na cijenu, dostupnost i pravila korištenja generativne umjetne inteligencije.
Fractile i Axelera AI: nova generacija europskih AI čipova
Fractile: ubrzano izvođenje velikih modela
Jedan od najvidljivijih primjera novog trenda je britanski startup Fractile, koji je nedavno prikupio oko 220 milijuna dolara za razvoj specijaliziranih čipova za izvođenje (inference) velikih modela. Za razliku od klasičnog pristupa, koji se snažno oslanja na GPU‑ove i vanjsku DRAM memoriju, Fractile spaja računanje i memoriju na istom čipu koristeći SRAM.
Ta arhitektura ima nekoliko ciljeva:
- smanjiti ovisnost o skupo plaćenoj i teško dostupnoj DRAM memoriji
- ubrzati prijenos podataka između procesorskih jezgri i memorije
- povećati propusnost pri izvođenju velikih jezičnih modela (LLM‑ova)
- smanjiti ukupnu potrošnju energije po upitu
U praksi to znači da modeli s desecima ili stotinama milijardi parametara mogu raditi uz manja kašnjenja i niži trošak po tokenu. Za pružatelje usluga generativne AI to je izravno pitanje profitabilnosti i skalabilnosti.
Axelera AI: energetski učinkoviti čipovi za edge
Na kontinentalnoj strani Europe, nizozemsko‑talijanski Axelera AI razvija čipove fokusirane na edge AI. Njihovi procesori ciljaju uređaje koji rade blizu izvora podataka: industrijske kamere, robote, maloprodajne sustave, pametne senzorske mreže.
Ključne značajke tog pristupa su:
- visoka energetska učinkovitost za rad u ograničenim uvjetima (npr. bez aktivnog hlađenja)
- obrada podataka lokalno, bez slanja u oblak
- smanjena latencija, što je ključno za industrijsku automatizaciju i sigurnosne sustave
- bolja kontrola nad privatnošću i sigurnošću podataka
Axelera AI snažno koristi europske fondove i programe, uključujući suradnje s EuroHPC ekosustavom. Time se stvara most između istraživačkih superračunala i komercijalnih edge uređaja na terenu.
Ograničenja GPU oblaka: zašto su potrebni specijalizirani inference čipovi
Većina današnjih generativnih AI sustava – od chatbota i generatora slika do alata za video i kod – oslanja se na velike GPU klastere u podatkovnim centrima globalnih hiperskalera. Za europske korisnike to donosi nekoliko izazova.
Trošak i dostupnost računske snage
GPU‑ovi koji mogu učinkovito izvoditi LLM‑ove su skupi, a potražnja je globalno veća od ponude. To dovodi do:
- visokog troška po upitu, osobito za servise s velikim prometom
- rizika nestašice kapaciteta u trenucima vršnog opterećenja
- ovisnosti o ograničenom broju dobavljača hardvera i oblaka
Specijalizirani inference čipovi, dizajnirani isključivo za izvođenje već istreniranih modela, ciljaju optimizirati upravo taj dio lanca. Treniranje modela i dalje može ostati na GPU‑ovima ili specijaliziranim akceleratorima, ali izvođenje u produkciji seli se na jeftiniji i energetski učinkovitiji sloj.
Privatnost, suverenitet podataka i regulativa
Za mnoge europske organizacije, posebno u zdravstvu, financijama i javnom sektoru, lokacija i pravni okvir obrade podataka presudni su. Slanje osjetljivih podataka u oblak izvan EU otežava usklađenost s GDPR‑om i nadolazećim zahtjevima EU AI Acta.
Hardver i infrastruktura smješteni unutar EU, pod europskom jurisdikcijom, olakšavaju:
- kontrolu nad time gdje se podaci pohranjuju i obrađuju
- primjenu lokalnih sigurnosnih standarda i certifikata
- uvođenje nadzora i revizije AI sustava prema EU AI Actu
Specijalizirani čipovi za inference, raspoređeni u europskim podatkovnim centrima ili na edge uređajima, omogućuju da generativni modeli rade bliže korisniku – i fizički i pravno.
EuroHPC, AI „gigatvornice“ i zajednička europska infrastruktura
Što donosi prošireni mandat EuroHPC‑a
EuroHPC JU je nastao kao inicijativa za izgradnju europskih superračunala. No njegov mandat je proširen: sada uključuje i razvoj infrastrukture za umjetnu inteligenciju.
Planirane AI „gigatvornice“ zapravo su veliki klasteri namijenjeni razvoju i izvođenju generativnih modela. U okviru tih centara predviđeno je:
- kupnja i integracija različitih tipova akceleratora, uključujući nove europske AI čipove
- platforme za treniranje i inference LLM‑ova i drugih generativnih modela
- usluge za startupove, mala i srednja poduzeća, istraživače i javne institucije
- ugrađeni mehanizmi usklađenosti s EU AI Actom, poput logiranja, nadzora i upravljanja rizikom
Cilj je stvoriti neku vrstu zajedničke infrastrukture, analogne energetskim ili prometnim mrežama, ali za računalnu snagu potrebnu za AI.
„AI kontinent“ kao politička ambicija
Uz tehničke projekte, EU gradi i politički narativ „AI kontinenta“. Novi akcijski planovi naglašavaju da Europa ne smije ostati samo regulator, već i proizvođač ključnih tehnologija.
U praksi to znači:
- potporu domaćim proizvođačima čipova i sustava
- poticaje za razvoj otvorenih i europskih LLM‑ova
- ulaganja u podatkovne centre s visokim energetskim standardima
- povezivanje istraživačkih institucija i industrije oko zajedničkih AI platformi
AI „gigatvornice“ i novi AI čipovi dio su iste slagalice: stvaranje ekosustava u kojem europske tvrtke mogu razvijati i koristiti generativnu AI bez potpunog oslanjanja na inozemnu infrastrukturu.
Što ovo znači za poduzeća koja već koriste generativnu AI
Za većinu tvrtki ovo nije akademska rasprava o arhitekturi čipova. Radi se o vrlo praktičnim pitanjima: koliko će koštati AI usluga, koliko će biti brza, gdje će se izvoditi i kako će zadovoljiti regulativu.
Strategijski izbor: „običan“ oblak ili specijalizirani AI hardver
U idućih nekoliko godina poduzeća će se sve češće suočavati s izborom između klasičnih cloud usluga i specijalizirane AI infrastrukture u Europi. Pri tome će ključni kriteriji biti:
- cijena po upitu – osobito kod velikog volumena generiranja teksta, slike ili koda
- latencija i pouzdanost – važni za interaktivne aplikacije i ugrađene sustave
- usklađenost s EU AI Actom – posebno za „visokorizične“ AI primjene
- lokacija podataka – presudna u reguliranim sektorima
Specijalizirani inference čipovi u europskim podatkovnim centrima, kao i edge uređaji s ugrađenim LLM‑ovima, mogli bi postati konkurentna alternativa globalnim GPU oblakima, osobito kada se uračunaju troškovi usklađenosti i sigurnosti.
Modeli usluga: od zakupa kapaciteta do gotovih edge rješenja
Za poslovne korisnike već se naziru različiti modeli korištenja nove europske AI infrastrukture:
- zakup inference kapaciteta u superračunalnim ili AI centrima, uz mogućnost izvođenja vlastitih ili licenciranih modela
- specijalizirane AI instance u oblaku, temeljene na europskim čipovima, optimizirane za određene tipove zadataka (npr. multimodalni modeli, pretraživanje, preporuke)
- edge uređaji s ugrađenim LLM‑ovima, koji omogućuju lokalno generiranje teksta, analizu slike ili govora bez stalne veze s oblakom
- hibridni scenariji u kojima se treniranje odvija u velikim centrima, a inference dijelom u oblaku, dijelom na rubu mreže
Za tvrtke koje već eksperimentiraju s generativnom AI ovo je trenutak za planiranje arhitekture sljedeće generacije: gdje će se modeli trenirati, gdje će se izvoditi, kako će se skalirati i kojim hardverskim slojem će se osigurati otpornost na promjene cijena i dostupnosti GPU‑ova.
Kako se pripremiti: pitanja koja treba postaviti već danas
Europski AI čipovi i infrastruktura još su u nastajanju, ali odluke koje se danas donose o arhitekturi sustava vrijedit će godinama. Nekoliko praktičnih pitanja može pomoći u orijentaciji:
- Koji dio našeg AI opterećenja je treniranje, a koji inference u produkciji?
- Koliko nas košta jedan upit prema modelu danas i kako će taj trošak rasti sa skalom?
- U kojim slučajevima trebamo strogu kontrolu nad lokacijom i obradom podataka?
- Možemo li dio funkcionalnosti premjestiti na edge uređaje s lokalnim modelima?
- Koje europske pružatelje AI hardvera i infrastrukture vrijedi pratiti ili testirati u pilot‑projektima?
Odgovori na ta pitanja pomoći će definirati strategiju koja nije vezana isključivo uz jedan tip hardvera ili jednog dobavljača oblaka.
Zaključak: hardver kao nova poluga europske AI strategije
Generativna umjetna inteligencija dugo se promatrala kroz prizmu modela, parametara i datasetova. No bez prikladne hardverske podloge, ti modeli ostaju skupi, spori ili teško primjenjivi u osjetljivim okruženjima.
Novi val europskih AI čip startupa, zajedno s inicijativama poput EuroHPC‑a i AI „gigatvornica“, pokazuje da se karta mijenja. Europa pokušava spojiti regulativnu snagu s vlastitom infrastrukturom i silicijem. Za poduzeća to otvara prostor za brže, jeftinije i usklađenije generativne AI usluge – pod uvjetom da na vrijeme počnu razmišljati o hardveru kao o strateškom, a ne samo tehničkom pitanju.



