Nova generacija javnih LLM-ova: europski put prema suverenoj AI

Zašto Europa ulaže u javne i otvorene LLM-ove

U posljednjih godinu dana Europa je dobila novu generaciju javnih, otvorenih velikih jezičnih modela (LLM-ova). Za razliku od zatvorenih komercijalnih modela, ovi sustavi su zamišljeni kao zajedničko dobro – infrastruktura koju mogu koristiti istraživači, startupi, javna uprava i industrija, uz jasna pravila i transparentnost.

Ključni motiv je digitalni suverenitet. Europske institucije i države članice žele imati kontrolu nad temeljnim AI tehnologijama, a ne ovisiti isključivo o rješenjima iz SAD-a ili Kine. To znači vlastite modele, vlastite podatkovne skupove, vlastitu računalnu infrastrukturu i pravila koja od početka uvažavaju europske standarde privatnosti, autorskih prava i sigurnosti.

Otvoreni LLM-ovi s javno dostupnim težinama, dokumentiranom arhitekturom i definiranim licencama postaju ključni element tog pristupa. Oni omogućuju provjeru, prilagodbu i nadogradnju – što je posebno važno u kontekstu EU Akta o umjetnoj inteligenciji (EU AI Act), koji uvodi stroge obveze za pružatelje generativnih modela opće namjene.

Apertus i europski javni LLM-ovi

Apertus: švicarski javni LLM kao referentni projekt

Jedan od najistaknutijih primjera je Apertus, švicarski javni LLM razvijen u sklopu nacionalne AI inicijative. Projekt je zamišljen kao referentna implementacija „javnog modela“ u europskom kontekstu.

Apertus je treniran na velikom broju jezika, uključujući manje i često zanemarene jezike i dijalekte. Time se pokušava izbjeći situacija u kojoj su europski jezici – osim engleskog – tek sporedno podržani. Višejezičnost nije samo pitanje dostupnosti, već i ravnopravnog sudjelovanja u digitalnoj ekonomiji.

Model je objavljen pod permisivnom open-source licencom. To znači da ga je moguće preuzeti, pokretati na vlastitoj infrastrukturi, fino podešavati (fine-tuning) na specifične podatkovne skupove i integrirati u komercijalne proizvode, uz poštivanje uvjeta licence.

Pravna usklađenost i transparentnost od prvog dana

Apertus i slični modeli dizajnirani su s dvostrukim ciljem. Prvo, poštovanje europskog zakonodavstva o autorskim pravima i zaštiti podataka. To uključuje pažljiv odabir datasetova, dokumentiranje izvora podataka i mogućnost da korisnici razumiju kako je model treniran.

Drugo, stvaranje transparentne platforme na kojoj istraživači mogu proučavati pristranosti, sigurnosne rizike i kvalitetu podataka. Budući da su težine modela i tehnička dokumentacija javno dostupni, moguće je provoditi nezavisne analize – od mjerenja diskriminatornih obrazaca do testiranja otpornosti na prompt-injekcije i druge napade.

Ovakav pristup izravno odgovara zahtjevima EU AI Acta, koji od kolovoza 2025. uvodi posebne obveze za pružatelje generativnih modela opće namjene. Propisi traže jasnu dokumentaciju, procjenu rizika, mehanizme za upravljanje sadržajem i mogućnost revizije. Otvoreni modeli pružaju prirodnu osnovu za takvu reguliranu, ali inovativnu upotrebu.

Uloga Mistral AI i nacionalnih inicijativa

Uz švicarski Apertus, važnu ulogu imaju i francuski modeli Mistral AI. Iako se Mistral razvija kao privatna kompanija, dio njihovih modela objavljen je s otvorenim težinama i permisivnim licencama. Time nastaje hibridni ekosustav u kojem se javni i privatni akteri nadopunjuju.

Francuska, Njemačka, Španjolska i druge države pokreću vlastite nacionalne AI inicijative. Neke se fokusiraju na razvoj velikih općih modela, druge na domenske modele za zdravstvo, pravo ili javnu upravu. Zajednička im je ideja: ključni modeli i infrastruktura moraju biti dostupni europskim dionicima pod uvjetima koji omogućuju kontrolu nad podacima i usklađenost s regulativom.

Rezultat je raznolika, ali sve povezanija mreža projekata. Od nacionalnih superračunala i podatkovnih centara, preko akademskih konzorcija, do startupova koji grade alate za treniranje, evaluaciju i deployment modela na europskim cloudovima i edge uređajima.

AI tvornice, InvestAI i EU Sovereign Tech Fund

Računalna infrastruktura kao strateški resurs

Treniranje modernih LLM-ova zahtijeva golemu računalnu snagu, specijalizirane akceleratore (GPU, TPU) i optimizirane softverske stackove. Zato Europska unija gradi širu infrastrukturu oko tzv. AI tvornica – specijaliziranih centara u kojima se modeli mogu trenirati, evaluirati i prilagođavati.

Inicijativa InvestAI usmjerena je na financiranje projekata koji koriste ili razvijaju umjetnu inteligenciju, s naglaskom na europsku dodanu vrijednost. To uključuje i ulaganja u otvorene modele, podatkovne platforme i alate za sigurno upravljanje modelima u produkciji.

EU Sovereign Tech Fund: dugoročna potpora otvorenoj tehnologiji

Predloženi EU Sovereign Tech Fund ide korak dalje. Cilj mu je dugoročno financirati ključne open-source komponente digitalne infrastrukture. To ne uključuje samo LLM-ove, već i operacijske sustave, baze podataka, kriptografske biblioteke, orkestracijske alate i druge temeljne tehnologije.

Ideja je smanjiti ovisnost o zatvorenim, vlasničkim rješenjima koja se razvijaju izvan europskog regulatornog okvira. Ako su temeljni slojevi – od hardvera do modela – otvoreni i razvijani u suradnji javnog i privatnog sektora, lakše je osigurati sigurnost, interoperabilnost i dugoročnu održivost.

U takvom okruženju javni LLM-ovi postaju dio šireg „digitalnog javnog dobra“. Oni više nisu samo istraživački projekti, već infrastruktura na koju se mogu naslanjati industrijski proizvodi, javne usluge i obrazovni programi.

Što otvoreni LLM-ovi znače za poduzeća i javnu upravu

Kontrola nad podacima i prilagodbom

Za poduzetnike i javnu upravu ključno je praktično pitanje: što konkretno mogu raditi s novom generacijom otvorenih modela?

Otvoreni LLM-ovi omogućuju izgradnju specijaliziranih rješenja uz potpunu kontrolu nad podacima. Organizacije mogu:

pokretati modele u vlastitim podatkovnim centrima ili u europskim cloudovima
fino podešavati modele na interne dokumente, procese i terminologiju
ograničiti prijenos osjetljivih podataka izvan organizacije
provoditi vlastite sigurnosne i etičke revizije modela

To je posebno važno u sektorima poput zdravstva, financija, energetike i javne uprave, gdje regulativa strogo definira kako se smiju obrađivati osobni i povjerljivi podaci.

Primjene u praksi

Na temelju javnih LLM-ova moguće je graditi cijeli niz rješenja:

Pravni i medicinski asistenti – modeli trenirani ili fino podešeni na nacionalno zakonodavstvo, sudsku praksu ili medicinske smjernice, uz jasna ograničenja i nadzor stručnjaka.
Interne tražilice i chatbotovi – sustavi koji pretražuju interne dokumente, zapisnike i baze znanja, s kontroliranim pristupom i audit logovima.
Višejezična komunikacija – alati za prevođenje, sažimanje i generiranje sadržaja na više europskih jezika, uključujući manje jezike i specifične domene.
Analiza dokumenata i podataka – automatizirano sažimanje izvješća, izvlačenje ključnih entiteta, klasifikacija prijava ili upita građana.

Budući da se modeli mogu izvoditi na lokalnoj infrastrukturi, lakše je ispuniti zahtjeve oko zaštite podataka, revizije modela i dokumentiranja rizika koje traži EU AI Act. Organizacije mogu definirati vlastite politike zadržavanja podataka, logiranja i kontrole pristupa.

Regulativa kao konkurentska prednost

EU AI Act često se percipira kao ograničenje, no u kombinaciji s otvorenim LLM-ovima može postati konkurentska prednost. Jasna pravila igre smanjuju pravnu nesigurnost i pomažu tvrtkama da od početka dizajniraju sustave koji su usklađeni s regulativom.

Otvoreni modeli olakšavaju ispunjavanje obveza kao što su:

dokumentiranje korištenih datasetova i metoda treniranja
procjena i ublažavanje rizika od pristranosti i diskriminacije
transparentnost prema korisnicima o mogućnostima i ograničenjima modela
omogućavanje neovisnih tehničkih i etičkih revizija

Za razliku od „crnih kutija“ u kojima su težine i treniranje potpuno zatvoreni, kod javnih LLM-ova regulator, istraživači i korisnici imaju bolji uvid u to kako sustav funkcionira. To olakšava i razvoj standarda, benchmarka i alata za evaluaciju.

Što slijedi: poveznica između modela i potreba društva

Od modela do ekosustava

Sljedeći korak za europsku AI zajednicu bit će povezivanje javnih LLM-ova s konkretnim industrijskim i društvenim potrebama. Sam model nije rješenje; on je temelj na koji treba nadograditi podatkovne pipelineove, korisnička sučelja, sustave za nadzor i procese upravljanja rizicima.

To podrazumijeva:

razvoj zajedničkih benchmarka za europske jezike i domene
alate za automatiziranu provjeru usklađenosti s regulativom
platforme za dijeljenje datasetova koji su pravno i etički provjereni
standardizirane metode za evaluaciju performansi i sigurnosti modela

Obrazovanje i interdisciplinarna suradnja

Jednako važan je ljudski faktor. Europa će trebati više stručnjaka koji razumiju kako modeli funkcioniraju tehnički, ali i kakve pravne, etičke i poslovne posljedice imaju njihove odluke.

Zato se razvijaju obrazovni programi za developere, podatkovne znanstvenike, pravnike, regulatorna tijela i menadžere. Cilj je stvoriti zajednički jezik između tehničkih timova i onih koji su odgovorni za usklađenost, sigurnost i strategiju.

Ako Europa uspije povezati otvorene LLM-ove, javno financiranje, jasnu regulativu i obrazovanje, može dobiti jedinstvenu poziciju: snažan AI ekosustav koji je konkurentan na globalnoj razini, ali i transparentan, provjerljiv te usklađen s europskim vrijednostima privatnosti i odgovornosti.

Zaključak: otvoreni modeli kao temelj europske AI strategije

Nova generacija javnih LLM-ova pokazuje da Europa ne želi biti samo tržište za tuđe AI proizvode, već i proizvođač temeljnih tehnologija. Projekti poput Apertusa, otvoreni modeli Mistral AI, AI tvornice, InvestAI i planirani EU Sovereign Tech Fund dio su iste slagalice.

Otvoreni LLM-ovi omogućuju veću kontrolu nad podacima, fleksibilnost u prilagodbi i transparentnost potrebnu za odgovornu uporabu umjetne inteligencije. U kombinaciji s EU AI Actom oni mogu postati osnova za europsku verziju „suverene umjetne inteligencije“ – takvu u kojoj inovacija i konkurentnost ne isključuju zaštitu temeljnih prava, već se na njima grade.

Nova generacija javnih LLM-ova: kako Europa gradi vlastite otvorene AI temelje