Nova generacija modela: od chatbotova do infrastrukturnog sloja
Krajem 2025. i početkom 2026. na tržište su stigla dva ključna modela koja označavaju novu fazu razvoja umjetne inteligencije: OpenAI‑jev GPT‑5.2 i Googleov Gemini 3. Riječ je o velikim jezičnim i multimodalnim modelima koji više nisu zamišljeni kao klasični chatbotovi, već kao razmišljajući asistenti. Oni planiraju, programiraju, povezuju podatke iz različitih izvora i preuzimaju čitave tokove rada.
Oba sustava uvode jasnu podjelu na dva načina rada: brzi „instant” mod za svakodnevne zadatke i sporiji, računalno skuplji „thinking” mod za duboko zaključivanje. U praksi to znači da isti model može u sekundi odgovoriti na jednostavno pitanje, ali i provoditi višesatne analize složenih dokumenata ili koda.
GPT‑5.2: fokus na dubokom rezoniranju i agentičkim sposobnostima
GPT‑5.2, predstavljen u prosincu 2025., dolazi u nekoliko varijanti: standardni instant i thinking mod, te Pro verzije namijenjene profesionalnim korisnicima i integratorima. Thinking mod troši znatno više računalnih resursa, ali je optimiziran za zadatke koji zahtijevaju višekorakno rezoniranje i dugotrajno planiranje.
Thinking mod: AI koji „razmišlja naglas”
Za razliku od ranijih generacija, GPT‑5.2 u thinking modu često eksplicitno prikazuje međukorake zaključivanja. Model prvo strukturira problem, zatim razlaže zadatak u manje cjeline i tek onda predlaže rješenje. To je posebno važno u područjima poput:
- pravnih analiza – prolazak kroz stotine stranica ugovora, presedana i regulative
- znanstvenih istraživanja – usporedba studija, provjera hipoteza, generiranje eksperimentalnih prijedloga
- višednevnih programerskih zadataka – planiranje arhitekture, pisanje modula, testiranje i refaktoriranje koda
GPT‑5.2 tako nastavlja trend započet s GPT‑5.1 i specijaliziranim agentičkim modelima za kodiranje. AI više nije samo generator teksta, nego orkestrator procesa koji koordinira niz manjih koraka, poziva API-je, upravlja repozitorijima koda i komunicira s drugim sustavima.
Od odgovora do preuzimanja cijelog toka rada
U poslovnom okruženju GPT‑5.2 se sve češće koristi kao „glavni agent” koji upravlja drugim alatima. Primjeri primjene uključuju:
- automatizirano održavanje softvera – model prati stanje repozitorija, otvara zadatke, predlaže popravke i generira testove
- pripremu kompleksnih izvještaja – kombiniranje podataka iz baza, tablica, prezentacija i e‑pošte u jedinstven dokument
- podršku timovima – AI kao stalni član tima koji pamti kontekst projekata i predlaže sljedeće korake
Takav pristup mijenja ulogu AI-ja u organizacijama: više se ne radi o „pametnom dodatku”, nego o infrastrukturnom sloju koji povezuje procese, podatke i ljude.
Gemini 3: multimodalnost i duboka integracija u Googleov ekosustav
Googleov Gemini 3 naglasak stavlja na multimodalnost i integraciju u postojeće proizvode. Model je dizajniran da u istom razgovoru razumije i kombinira tekst, slike, videozapise, audio i različite dokumente, te da iz njih izvodi konkretne radnje.
Jedinstven tok rada: tekst, slike, video i dokumenti
U praksi to znači da korisnik može, primjerice, učitati snimku sastanka, prezentaciju i tablicu s rezultatima, a Gemini 3 će:
- transkribirati i sažeti raspravu
- povezati zaključke sa slajdovima i brojkama iz tablica
- predložiti sljedeće korake i izraditi nacrt plana projekta
Posebno je istaknuta mogućnost izrade interaktivnih obrazovnih sadržaja: od jednog dokumenta i nekoliko slika model može generirati kvizove, animirane objašnjenja i personalizirane zadatke za učenika. U razvoju softvera, Gemini 3 koristi snimke zaslona, skice sučelja i specifikacije kako bi automatski prototipirao aplikacije.
Manje poslušan, više koristan
Google u komunikaciji naglašava da je Gemini 3 manje „poslušan pod svaku cijenu”, a više usmjeren na korisne i utemeljene odgovore. To uključuje:
- veću spremnost da odbije zadatke koji su rizični ili neetični
- jasnije označavanje nesigurnosti i ograničenja modela
- strože mehanizme provjere činjenica pri radu s osjetljivim temama
Cilj je smanjiti broj halucinacija, ali i potaknuti korisnike da AI doživljavaju kao stručnog asistenta, a ne kao „svemogućeg” autoriteta.
AI kao infrastruktura: učinci na poslovne procese
Za poslovne korisnike nova generacija modela znači da se umjetna inteligencija sve više pretvara u osnovnu infrastrukturu. Kombinacija dugog konteksta, multimodalnosti i agentičkih sposobnosti otvara mogućnost da se cijeli procesi automatiziraju ili barem snažno podrže.
Primjeri primjene u različitim sektorima
- Financije: automatizirana analiza izvješća, ugovora i tržišnih podataka; priprema nacrta investicijskih analiza i scenarija rizika.
- Pravo: pretraživanje presedana, izrada nacrta ugovora, usporedba klauzula i detekcija potencijalnih rizika u dokumentaciji.
- IT i razvoj softvera: generiranje i održavanje koda, pisanje testova, analiza logova i incidenta, izrada tehničke dokumentacije.
- Marketing: analiza kampanja, prijedlozi sadržaja na temelju podataka o publici, automatizirano A/B testiranje.
- Edukacija: personalizirani kurikulumi, analitika napretka, generiranje prilagođenih zadataka i objašnjenja.
U svim tim slučajevima GPT‑5.2 i Gemini 3 mogu raditi kao sloj između korisnika i postojećih sustava – čitaju dokumente, upravljaju alatima, predlažu odluke i pripremaju materijale koje potom čovjek provjerava i odobrava.
Dugi kontekst kao ključna prednost
Bitna tehnička promjena kod novih modela je mogućnost rada s vrlo dugim kontekstom. Umjesto ograničenja na desetke ili stotine stranica, modeli sada mogu obraditi tisuće stranica dokumentacije, višegodišnje nizove podataka ili kompletne repozitorije koda.
To omogućuje scenarije u kojima AI:
- samostalno prolazi kroz internu dokumentaciju tvrtke
- povezuje informacije iz različitih odjela i sustava
- predlaže standardizaciju procesa i otkriva nelogičnosti
U kombinaciji s agentičkim sposobnostima, model ne ostaje samo na analizi, nego može i inicirati promjene – primjerice otvoriti zadatke u sustavu za upravljanje projektima ili pripremiti izmjene procedura.
Što se mijenja za krajnje korisnike
Najvidljivija promjena za pojedince je dojam da AI „razmišlja naglas” i bolje razumije širi kontekst. Thinking modovi i multimodalnost čine interakciju prirodnijom, a zadaci mogu biti kompleksniji i dugotrajniji.
Učenje i osobni razvoj
U obrazovanju učenik može učitati cijeli udžbenik, vlastite bilješke i zadatke. Model zatim:
- analizira što učenik već razumije, a gdje griješi
- prilagođava objašnjenja razini znanja i stilu učenja
- generira dodatne primjere, vizualizacije i kvizove
Umjesto generičkih odgovora, AI postaje personalizirani tutor koji se prilagođava tempu i interesima korisnika.
Malo poduzetništvo i slobodna zanimanja
Mali poduzetnik može modelu dati pristup dokumentima tvrtke, slikama proizvoda i financijskim izvještajima. Na temelju toga AI:
- predlaže optimizaciju troškova i cijena
- analizira učinak postojećih marketinških kanala
- izrađuje prijedloge novih kampanja i kanala prodaje
Za slobodnjake, GPT‑5.2 i Gemini 3 mogu preuzeti dio administrativnog posla: pripremu ponuda, ugovora, izvještaja i prezentacija, uz stalnu dostupnost „drugo mišljenje” funkcije kod važnih odluka.
Rizici, regulativa i odgovorno korištenje
Kako modeli postaju moćniji i autonomniji, raste i potreba za ozbiljnijim upravljanjem rizicima. Pogreške AI sustava više nisu samo krivi odgovor u chatu, već mogu značiti pogrešno izrađen ugovor, netočan financijski izračun ili loše klasificirane medicinske podatke.
Usklađenost s EU AI Actom
EU AI Act uvodi zahtjeve za transparentnost, upravljanje podacima i procjenu rizika, osobito za sustave visokog rizika. Organizacije koje uvode GPT‑5.2 ili Gemini 3 u kritične procese morat će:
- jasno definirati svrhu i opseg korištenja AI-ja
- voditi evidenciju odluka u kojima je AI imao značajnu ulogu
- osigurati ljudski nadzor nad ključnim odlukama
- procijeniti utjecaj na privatnost, sigurnost i temeljna prava
Osim pravnog okvira, potrebno je razvijati interne politike korištenja AI-ja, edukaciju zaposlenika i mehanizme za prijavu i ispravljanje pogrešaka.
Transparentnost i povjerenje korisnika
Pitanje povjerenja postat će središnje. Korisnici će tražiti jasne informacije o tome:
- kada razgovaraju s AI sustavom, a kada s čovjekom
- koji se podaci koriste za treniranje i prilagodbu modela
- tko snosi odgovornost za štetu nastalu zbog pogrešnog savjeta AI-ja
Proizvođači modela već uvode detaljnije logove, mogućnost revizije i opcije za lokalno ili hibridno procesiranje podataka, posebno u osjetljivim sektorima poput zdravstva i financija.
Početak ere „razmišljajućih” asistenata
GPT‑5.2 i Gemini 3 označavaju prijelaz iz faze eksperimentiranja u fazu u kojoj AI postaje sastavni dio poslovnih i osobnih procesa. Razdvajanje na instant i thinking modove, snažna multimodalnost i agentičke sposobnosti stvaraju temelje za novu generaciju digitalnih asistenata koji ne samo da odgovaraju na pitanja, nego preuzimaju i izvršavanje zadataka.
Sljedeće godine vjerojatno će donijeti daljnje širenje tih modela u oblaku, ali i na edge uređaje – od računala i mobitela do industrijskih sustava. Ključno pitanje neće biti samo što AI može, nego kako osigurati da ga koristimo odgovorno: da koristi i pojedincima i gospodarstvu, uz jasna pravila o transparentnosti, sigurnosti i podjeli odgovornosti.



