GPT‑5.2 i Gemini 3: nova generacija razmišljajućih AI asistenata

Nova generacija modela: od chatbotova do infrastrukturnog sloja

Krajem 2025. i početkom 2026. na tržište su stigla dva ključna modela koja označavaju novu fazu razvoja umjetne inteligencije: OpenAI‑jev GPT‑5.2 i Googleov Gemini 3. Riječ je o velikim jezičnim i multimodalnim modelima koji više nisu zamišljeni kao klasični chatbotovi, već kao razmišljajući asistenti. Oni planiraju, programiraju, povezuju podatke iz različitih izvora i preuzimaju čitave tokove rada.

Oba sustava uvode jasnu podjelu na dva načina rada: brzi „instant” mod za svakodnevne zadatke i sporiji, računalno skuplji „thinking” mod za duboko zaključivanje. U praksi to znači da isti model može u sekundi odgovoriti na jednostavno pitanje, ali i provoditi višesatne analize složenih dokumenata ili koda.

GPT‑5.2: fokus na dubokom rezoniranju i agentičkim sposobnostima

GPT‑5.2, predstavljen u prosincu 2025., dolazi u nekoliko varijanti: standardni instant i thinking mod, te Pro verzije namijenjene profesionalnim korisnicima i integratorima. Thinking mod troši znatno više računalnih resursa, ali je optimiziran za zadatke koji zahtijevaju višekorakno rezoniranje i dugotrajno planiranje.

Thinking mod: AI koji „razmišlja naglas”

Za razliku od ranijih generacija, GPT‑5.2 u thinking modu često eksplicitno prikazuje međukorake zaključivanja. Model prvo strukturira problem, zatim razlaže zadatak u manje cjeline i tek onda predlaže rješenje. To je posebno važno u područjima poput:

pravnih analiza – prolazak kroz stotine stranica ugovora, presedana i regulative
znanstvenih istraživanja – usporedba studija, provjera hipoteza, generiranje eksperimentalnih prijedloga
višednevnih programerskih zadataka – planiranje arhitekture, pisanje modula, testiranje i refaktoriranje koda

GPT‑5.2 tako nastavlja trend započet s GPT‑5.1 i specijaliziranim agentičkim modelima za kodiranje. AI više nije samo generator teksta, nego orkestrator procesa koji koordinira niz manjih koraka, poziva API-je, upravlja repozitorijima koda i komunicira s drugim sustavima.

Od odgovora do preuzimanja cijelog toka rada

U poslovnom okruženju GPT‑5.2 se sve češće koristi kao „glavni agent” koji upravlja drugim alatima. Primjeri primjene uključuju:

automatizirano održavanje softvera – model prati stanje repozitorija, otvara zadatke, predlaže popravke i generira testove
pripremu kompleksnih izvještaja – kombiniranje podataka iz baza, tablica, prezentacija i e‑pošte u jedinstven dokument
podršku timovima – AI kao stalni član tima koji pamti kontekst projekata i predlaže sljedeće korake

Takav pristup mijenja ulogu AI-ja u organizacijama: više se ne radi o „pametnom dodatku”, nego o infrastrukturnom sloju koji povezuje procese, podatke i ljude.

Gemini 3: multimodalnost i duboka integracija u Googleov ekosustav

Googleov Gemini 3 naglasak stavlja na multimodalnost i integraciju u postojeće proizvode. Model je dizajniran da u istom razgovoru razumije i kombinira tekst, slike, videozapise, audio i različite dokumente, te da iz njih izvodi konkretne radnje.

Jedinstven tok rada: tekst, slike, video i dokumenti

U praksi to znači da korisnik može, primjerice, učitati snimku sastanka, prezentaciju i tablicu s rezultatima, a Gemini 3 će:

transkribirati i sažeti raspravu
povezati zaključke sa slajdovima i brojkama iz tablica
predložiti sljedeće korake i izraditi nacrt plana projekta

Posebno je istaknuta mogućnost izrade interaktivnih obrazovnih sadržaja: od jednog dokumenta i nekoliko slika model može generirati kvizove, animirane objašnjenja i personalizirane zadatke za učenika. U razvoju softvera, Gemini 3 koristi snimke zaslona, skice sučelja i specifikacije kako bi automatski prototipirao aplikacije.

Manje poslušan, više koristan

Google u komunikaciji naglašava da je Gemini 3 manje „poslušan pod svaku cijenu”, a više usmjeren na korisne i utemeljene odgovore. To uključuje:

veću spremnost da odbije zadatke koji su rizični ili neetični
jasnije označavanje nesigurnosti i ograničenja modela
strože mehanizme provjere činjenica pri radu s osjetljivim temama

Cilj je smanjiti broj halucinacija, ali i potaknuti korisnike da AI doživljavaju kao stručnog asistenta, a ne kao „svemogućeg” autoriteta.

AI kao infrastruktura: učinci na poslovne procese

Za poslovne korisnike nova generacija modela znači da se umjetna inteligencija sve više pretvara u osnovnu infrastrukturu. Kombinacija dugog konteksta, multimodalnosti i agentičkih sposobnosti otvara mogućnost da se cijeli procesi automatiziraju ili barem snažno podrže.

Primjeri primjene u različitim sektorima

Financije: automatizirana analiza izvješća, ugovora i tržišnih podataka; priprema nacrta investicijskih analiza i scenarija rizika.
Pravo: pretraživanje presedana, izrada nacrta ugovora, usporedba klauzula i detekcija potencijalnih rizika u dokumentaciji.
IT i razvoj softvera: generiranje i održavanje koda, pisanje testova, analiza logova i incidenta, izrada tehničke dokumentacije.
Marketing: analiza kampanja, prijedlozi sadržaja na temelju podataka o publici, automatizirano A/B testiranje.
Edukacija: personalizirani kurikulumi, analitika napretka, generiranje prilagođenih zadataka i objašnjenja.

U svim tim slučajevima GPT‑5.2 i Gemini 3 mogu raditi kao sloj između korisnika i postojećih sustava – čitaju dokumente, upravljaju alatima, predlažu odluke i pripremaju materijale koje potom čovjek provjerava i odobrava.

Dugi kontekst kao ključna prednost

Bitna tehnička promjena kod novih modela je mogućnost rada s vrlo dugim kontekstom. Umjesto ograničenja na desetke ili stotine stranica, modeli sada mogu obraditi tisuće stranica dokumentacije, višegodišnje nizove podataka ili kompletne repozitorije koda.

To omogućuje scenarije u kojima AI:

samostalno prolazi kroz internu dokumentaciju tvrtke
povezuje informacije iz različitih odjela i sustava
predlaže standardizaciju procesa i otkriva nelogičnosti

U kombinaciji s agentičkim sposobnostima, model ne ostaje samo na analizi, nego može i inicirati promjene – primjerice otvoriti zadatke u sustavu za upravljanje projektima ili pripremiti izmjene procedura.

Što se mijenja za krajnje korisnike

Najvidljivija promjena za pojedince je dojam da AI „razmišlja naglas” i bolje razumije širi kontekst. Thinking modovi i multimodalnost čine interakciju prirodnijom, a zadaci mogu biti kompleksniji i dugotrajniji.

Učenje i osobni razvoj

U obrazovanju učenik može učitati cijeli udžbenik, vlastite bilješke i zadatke. Model zatim:

analizira što učenik već razumije, a gdje griješi
prilagođava objašnjenja razini znanja i stilu učenja
generira dodatne primjere, vizualizacije i kvizove

Umjesto generičkih odgovora, AI postaje personalizirani tutor koji se prilagođava tempu i interesima korisnika.

Malo poduzetništvo i slobodna zanimanja

Mali poduzetnik može modelu dati pristup dokumentima tvrtke, slikama proizvoda i financijskim izvještajima. Na temelju toga AI:

predlaže optimizaciju troškova i cijena
analizira učinak postojećih marketinških kanala
izrađuje prijedloge novih kampanja i kanala prodaje

Za slobodnjake, GPT‑5.2 i Gemini 3 mogu preuzeti dio administrativnog posla: pripremu ponuda, ugovora, izvještaja i prezentacija, uz stalnu dostupnost „drugo mišljenje” funkcije kod važnih odluka.

Rizici, regulativa i odgovorno korištenje

Kako modeli postaju moćniji i autonomniji, raste i potreba za ozbiljnijim upravljanjem rizicima. Pogreške AI sustava više nisu samo krivi odgovor u chatu, već mogu značiti pogrešno izrađen ugovor, netočan financijski izračun ili loše klasificirane medicinske podatke.

Usklađenost s EU AI Actom

EU AI Act uvodi zahtjeve za transparentnost, upravljanje podacima i procjenu rizika, osobito za sustave visokog rizika. Organizacije koje uvode GPT‑5.2 ili Gemini 3 u kritične procese morat će:

jasno definirati svrhu i opseg korištenja AI-ja
voditi evidenciju odluka u kojima je AI imao značajnu ulogu
osigurati ljudski nadzor nad ključnim odlukama
procijeniti utjecaj na privatnost, sigurnost i temeljna prava

Osim pravnog okvira, potrebno je razvijati interne politike korištenja AI-ja, edukaciju zaposlenika i mehanizme za prijavu i ispravljanje pogrešaka.

Transparentnost i povjerenje korisnika

Pitanje povjerenja postat će središnje. Korisnici će tražiti jasne informacije o tome:

kada razgovaraju s AI sustavom, a kada s čovjekom
koji se podaci koriste za treniranje i prilagodbu modela
tko snosi odgovornost za štetu nastalu zbog pogrešnog savjeta AI-ja

Proizvođači modela već uvode detaljnije logove, mogućnost revizije i opcije za lokalno ili hibridno procesiranje podataka, posebno u osjetljivim sektorima poput zdravstva i financija.

Početak ere „razmišljajućih” asistenata

GPT‑5.2 i Gemini 3 označavaju prijelaz iz faze eksperimentiranja u fazu u kojoj AI postaje sastavni dio poslovnih i osobnih procesa. Razdvajanje na instant i thinking modove, snažna multimodalnost i agentičke sposobnosti stvaraju temelje za novu generaciju digitalnih asistenata koji ne samo da odgovaraju na pitanja, nego preuzimaju i izvršavanje zadataka.

Sljedeće godine vjerojatno će donijeti daljnje širenje tih modela u oblaku, ali i na edge uređaje – od računala i mobitela do industrijskih sustava. Ključno pitanje neće biti samo što AI može, nego kako osigurati da ga koristimo odgovorno: da koristi i pojedincima i gospodarstvu, uz jasna pravila o transparentnosti, sigurnosti i podjeli odgovornosti.

Što donose GPT‑5.2 i Gemini 3: nova generacija „razmišljajućih” AI asistenata

Nova generacija modela: od chatbotova do infrastrukturnog sloja