AI vojna sa vyostruje: Claude Opus 4.6 vs GPT-5.3 Codex v ten istý deň

Technológie

Claude vs GPT Dnes sa stalo niečo, čo presne ilustruje, v akej dobe žijeme. Anthropic a OpenAI — dvaja najväčší rivali v AI svete — vydali svoje najnovšie modely prakticky v rovnaký moment. Anthropic predstavil Claude Opus 4.6 a presne 20 minút nato OpenAI odpovedal s GPT-5.3 Codex. Toto nie je náhoda. Toto je vojna.

A aby toho nebolo málo, obaja sa stretávajú aj na Super Bowle túto nedeľu — Anthropic s reklamou, ktorá sa vysmieva reklámam v AI chatbotoch, a OpenAI so svojou vlastnou kampaňou. Ale poďme k tomu, čo je pre nás podnikateľov a vývojárov dôležité — k samotným modelom.

Claude Opus 4.6: Autonómny spolupracovník

Anthropic s Opus 4.6 urobil veľký krok vpred. Hlavné novinky:

1M tokenový kontext v beta verzii. To znamená, že model dokáže pracovať s obrovským množstvom textu naraz — celé kódbázy, dlhé dokumenty, komplexné analýzy. Na benchmarku MRCR v2 (hľadanie informácií v dlhom kontexte) dosiahol 76%, zatiaľ čo predchádzajúci Sonnet 4.5 len 18.5%. Problém tzv. “context rot” — keď model postupne stráca prehľad v dlhých konverzáciách — je prakticky vyriešený.

Agent Teams. Namiesto jedného agenta, ktorý robí úlohy postupne, teraz môžete rozdeliť prácu medzi viacerých agentov, ktorí pracujú paralelne. Predstavte si tím ľudí — jeden píše kód, druhý testuje, tretí dokumentuje — ale sú to AI agenti v Claude Code.

Adaptívne myslenie. Model sám rozhoduje, koľko úsilia venovať problému. Pri jednoduchých otázkach je rýchly, pri komplexných sa zastaví a premyslí. Vývojári majú k dispozícii štyri úrovne: low, medium, high a max.

Manažérska práca. Opus 4.6 bol úspešne nasadený v japonskej finančnej technologickej firme, kde dokázal vykonávať manažérsku prácu. Toto má zásadné implikácie — vysoko platení manažéri môžu byť postupne nahradení AI agentmi. AI zásadne pretransformuje manažment — AI zreinventuje manažment. Toto je ďalšia oblasť, kde AI nahradí ľudskú prácu.

Inžinieri boli pôvodne len nástroje. Teraz nahrádzame tieto nástroje AI. Aké ďalšie povolania sú len nástroje? A aké povolania v sebe nesú kreativitu? Kreativita pretrvá aj v ére AI. Kancelárska práca, reporting, analýzy — to sú nástroje. Umelecká tvorba, dizajn, inovácia — to je kreativita. AI nahradí nástroje, nie kreativitu.

Bezpečnosť ako bonus. Pred spustením Anthropic nechal Opus 4.6 hľadať zraniteľnosti v open-source kóde. Výsledok? Viac ako 500 predtým neznámych zero-day zraniteľností, každá overená bezpečnostným výskumníkom.

Na benchmarkoch Opus 4.6 vedie v GDPval-AA (reálne pracovné úlohy vo financiách a práve) o 144 Elo bodov pred GPT-5.2, na ARC AGI 2 dosiahol 68.8% oproti 54.2% od GPT-5.2. Cena zostáva rovnaká: $5/$25 za milión tokenov.

Microsoft Office integrácia. Opus 4.6 nie je len pre vývojárov. Claude je teraz priamo v PowerPointe ako bočný panel — nie len vytváranie prezentácií externe, ale práca priamo v aplikácii. Excel dostal upgrade, kde Claude dokáže interpretovať aj chaotické tabuľky bez explicitného vysvetlenia. Toto je signál, že Anthropic sa naplno zameriava aj na bežných knowledge workerov.

Reakcie z odvetvia sú pozitívne. Michael Truell, CEO Cursoru, hovorí, že Opus 4.6 vyniká pri najťažších problémoch a vydrží na dlhých úlohách tam, kde iné modely vzdávajú. Sarah Sachs z Notionu opisuje, že model už nepôsobí ako nástroj, ale ako skutočný spolupracovník. GitHub’s Mario Rodriguez dodáva, že odomyká úlohy, ktoré boli predtým dosiahnuteľné len pre ľudí.

GPT-5.3 Codex: Model, ktorý pomohol vytvoriť sám seba

OpenAI zvolilo iný prístup. GPT-5.3 Codex nie je len upgrade — je to prvý model, ktorý bol použitý na vytváranie seba samého. Tím OpenAI použil skoršie verzie na debugovanie tréningu, správu deploymentu a diagnostiku testov. Ako to povedal Sam Altman: “It was amazing to watch how much faster we were able to ship 5.3-Codex by using 5.3-Codex.” Toto je míľnik smerom k rekurzívnemu seba-zlepšovaniu AI — jeden z najsledovanejších (a najobávanejších) konceptov v celom odvetví.

Rýchlosť a efektivita. O 25% rýchlejší ako GPT-5.2 Codex a spotrebuje menej tokenov na rovnaké úlohy. To znamená nižšie náklady a rýchlejšie výsledky.

Terminal-Bench 2.0 dominancia. Tu GPT-5.3 Codex dosahuje 77.3% — výrazne viac ako Opus 4.6 s 65.4% na rovnakom benchmarku. Toto je area, kde OpenAI jednoznačne vedie.

Interaktívna spolupráca. Na rozdiel od Opus 4.6, ktorý smeruje k autonómii, GPT-5.3 Codex kladie dôraz na spoluprácu počas práce. Môžete s ním komunikovať, usmerňovať ho a klásť otázky, zatiaľ čo pracuje — bez straty kontextu. Je to skôr ako kolega než autonómny agent.

Viac ako kódovanie. OpenAI posúva Codex za hranice softvérového vývoja — debugging, deploying, monitoring, písanie PRDs, prezentácie, tabuľky. Nová Codex desktop appka pre Mac slúži ako “veliteľské centrum” pre správu viacerých agentov súčasne, s novým systémom “skills” — integrovaný s Figma, Linear, Vercel a ďalšími. Vízia je jasná: z kódovacieho agenta sa stáva univerzálny digitálny spolupracovník. A plný GPT-5.3 (nie len Codex variant) pre bežných ChatGPT používateľov je podľa všetkého za rohom.

Kybernetická bezpečnosť — dvojsečná zbraň. OpenAI klasifikuje GPT-5.3 Codex ako prvý model s hodnotením “high capability” pre kybernetickú bezpečnosť. To znamená, že je dostatočne schopný na to, aby reálne pomáhal pri kybernetických útokoch — ale aj pri obrane. OpenAI kvôli tomu dokonca odkladá plný API prístup a spúšťa program Trusted Access for Cyber spolu s $10M v API kreditoch pre bezpečnostný výskum. Anthropic čelí rovnakému problému — ich model našiel 500 zero-day zraniteľností, čo je úžasné pre obranu, ale rovnaký nástroj v zlých rukách je hrozba.

Kde kto vedie?

Ak si to zhrnieme do jednoduchej tabuľky:

  • Terminal-Bench 2.0 (agentické kódovanie): GPT-5.3 Codex 77.3% vs Opus 4.6 65.4% — jasná výhra OpenAI
  • GDPval-AA (finance, právo): Opus 4.6 vedie o 144 Elo bodov
  • ARC AGI 2 (ľudsky jednoduché, AI ťažké problémy): Opus 4.6 68.8% vs GPT-5.2 54.2%
  • OSWorld (počítačové úlohy): Opus 4.6 72.7% vs GPT-5.3 Codex 64.7%
  • Kontext: Opus 4.6 má 1M tokenov, GPT-5.3 Codex nemá ekvivalent
  • Multi-agent: Opus 4.6 má Agent Teams, GPT-5.3 Codex nie

Zaujímavý postreh z Hacker News to pekne zhrnul: GPT-5.3 Codex je interaktívny spolupracovník — usmerňujete ho počas práce. Opus 4.6 je autonómny agent — plánuje hlbšie, beží dlhšie a pýta sa menej.

Super Bowl a väčší obrázok

Tento súboj nie je len o modeloch. Anthropic a OpenAI majú fundamentálne odlišné biznis modely a filozofie. Anthropic stavia na bezpečnosti a enterprise predaji — žiadne reklamy v Claude, nikdy. OpenAI práve oznámilo reklamy v ChatGPT pre free a lacnejších používateľov.

Anthropic to využil na Super Bowl reklamu, ktorá sa vysmieva AI chatbotom predávajúcim produkty. Tagline: “Ads are coming to AI. But not to Claude.” Sam Altman reagoval, že reklamy sú “vtipné ale klamlivé” a dodal, že “Anthropic predáva drahý produkt bohatým ľudom.”

Čísla hovoria jasne: OpenAI má stále najväčší podiel na enterprise trhu, ale ten klesá — zo 62% v 2024 na projektovaných 53% v 2026 (podľa prieskumu Andreessen Horowitz). Anthropic medzitým vyskočil z takmer nuly na 40% firiem, ktoré ho používajú v produkcii, a má už viac ako 300,000 platiacich biznis zákazníkov. Claude Code dosiahol $1 miliardu v ročnom run-rate revenue len 6 mesiacov po spustení. Na druhej strane, Codex mal za posledný mesiac viac ako milión aktívnych vývojárov.

Čo to znamená pre podnikateľov

Ak podnikáte a využívate AI, toto je kľúčový moment. Oba modely sú výrazne lepšie ako čokoľvek pred rokom. Ale majú rôzne silné stránky:

Ak potrebujete autonómnych agentov pre dlhé, komplexné úlohy — Opus 4.6 s Agent Teams je pravdepodobne lepšia voľba. Ak potrebujete rýchle, efektívne kódovanie s interaktívnym vedením — GPT-5.3 Codex vyniká. Ak robíte finančné analýzy alebo právne úlohy — Opus 4.6 výrazne vedie. Ak robíte terminálové a devops úlohy — GPT-5.3 Codex je jasný víťaz.

Najdôležitejšie: nemusíte si vybrať len jedného. AI trh sa vyvíja tak rýchlo, že vendor lock-in nemá zmysel. Používajte to, čo funguje najlepšie pre konkrétnu úlohu.

Dnes sme videli budúcnosť práce — a tá budúcnosť sa vyvíja rýchlejšie, než ktokoľvek čakal.

AI Claude GPT OpenAI Anthropic