Claude Code byl od začátku navržen pro praktické workflow vývojářů. Uměl vyhledávat a číst kód, upravovat soubory, spouštět testy a odesílat změny na GitHub – to vše z příkazové řádky . Prvotní náhled byl omezený, ale odezva vývojářů byla okamžitá. Do března 2025 nástroj získal podporu pro vkládání obrázků a zmiňování souborů pomocí @; v dubnu 2025 přibyla perzistence relací a funkce obnovení, která umožnila pokračovat v konverzaci s uchováním kontextu i po restartu
.
Série verzí 0.2.x, trvající od února do květnového spuštění obecné dostupnosti, postupně stabilizovala terminálový zážitek. Když Claude Code dosáhl obecné dostupnosti, byl již připraven na produkční nasazení pro soustavnou softwarovou práci .
Za schopnostmi Claude Code stojí postupné generace vlajkových modelů Anthropicu. Každá generace Opus přímo zlepšila kódovací, uvažovací schopnosti a spolehlivost nástroje.
Claude Opus 4.5, vydaný v listopadu 2025, byl prezentován jako nejlepší model na světě pro kódování, agenty a ovládání počítače . Ustanovil architekturu Opus 4.x, která se stala základem platformy.
Opus 4.6 přinesl významná zlepšení v plánování, spolehlivosti při dlouhotrvajících agentních úlohách a práci v rozsáhlých kódových základnách. Především představil kontextové okno o velikosti 1 milionu tokenů v beta verzi – první model třídy Opus, který zvládal kontext v tomto měřítku .
Skok z Opus 4.6 na Opus 4.7 byl pro benchmarky kódování převratný. V rámci jediného vydání modelu se Anthropic posunul z 80,8 % na 87,6 % na SWE-bench Verified (adaptivní režim) . Také posunul SWE-bench Pro z 53,4 % na 64,3 % – což je náskok více než 10 bodů před nejbližším konkurentem
.
Opus 4.7 zavedl adaptivní myšlení, které dynamicky přiděluje výpočetní výkon na úkol, a stabilizoval kontextové okno 1M tokenů v produkční kvalitě napříč Anthropic API, Amazon Bedrock a Google Cloud Vertex AI .
Nejnovější vylepšení modelu spíše vylaďuje, než transformuje. Opus 4.8 staví přímo na Opus 4.7 a zlepšuje skóre SWE-bench Pro z 64,3 % na 69,2 % při dramatickém snížení míry neodhalených chyb v kódu. Anthropic uvedl, že model je čtyřikrát méně pravděpodobné, že nechá projít chyby ve vlastním kódu bez povšimnutí, a testeři zaznamenali větší ochotu upozorňovat na nejistotu a vyhýbat se nepodloženým tvrzením .
Klíčové je, že Opus 4.8 zachovává API kompatibilitu s Opus 4.7 a je nabízen za stejnou cenu. Přináší také 2,5× rychlejší Rychlý režim za třetinovou cenu oproti předchozím modelům, což přímo zlepšuje vývojářský zážitek v Claude Code .
Anthropic uspořádal svou první výroční vývojářskou konferenci Code with Claude 6. května 2026 v San Francisku, se satelitními akcemi v Londýně a Tokiu . Místo představení nového modelu se akce zaměřila výhradně na schopnosti platformy – zejména na funkce pro Claude Managed Agents (Spravované agenty Claude).
Anthropic uvedl čtyři funkce pro své hostované, stavové agentní běhové prostředí, které bylo spuštěno ve veřejné beta verzi jen asi o měsíc dříve, začátkem dubna 2026 .
Snění (Dreaming, Výzkumný náhled) je koncepčně nejambicióznější z celé sady. Když jsou agenti nečinní, naplánovaný proces na pozadí zkontroluje až 100 minulých konverzací, vytáhne opakující se vzory, workflow a chyby a poté přepíše paměťové úložiště agenta pro vyšší signál. Původní data relace zůstávají neměnná – agent tyto aktualizace paměti přijímá pouze explicitně a vývojáři mohou zvolit manuální kontrolu před změnou paměti .
Tento mechanismus v podstatě umožňuje agentům, aby se časem zlepšovali bez přímého přetrénování. V současnosti je k dispozici ve výzkumném náhledu a vyžaduje požádání o přístup .
Výsledky (Outcomes, Veřejná beta) zavádí strukturovaná kritéria úspěchu. Samostatný hodnotitel běží v izolovaném kontextovém okně a hodnotí výstup agenta podle vývojářem definovaných rubrik. Pokud skóre klesne pod stanovenou hranici, agent automaticky úkol zopakuje .
Orchestrace více agentů (Multi-Agent Orchestration, Veřejná beta) umožňuje vedoucímu agentovi rozložit složité úkoly a rozdělit práci flotile specializovaných sub-agentů – každý s vlastním modelem, promptem a nástroji – běžících paralelně na sdíleném souborovém systému .
Webhooky (Veřejná beta) umožňují agentům posílat oznámení externím systémům po dokončení úkolů, čímž posouvají agentní workflow z konverzačního na událostmi řízené .
Spolu s funkcemi pro spravované agenty zahrnoval Code with Claude několik dalších novinek:
Hlavním benchmarkovým číslem Claude Code je jeho skóre 87,6 % na SWE-bench Verified, dosažené s modelem Claude Opus 4.7 v adaptivním režimu . Toto skóre představuje nejvyšší publikovaný výsledek mezi obecně dostupnými AI agenty pro kódování k červnu 2026.
SWE-bench Verified je kurátorský soubor 500 reálných GitHub issues z open-source repozitářů v Pythonu, které musí agenti vyřešit od začátku do konce. Stal se standardním referenčním měřítkem v oboru pro agentní softwarové inženýrství a vzestup Claude Code na tomto žebříčku – z 80,9 % na Opus 4.5 na 87,6 % na Opus 4.7 – byl klíčovým příběhem produktu .
Hodnota 87,6 % není statická. Závisí na modelu, promptu a „testovacím prostředí“ (harness) – běhovém prostředí, které řídí používání nástrojů. Adaptivní režim Claude Opus 4.7 dynamicky přiděluje výpočetní výkon na úkol a posílá více zdrojů složitým refaktorizacím. Samostatný Claude Code bez tohoto adaptivního prostředí dosahuje na stejném benchmarku 80,8 % .
Na těžším benchmarku SWE-bench Pro – který testuje obtížnější řešení reálných problémů – Opus 4.7 dosáhl 64,3 %, před GPT-5.4 (57,7 %), GPT-5.5 (58,6 %) a Gemini 3.1 Pro (54,2 %) . Opus 4.8 později posunul SWE-bench Pro na 69,2 %
.
Výkon Claude Code se rozprostírá napříč několika benchmarky:
Stojí za zmínku, že konkurenční obraz zůstává proměnlivý. GPT-5.5 od OpenAI se krátce ujal vedení na SWE-bench Verified s 88,7 % již dříve v polovině roku 2026, což vytvořilo rozkol, kdy Claude Code vedl na SWE-bench Pro a GPT-5.5 na Verified . Žebříček se s každým vydáním modelu nadále vyvíjí.
Pozicování Claude Code ze strany Anthropicu se soustředí kolem konceptu dlouhodobé autonomie. Claude Opus 4.8 je popisován jako model s „konzistencí a autonomií pokračovat v práci na dlouhotrvajících úkolech“ a je specificky označen jako „nejschopnější model Anthropicu pro komplexní uvažování, dlouhodobé agentní kódování a práci s vysokou autonomií“ .
Tento důraz na soustavný, nezávislý provoz spíše než na jednorázové dokončení promptu je tím, kde se Claude Code nejzřetelněji odlišuje. Funkce jako snění, adaptivní přidělování výpočetního výkonu a orchestrace více agentů, to vše ukazuje na filozofii, kde se očekává, že agent bude pracovat napříč relacemi, učit se z vlastního výstupu a řídit složité projekty o mnoha souborech s minimálními zásahy vývojáře.
Anthropic také začal zdůrazňovat upřímnost modelu jako konkurenční výhodu. Vydání Opus 4.8 vyzdvihuje ochotu modelu upozornit na nejistotu a vyhnout se nepodloženým tvrzením – praktické, na bezpečnost orientované zarámování zaměřené na vývojáře, kteří potřebují důvěřovat výstupu svého agenta v produkčních prostředích .
Comments
0 comments