Komunitní odhady uvádějí možné okno vydání mezi 15. červnem a 5. červencem 2026, ale tento časový plán je čistou extrapolací z nálezů v záznamech a nemá žádnou oficiální oporu . Pro hypotetický GPT‑5.6 se neobjevily žádné konkrétní ceny, čísla o efektivitě tokenů ani potvrzené multimodální schopnosti; očekávání zlepšené nákladové efektivity a generování textu a obrázků je závěrem odvozeným z trajektorie rodiny 5.x, nikoli zdokumentovanou specifikací
.
Sečteno a podtrženo: GPT‑5.6 je důvěryhodný únik, nikoli produkt. Odvětví sleduje chování backendu, ale OpenAI nezveřejnilo žádné datum uvedení ani technický specifikační list .
Fráze „Mythos Benchmark“ se objevuje v několika odlišných kontextech, což může způsobovat zmatení:
Únik modelu Anthropic Claude Mythos (26. března 2026): Chybná konfigurace v systému pro správu obsahu společnosti Anthropic omylem odhalila zhruba 3 000 interních dokumentů, včetně konceptu příspěvku o modelu příští generace s kódovým jménem „Capybara“ a oficiálním názvem Claude Mythos . Uniklé interní benchmarky ukázaly, že Mythos dosáhl 93,9 % na SWE‑bench Verified a 77,8 % na SWE‑bench Pro, čímž v té době vedl všechny hlavní programovací benchmarky
. Dne 7. dubna 2026 společnost Anthropic oficiálně oznámila Claude Mythos Preview – ale současně prohlásila, že veřejnost jej nemůže používat
. Model byl také označen za výjimečný v oblasti kybernetické bezpečnosti, včetně nalezení 27 let staré chyby v OpenBSD
.
Bezpečnostní benchmark Carnegie Mellon University (květen 2026): Výzkumníci z CMU vytvořili samostatné hodnocení, které testuje, zda AI modely mohou autonomně vyvíjet skutečné zneužitelnosti prohlížeče cílené na engine V8 od Googlu. Claude Mythos i GPT‑5.5 se ukázaly být schopné objevovat a zneužívat skutečné bezpečnostní chyby bez lidského zásahu, přičemž Mythos výrazně překonal GPT‑5.5 a zároveň jeho provoz stál přibližně dvanáctkrát více .
Benchmark zranitelností Mythos od SecureAI (leden 2026): Sada benchmarků zaměřená na kybernetickou bezpečnost, pokrývající CVE z let 2023–2026, určená k hodnocení AI detektorů zranitelností, která jako základní linie používá velké modely, jako je Llama‑3.1‑405B .
Když někdo zmiňuje „únik Mythos Benchmark“, obvykle má na mysli únik modelu Anthropic. Benchmarky CMU a SecureAI jsou samostatné snahy, které sdílejí označení „Mythos“ jen náhodně.
Dne 2. června 2026 na své akci „Intelligence at Work“ OpenAI oznámilo strukturální rozšíření Codexu z programovacího agenta zaměřeného na vývojáře na širší podnikovou pracovní platformu . Tři potvrzené pilíře oznámení jsou:
OpenAI také potvrdilo, že Codex překonal 5 milionů týdně aktivních uživatelů . Rozšíření představuje jasný strategický krok k získání znalostních pracovníků, kteří nejsou vývojáři, uvnitř podniků, což je směr, který několik nezávislých analýz označilo za přímou konkurenční osu proti nástrojům, které se dříve zaměřovaly téměř výhradně na inženýrské týmy
.
Na své výroční konferenci Build v San Francisku 2. června 2026 Microsoft představil rodinu sedmi vlastních AI modelů pod jednotnou značkou MAI (Microsoft AI), spolu s novým hardwarem .
Středobodem je MAI‑Thinking‑1, první model uvažování společnosti:
Dalších šest modelů doplňuje multimodální ekosystém:
Hardwarová oznámení zahrnovala Surface RTX Spark Dev Box, kompaktní vývojový stroj pro AI schopný až jednoho petaflopu AI výpočtu se 128 GB unifikované paměti, navržený pro lokální provoz modelů až do 120 miliard parametrů . Microsoft také představil kvantový čip Majorana 2, což signalizuje akceleraci jeho hardwarových ambicí nad rámec klasických AI výpočtů
.
Rodina sedmi modelů MAI je široce interpretována jako krok ke snížení závislosti na modelech OpenAI a zároveň nabídnutí podnikovým zákazníkům vlastních alternativ, které přicházejí s čistou komerční licencí .
„Vibe programování“ – praxe generování celých aplikací prostřednictvím konverzačních příkazů namísto psaní syntaxe – zplodilo novou generaci benchmarků, které se pokoušejí měřit full‑stack schopnosti spíše než izolované programovací úkoly:
Tyto tři platformy sdílejí cíl posunout hodnocení AI programování za benchmarky míry úspěšnosti, jako je SWE‑bench, směrem k holistickým měřítkům použitelnosti, rychlosti, nákladů a bezpečnosti.
Dne 2. června 2026 společnost Nous Research vydala Hermes Desktop jako veřejný náhled, společně s Hermes Agent v0.15.2 a publikovala jej pod licencí MIT pro macOS 12+, Windows 10/11 a Linux .
Hermes byl dříve přístupný pouze prostřednictvím rozhraní příkazového řádku nebo bran pro zasílání zpráv. Desktopová aplikace je nativní grafické rozhraní, které sdílí stejné jádro agenta, API klíče, relace, dovednosti a paměť jako CLI, takže je alternativním prostředím, nikoli forkem .
Nous Research popisuje Hermes jako „samozdokonalujícího se agenta, nikoli programovacího asistenta“ . Agent vyrostl od svého spuštění na zhruba 180 000 hvězdiček na GitHubu za přibližně tři měsíce, což z něj činí jeden z nejrychleji rostoucích open‑source projektů agentů v ekosystému
.
Alibaba spustila Qwen 3.7 Plus přibližně 1.–2. června 2026. Jedná se o multimodální model agenta, který zpracovává text, obrázky a video prostřednictvím tréninku s časnou fúzí, s kontextovým oknem o velikosti 1 milion tokenů .
Cena je stanovena zhruba na jednu šestinu ceny za token ve srovnání s textovým modelem Alibaba Qwen 3.7 Max, což z něj činí jednoho z agresivněji naceněných multimodálních agentů na trhu . Na benchmarcích výkonu agentů Qwen 3.7 Plus poráží Claude Opus 4.6 na Terminal‑Bench 2.0 a je schopen rozpoznávání/automatizace UI, generování kódu z obrázků a vizuálního zodpovídání otázek
.
Claude Code je agentní programovací nástroj společnosti Anthropic, který pracuje přímo v terminálu, spouští příkazy shellu a upravuje soubory na počítači vývojáře. Příkaz /fork vytvoří novou relaci, která se větví z existující, uloženou pod commands/branch/, což umožňuje pracovní postup, kdy vývojáři mohou prozkoumávat jiný směr, aniž by ztratili kontext z původní relace .
Claude Code se stal jedním z nejrozšířenějších AI vývojářských nástrojů, přičemž jedna zmínka o npm balíčku nashromáždila přes 1 100 hvězdiček a 1 900 forků za jediný den .
Několik položek v původním dotazu postrádá přímé potvrzení zdroje k začátku června 2026:
Dominantními tématy prvního červnového týdne 2026 jsou podnikové nástroje (pluginy Codex a Sites), rodiny vlastních modelů (řada MAI od Microsoftu, Qwen od Alibaby), vyzrávání open‑source agentů (Hermes Desktop) a rýsující se příští generace, která ještě není veřejná (GPT‑5.6, Claude Mythos). Odvětví se pohybuje rychle – ale rozdíl mezi potvrzenými produkty a nepotvrzenými fámami je ostřejší, než titulky často naznačují.
Comments
0 comments