AnswersPublished23 hours agoLast edited 23 hours ago29 sources

OpenAI zveřejnilo bezpečnostní kartu pro GPT-5.6: Co přináší modely Sol, Terra a Luna?

OpenAI zveřejnilo systémovou kartu pro rodinu modelů GPT 5.6 (Sol, Terra, Luna) s podrobným hodnocením bezpečnosti a schopností. Poprvé v historii OpenAI dostaly menší a rychlejší modely v rodině (Terra a Luna) hodnocení High v některé ze sledovaných rizikových kategorií.

Search & fact-check with Studio Global AI Browse more Trending pages

69K0

OpenAI GPT-5.6 Preview System Card cover graphic showing Sol, Terra, and Luna models with safety findings — Search & fact-check with cited sources for What are the key safety and capability findings from OpenAI's GPT-5.6 Preview System Card, coveriOpenAI's GPT-5.6 Preview System Card details safety and capability findings for the Sol, Terra, and Luna model family.
AI Prompt
Create a landscape editorial hero image for this Studio Global article: Search & fact-check with cited sources for What are the key safety and capability findings from OpenAI's GPT-5.6 Preview System Card, coveri. Article summary: Here is a comprehensive summary of the key safety and capability findings from the **GPT-5.6 Preview System Card** (published June 26, 2026), based on OpenAI's official Deployment Safety Hub and supporting analyses.. Topic tags: general, general web, user generated, academic, education. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks
openai.com

OpenAI 26. června 2026 zveřejnilo systémovou kartu pro chystanou rodinu modelů GPT-5.6, která detailně popisuje bezpečnostní nálezy a schopnosti tří modelů — Sol (vlajkový model), Terra (střední třída) a Luna (nejrychlejší/nejmenší). Karta zároveň představuje vícevrstvý bezpečnostní systém a omezenou strategii nasazení. Jde o první případ, kdy OpenAI klasifikovalo menší a rychlejší modely v rodině jako vysoce rizikové podle svého Preparedness Framework, a přináší novou bezpečnostní technologii včetně aktivačních klasifikátorů a metody simulace nasazení.

Klasifikace rizik rodiny modelů

Podle Preparedness Framework (verze 2) společnosti OpenAI jsou všechny tři modely GPT-5.6 považovány za vysoce schopné v oblasti kybernetické bezpečnosti a biologického/chemického rizika . Žádný z modelů nedosahuje vysoké hranice v kategorii AI sebezdokonalování .

V kybernetické bezpečnosti konkrétně Sol nepřekročil hranici „Cyber Critical" — nejvyšší úroveň rizika. Při hodnocení s prohlížeči Chromium a Firefox model identifikoval chyby a exploitační primitiva, ale za testovaných podmínek nebyl schopen samostatně vytvořit plně funkční exploit . Sol dosáhl na interních kybernetických výzvách OpenAI skóre 96,7 %, což jej řadí nad hranici High, ale pod Critical .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Model	Riziko kybernetické bezpečnosti	Biologické/chemické riziko	AI sebezdokonalování
Sol (vlajkový)	High (ne Critical)	High	Pod High
Terra (střední)	High	High	Pod High
Luna (nejrychlejší)	High	High	Pod High

OpenAI zveřejnilo bezpečnostní kartu pro GPT-5.6: Co přináší modely Sol, Terra a Luna?

Klasifikace rizik rodiny modelů

Search, cite, and publish your own answer

People also ask

What is the short answer to "OpenAI zveřejnilo bezpečnostní kartu pro GPT-5.6: Co přináší modely Sol, Terra a Luna?"?

What are the key points to validate first?

What should I do next in practice?

Sources

Comments

Vícevrstvá ochrana: „Nejrobustnější bezpečnostní systém, jaký jsme kdy měli"

Aktivační klasifikátory (novinka)

Bezpečnostní trénink na úrovni modelu

Klasifikátory zneužití v reálném čase

Simulace nasazení („Deployment Replay")

Výsledky simulace nasazení

Zakázaný obsah

Nesprávné chování a agentivní překračování

Odolnost vůči jailbreaku a prompt injection

Profesionální výkon v HealthBench

Monitorovatelnost a ovladatelnost chain-of-thought

Metagaming chování

Hodnocení zkreslení

Výsledky externího red-teamingového testování

Strategie nasazení: Omezený náhled s důvěryhodným přístupem

Klíčové nejistoty a omezení