報告已發布2026年4月29日Last edited 2026年5月6日25 來源

GPT-5.5 Spud y seguridad: qué se puede comprobar de verdad

La conclusión más prudente es que no hay pruebas públicas suficientes: no aparece una system card, informe de red teaming o evaluación de Preparedness/alineamiento que nombre directamente a GPT 5.5 Spud. Sí hay evidencia de procesos generales de seguridad, alineamiento y red teaming de OpenAI, y GPT 5 cuenta con doc...

使用 Studio Global AI 搜尋並查核事實從「發現」瀏覽更多內容

17K0

GPT-5.5 Spud 安全評估公開證據核查概念圖 — GPT-5.5 Spud 有冇安全評估？公開證據仍然不足AI 生成概念圖，呈現以文件與安全檢查核查 GPT-5.5 Spud 傳聞。
AI 提示
Create a landscape editorial hero image for this Studio Global article: GPT-5.5 Spud 有冇安全評估？公開證據仍然不足. Article summary: 暫時未見公開可核查、直接命名「GPT 5.5 Spud」的 system card、red team report、Preparedness 或 alignment 文件；最穩陣 verdict 是證據不足，但這不代表 OpenAI 內部一定沒有做評估。. Topic tags: ai, openai, chatgpt, gpt 5, ai safety. Reference image context from search candidates: Reference image 1: visual subject "A man stands on stage presenting the announcement of GPT-5.5, scheduled for release in April 2026, with a large screen behind him displaying the AI model's name and release date." source context "GPT-5.5 Spud 係全新基座模型，定 GPT-5 中途更新？ | 深入研究 | Studio Global" Reference image 2: visual subject "The image features bold text announcing the leak of GPT 5.5 Pro by OpenAI, with handwritten notes saying "This is insane!" and "leaked," alongside a pixelated pixel-art style scene" source context "GPT-5.5 Spud 係全新基座模型，定 GPT-5 中
openai.com

Si GPT-5.5 Spud acaba convirtiéndose en un modelo oficial, la pregunta importante no es solo qué promete hacer, sino qué documentación de seguridad lo respalda. Con las fuentes consultadas, la respuesta más prudente es: no hay pruebas públicas suficientes. OpenAI sí ha publicado información sobre sus prácticas generales de seguridad y alineamiento, y GPT-5 cuenta con una system card y páginas de despliegue de seguridad; pero esos documentos no demuestran por sí mismos que Spud tuviera, antes de una presentación oficial, una evaluación pública específica y verificable.^[4]^[29]^[49]

Veredicto: evidencia pública insuficiente

Las fuentes revisadas permiten afirmar dos cosas. Primero: OpenAI describe procesos generales de seguridad, como el despliegue iterativo, el aprendizaje a partir del uso real y la monitorización posterior al despliegue.^[4] Segundo: la compañía ha publicado documentación formal para GPT-5, incluida una system card y datos en su Deployment Safety Hub.^[29]^[49]

Lo que esas mismas fuentes no permiten afirmar es que GPT-5.5 Spud, como modelo concreto, ya tenga un documento público propio de seguridad, una evaluación Preparedness, un informe de red teaming o una prueba de alineamiento que lo nombre directamente. Tampoco aparece una declaración oficial que diga que Spud queda cubierto por una system card ya publicada de la familia GPT-5.

La distinción importa: no es lo mismo decir que OpenAI tiene procesos de seguridad que decir que un modelo específico ha pasado una evaluación pública determinada.

Qué contaría como una prueba sólida

Para verificar si un modelo nuevo tuvo evaluación de seguridad antes de su anuncio, lo más fuerte sería encontrar alguno de estos materiales:

Una system card oficial del modelo, o una entrada en el OpenAI Deployment Safety Hub, que es el espacio donde OpenAI agrupa system cards y actualizaciones relacionadas.^[28]
Un documento oficial de deployment safety, Preparedness o evaluación de riesgos que nombre a GPT-5.5 Spud.
Un informe externo de red teaming que identifique la versión del modelo, el alcance de las pruebas, la metodología, los fallos encontrados y sus límites.
Un comunicado oficial de OpenAI que explique de forma explícita cómo Spud queda cubierto por una evaluación ya publicada de la serie GPT-5.

En cambio, vídeos de YouTube, conversaciones en Reddit o Facebook, preguntas de mercados de predicción como Manifold, o artículos no oficiales sobre filtraciones pueden ser señales para seguir el rumor, pero no son por sí solos una evaluación de seguridad publicada.^[10]^[11]^[12]^[17]^[37]

Lo que sí se puede confirmar sobre OpenAI

OpenAI afirma que usa despliegues iterativos para entender amenazas a partir del uso real y que sus modelos se apoyan en defensas sistémicas, incluida la monitorización posterior al despliegue.^[4] La empresa también ha publicado materiales sobre red teaming externo y automatizado, y mantiene una OpenAI Red Teaming Network descrita como una comunidad de expertos de confianza y con experiencia para ayudar en la evaluación y mitigación de riesgos.^[45]^[51]

Para lectores menos familiarizados con el término: red teaming, o pruebas de equipo rojo, consiste en intentar forzar un sistema para descubrir fallos, abusos posibles o comportamientos no deseados antes o durante su despliegue.

Ahora bien, incluso ahí hay un matiz clave. En la documentación de OpenAI sobre red teaming externo se indica que los evaluadores pueden llegar a trabajar con modelos previos al despliegue o snapshots, pero también se advierte que los snapshots sin post-entrenamiento normalmente no representan el perfil de seguridad final de un modelo en producción.^[39] Por eso, una referencia a pruebas tempranas, a un nombre interno o a una versión preliminar no basta para concluir que el modelo final haya sido evaluado públicamente.

GPT-5 tiene documentación; Spud no queda cubierto automáticamente

En el caso de GPT-5, la documentación pública es mucho más clara. La página de la GPT-5 System Card de OpenAI afirma que los modelos GPT-5 incorporan safe-completions, un enfoque de entrenamiento de seguridad para evitar contenido no permitido.^[29] Además, la página de GPT-5 en el Deployment Safety Hub incluye evaluaciones y datos de seguridad relacionados con modelos como gpt-5-thinking y gpt-5-main.^[49]

La versión en arXiv de la GPT-5 System Card también recoge que Microsoft AI Red Team concluyó que gpt-5-thinking mostraba uno de los perfiles de seguridad de IA más fuertes entre los modelos de OpenAI.^[24]

El problema es el alcance. Esos documentos nombran GPT-5, gpt-5-thinking, gpt-5-main u otros modelos incluidos en la documentación de GPT-5. En las fuentes revisadas no aparece una equivalencia oficial que diga que GPT-5.5 Spud sea uno de esos modelos o que esté cubierto por la misma evaluación.^[24]^[29]^[49] Por tanto, no conviene usar la system card de GPT-5 como prueba directa de la seguridad de Spud.

Lo que aparece sobre Spud son sobre todo pistas, no documentos de seguridad

Las referencias a Spud en las fuentes disponibles aparecen principalmente en materiales no oficiales o de segunda mano: vídeos de YouTube que hablan de GPT-5.5 Spud como modelo explicado o filtrado; publicaciones y debates en Reddit y Facebook; una pregunta de mercado de predicción en Manifold sobre si OpenAI anunciaría un nuevo modelo frontier mayor que 5.4; y artículos tipo blog o noticia sobre ventanas de lanzamiento, preentrenamiento, pruebas en vivo, especulación de capacidades o supuestas revisiones finales de seguridad.^[10]^[11]^[12]^[13]^[15]^[16]^[17]^[27]^[31]^[32]^[34]^[37]

Incluso cuando un titular afirma que GPT-5.5 Spud ya fue lanzado, o que entró en una revisión final de seguridad, eso no equivale a un artefacto de seguridad verificable. Para que lo fuera, tendría que incluir datos como el modelo exacto, el alcance de las pruebas, la clasificación de riesgos, los resultados de red teaming, los casos fallidos y una conclusión oficial o auditada.^[14]^[27]^[34]

Las pruebas de GPT-5 o gpt-oss no resuelven el caso Spud

También hay fuentes que sí tratan pruebas de seguridad de modelos de OpenAI, pero el objeto de esas pruebas no es GPT-5.5 Spud. Promptfoo y SPLX publican páginas sobre red teaming o seguridad de GPT-5, no de Spud.^[2]^[3] La competición de Kaggle sobre OpenAI gpt-oss-20b, y los resúmenes asociados, se centran en gpt-oss-20b y en evaluación de seguridad de gpt-oss.^[7]^[52]

Esos materiales ayudan a entender cómo se hacen este tipo de pruebas, pero no sirven para demostrar que Spud tuviera una evaluación propia antes de su anuncio. Para eso haría falta que el documento nombrara directamente a GPT-5.5 Spud o que OpenAI explicara oficialmente la relación entre Spud y una evaluación ya publicada.

Matriz de evidencias

Pregunta de verificación	Estado de la evidencia pública	Lectura
¿OpenAI tiene procesos generales de seguridad, alineamiento y red teaming?	Sí. Hay páginas de OpenAI sobre seguridad y alineamiento, red teaming externo y red teaming con personas y sistemas automatizados.^[4]^[39]^[45]^[51]	Hay evidencia suficiente para esa afirmación general.
¿GPT-5 tiene system card o documentación de deployment safety?	Sí. OpenAI publicó una GPT-5 System Card y una página de GPT-5 en el Deployment Safety Hub.^[29]^[49]	Hay evidencia suficiente para GPT-5.
¿Existe una system card oficial de GPT-5.5 Spud antes de su anuncio?	En las fuentes revisadas no aparece una system card oficial de Spud; las menciones proceden sobre todo de vídeos, redes sociales, mercados de predicción o artículos no oficiales.^[10]^[11]^[13]^[15]^[16]^[17]^[27]^[31]^[34]^[37]	No se puede confirmar.
¿La documentación de GPT-5 prueba directamente la seguridad de Spud?	Los documentos disponibles nombran GPT-5, gpt-5-thinking, gpt-5-main u otros modelos de esa documentación, no Spud.^[24]^[29]^[49]	No debe equipararse automáticamente.
¿Hay un informe externo de red teaming específico de Spud?	Hay pruebas y retos relacionados con GPT-5 o gpt-oss, pero no un informe verificable que nombre Spud.^[2]^[3]^[7]^[52]	No se puede confirmar.

Qué información cambiaría el veredicto

La conclusión debería actualizarse si aparece alguno de estos elementos:

Una GPT-5.5 Spud System Card publicada por OpenAI.
Una entrada en el OpenAI Deployment Safety Hub que nombre directamente a GPT-5.5 Spud.^[28]
Un documento oficial de deployment safety, Preparedness o evaluación de riesgos que detalle alcance, categorías de riesgo y limitaciones.
Un informe externo de red teaming con versión del modelo, metodología, pruebas realizadas, fallos observados y límites de la evaluación.
Un comunicado oficial que explique que Spud está cubierto por una system card o evaluación ya publicada de la serie GPT-5.

Hasta que exista algo de ese tipo, presentar los procesos generales de OpenAI como prueba de que Spud ya pasó una evaluación pública sería una extrapolación. La formulación responsable es: OpenAI tiene procesos generales de seguridad, alineamiento y red teaming; GPT-5 tiene documentación pública de seguridad; pero, para GPT-5.5 Spud, las fuentes revisadas no demuestran que haya una evaluación pública, específica y verificable previa a su anuncio.

Dicho de otra forma: evidencia pública insuficiente. Eso no descarta que OpenAI haya realizado trabajo interno no publicado; simplemente significa que ese trabajo, si existe, no puede tratarse como prueba pública citables.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查核事實

重點

La conclusión más prudente es que no hay pruebas públicas suficientes: no aparece una system card, informe de red teaming o evaluación de Preparedness/alineamiento que nombre directamente a GPT 5.5 Spud.
Sí hay evidencia de procesos generales de seguridad, alineamiento y red teaming de OpenAI, y GPT 5 cuenta con documentación oficial en la System Card y el Deployment Safety Hub.[4][29][49]
Las referencias a Spud proceden sobre todo de vídeos, redes sociales, mercados de predicción y artículos no oficiales; sirven como pistas, pero no como prueba de una evaluación formal del modelo.[10][11][17][37]

人們還問

「GPT-5.5 Spud y seguridad: qué se puede comprobar de verdad」的簡短答案是什麼？

首先要驗證的關鍵點是什麼？

接下來在實務上我該做什麼？

Las referencias a Spud proceden sobre todo de vídeos, redes sociales, mercados de predicción y artículos no oficiales; sirven como pistas, pero no como prueba de una evaluación formal del modelo.[10][11][17][37]

接下來我應該探索哪個相關主題？

繼續“Claude Opus 4.7、GPT-5.5、DeepSeek V4、Kimi K2.6：2026 Benchmark 點睇先唔會睇錯”以獲得另一個角度和額外的引用。

開啟相關頁面

我應該將其與什麼進行比較？

對照「DeepSeek V4 唔止 1M context：MoE、長上下文同 API 遷移重點」交叉檢查此答案。

開啟相關頁面

繼續你的研究

Comparativa de benchmarks 2026 entre Claude Opus 4.7, GPT-5.5, DeepSeek V4 y Kimi K2.6

Claude Opus 4.7、GPT-5.5、DeepSeek V4、Kimi K2.6：2026 Benchmark 點睇先唔會睇錯

Claude Opus 4.7 vs GPT-5.5 vs DeepSeek V4 vs Kimi K2.6：2026 Benchmark 實證比較

DeepSeek V4 工程架构示意图，包含 1M 上下文、MoE 专家路由和 API 服务化元素

DeepSeek V4 唔止 1M context：MoE、長上下文同 API 遷移重點

Northwest vs Southeast Timber：替代性越高，點解係 larger; larger？

Northwest 與 Southeast Timber：替代性高，點解兩格都填 larger？

抽象 AI 晶片與多個聊天機器人平台競爭的示意圖，象徵 DeepSeek 挑戰 OpenAI、Claude、Gemini 與 Grok

DeepSeek 會唔會打低 OpenAI、Claude、Gemini、Grok？真正關鍵係成本同信任

DeepSeek 會唔會打低 OpenAI、Claude、Gemini、Grok？

研究對話

你2026年4月21日

研究問題

資料搜集及事實核查：如果 GPT-5.5 Spud 真係推出，正式公布前有冇任何安全評估、紅隊測試或者對齊證據？

Studio Global AI2026年4月21日40 來源

引用的答案

就公開可核查材料而言，我嘅結論係：Insufficient evidence。OpenAI 確實有公開講自己會做外部 red teaming，同埋用迭代部署去累積 safety／alignment 經驗；對已正式發布嘅 GPT-5，亦有 system card 同 deployment safety 資料可查。^[2]^[3]^[7]^[12] 但我未見到任何喺正式公布前、直接對應「GPT-5.5 Spud」嘅官方 system card、紅隊報告、Preparedness 評估或者 alignment 證據。^[2]^[3]^[7]^[12]

Key findings

OpenAI 官方 white paper 寫明，佢自 DALL-E 2 起已對 frontier model deployments 做 external red teaming，並且過往已為 GPT-4、GPT-4o、o1 等模型公開 system cards 或相關風險評估資料。^[3]
對 GPT-5 本身，OpenAI 有正式安全文件：官方 system card 頁面列出 safe-completions、Preparedness Framework safeguard，同連到 deployment safety data；arXiv 版 system card 仲提到 Microsoft AI Red Team 認為 gpt-5-thinking 係 OpenAI 模型之中安全表現最強之一。^[1]^[2]^[7]
我搵到關於「Spud」嘅公開頁面，主要都係非官方整理、消息文或者預測文，重點放喺 pretraining、release window、live testing 或 capability 猜測，而唔係附帶可驗證嘅 safety artifact。^[9]^[11]^[13]^[15]^[16]
換句話講，公開層面我見到嘅係「OpenAI 一般有安全流程」同「GPT-5 有正式安全文件」，但唔係「GPT-5.5 Spud 在正式公布前已有公開、可核實嘅 Spud-specific 安全證據」。^[2]^[3]^[7]^[12]

Evidence notes

要分清兩件事：第一，OpenAI 作為公司有冇一般性安全／對齊做法；第二，Spud 呢個特定型號喺公布前有冇公開證據。前者有官方材料支持，後者我未見到同名、可直接核驗嘅文件。^[3]^[12]
GPT-5 嘅 system card 不能自動當成 GPT-5.5 Spud 嘅證據，除非 OpenAI 之後正式講明兩者關係，或者另外發出新 system card／Preparedness addendum。^[1]^[2]^[7]

Limitations / uncertainty

呢個結論只針對「正式公布前、公開可驗證」嘅材料；唔排除 OpenAI 內部其實有做安全評估或紅隊，只係未公開。^[3]^[12]
如果之後 OpenAI 發布 system card、Deployment Safety Hub 頁面、Preparedness 文件，或者第三方獨立紅隊報告，結論可能會改變。^[2]^[3]^[7]

Summary

目前最穩陣嘅說法係：OpenAI 一般有 safety／red-team／alignment 流程，GPT-5 亦有公開文件；但對「GPT-5.5 Spud」而言，我暫時未搵到正式公布前已公開、可直接驗證嘅安全評估、紅隊測試或對齊證據，所以答案係 Insufficient evidence。^[2]^[3]^[7]^[12]

如果你想，我下一步可以幫你做一份更硬核嘅「證據清單」，分開列出「官方一手」「二手報道」「純推測／傳聞」三欄，方便你之後引用。

來源

[2] GPT-5 Security Report - AI Red Teaming Results | Promptfoopromptfoo.dev
Tests handling of WMD-related content. Tests handling of child exploitation content. Tests handling of cybercrime-related content. Tests handling of graphic or violent content. Tests handling of methamphetamine-related content. Tests handling of weapons-rel...
[3] GPT-5 Under Fire: Red Teaming OpenAI's Latest Model ...splx.ai
GPT-5 Under Fire: Red Teaming OpenAI’s Latest Model Reveals Surprising Weaknesses. SPLX Prompt Hardening brings GPT-5 to enterprise-grade safety levels — especially for Business Alignment and Security. 3. Hardened Prompt (SPLX SP): Our Prompt Hardening engi...
[4] How we think about safety and alignment | OpenAIopenai.com
Such iterative deployment helps us understand threats from real world use⁠ and guides the research for the next generation of safety measures, systems, and practices. Our models are supported by complementary systemic defenses: continuous monitoring post-de...
[7] Safety evaluation competition on OpenAI gpt-oss concluded | Nils Durner’s Blogndurner.github.io
Safety evaluation competition on OpenAI gpt-oss concluded. The Kaggle safety evaluation “red-teaming” challenge on OpenAI gpt-oss has concluded with a workshop symposium this week. Sculley, our host and OpenAI researcher focused on responsible and reliable...
[10] GPT-5.5 “Spud” Explained – The Truth Behind OpenAI’s Next Big Modelyoutube.com
. []( "Share link")- [x] Include playlist. . 26:15 Can you steal $10,000 from a locked iPhone?Veritasium 1.3M views • 11 hours ago Live Playlist ()Mix (50+)42:38 Why Chinese AI Is Suddenly So Good (ft. DeepSeek, SeeDance 2.0) AB Explained Asian Boss 345K vi...
[11] OpenAI Just Leaked GPT 5.5 SPUD The Most Powerful AI Yet?youtube.com
OpenAI Just Leaked GPT 5.5 SPUD The Most Powerful AI Yet?. 13:17 OpenAI Just Dropped The Real Plan After AGI Hits AI Revolution 15K views • 11 hours ago Live Playlist ()Mix (50+)7:50 Claude’s New AI Just Changed the Internet Forever Nate Herk AI Automation...
[12] Brian Hanson - GPT-5.5 “Spud” coming soon… • New...facebook.com
OpenAI confirms GPT-5 is coming. With training already underway, this model promises to take artificial intelligence to a new level.
[13] GPT-5.5 Spud and GPT Image 2: Complete Guide to OpenAI Next Models in 2026pasqualepillitteri.it
GPT-5.5 Spud and GPT Image 2: Complete Guide to OpenAI Next Models in 2026. Complete guide to GPT-5.5 Spud and GPT Image 2: everything about release date (ChatGPT 5.5 release date), capabilities, benchmarks, competitor comparison and how to test upcoming Op...
[14] GPT-5.5 Spud Released: Mid-Tier Model with Enhanced Efficiencyaiindigo.com
GPT-5.5 Spud Released: Mid-Tier Model with Enhanced Efficiency. GPT-5.5 Spud Released: Mid-Tier Model with Enhanced Efficiency. OpenAI releases GPT-5.5 codenamed Spud, a mid-tier model positioned between GPT-4o and GPT-5. GPT-5.5 Spud Released: Mid-Tier Mod...
[15] GPT-5.5 Spud: Everything About OpenAI Next Frontier Modelpasqualepillitteri.it
GPT-5.5 Spud: Everything About OpenAI Next Frontier Model. GPT-5.5 Spud is OpenAI next frontier model: pretraining complete, Q2 2026 release expected. GPT-5.5 , code-named "Spud" , is the next frontier model from OpenAI. GPT-5.5 Spud OpenAI next AI model le...
[16] OpenAI Spud: GPT-5.5 Pretraining Done, April Release Likely | Abhishek Gautamabhs.in
OpenAI Spud: GPT-5.5 Pretraining Done, April Release Likely. Improved tool use : GPT-5's function calling and tool use is good; Spud's is reportedly meaningfully better on multi-step tool chains — the specific capability that agentic frameworks like LangCha...
[17] Will OpenAI announce a new full-size, frontier model >5.4 before May 1, 2026? (aka “Spud”) | Manifoldmanifold.markets
Title: Will OpenAI announce a new full-size, frontier model 5.4 before May 1, 2026? (aka “Spud”) Manifold Will OpenAI announce a new full-size, frontier model 5.4 before May 1, 2026? Resolves YES if OpenAI officially announces a new frontier-class model wit...
[24] GPT-5 System Cardarxiv.org
The Microsoft AI Red Team concluded that the gpt-5-thinking model exhibits one of the strongest AI safety profiles among OpenAI's models—on par with or better
[27] OpenAI's ChatGPT 5.5 Enters Final Safety Review With April Release Windowanalyticsinsight.ae
OpenAI's ChatGPT 5.5 Enters Final Safety Review With April Release Window. ChatGPT 5.5 Spud Near Launch With Multimodal Upgrade and Early April Release Speculation. The competition in the AI race has intensified with a focus on redefined baselines instead o...
[28] OpenAI Deployment Safety Hub: System cards & other updatesdeploymentsafety.openai.com
GPT-5.4 Thinking System Card. GPT-5.4 Thinking is the latest reasoning model in the GPT-5 series, and explained in our blog. GPT-5.3 Instant System Card. As described in our blog , GPT-5.3 Instant responds faster,…Feb 05, 2026. GPT-5.3-Codex System Card. Ad...
[29] GPT-5 System Card - OpenAIopenai.com
All of the GPT‑5 models additionally feature safe-completions, our latest approach to safety training to prevent disallowed content. Similarly
[31] Leak: OpenAI's Next Model Just Went Live (Launch Could Be Days Away) — LumiChats Bloglumichats.com
It launched powered by GPT-5.4, but Spud is the model expected to take it to the next level — intent-aware reasoning inside a unified workspace is a fundamentally different product than what anyone has today. GPT-5.4 Current OpenAI flagship — available now...
[32] OpenAI Spud: They Killed Sora for This | FindSkill.ai — Learn AI for Your Jobfindskill.ai
OpenAI shut Sora to free GPUs for Spud — a model Altman says can 'accelerate the economy.' Facts, speculation, and what ChatGPT users should expect. On March 24, The Information reported that OpenAI finished pretraining a new AI model codenamed “Spud.” In t...
[34] OpenAI GPT-5.5 LEAKED: Roman City 3D Render Stunsintheworldofai.com
Codenamed Spud, shipping as GPT-5.5, the model has been in safety evaluation since March 24 and is expected to release any day now. Sam
[37] The Spud Leaks & The New Frontier of Omnimodal AI. : r/ChatGPTreddit.com
Skip to main contentGPT-5.5: The Spud Leaks & The New Frontier of Omnimodal AI. Open menu Open navigation[]( to Reddit Home. Get App Get the Reddit app Log InLog in to Reddit. Go to ChatGPT. [r/ChatGPT]…
[39] [PDF] OpenAI's Approach to External Red Teaming for AI Models and ...cdn.openai.com
Table 2: Pros and cons of diﬀerent types of model access for red teamers Type of Access Advantages Disadvantages Pre-deployment models or snapshots without mitigations Might inform earliest rounds of post-training, understanding initial nascent capabilities...
[45] Advancing red teaming with people and AI - OpenAIopenai.com
Two new papers show how our external and automated red teaming efforts are advancing to help deliver safe and beneficial AI.
[49] GPT-5 System Card - OpenAI Deployment Safety Hubdeploymentsafety.openai.com
We first evaluate the factual correctness of gpt-5-thinking and gpt-5-main on prompts representative of real ChatGPT production conversations, using an LLM-based grading model with web access to identify major and minor factual errors in the assistant’s res...
[51] OpenAI Red Teaming Networkopenai.com
The OpenAI Red Teaming Network is a community of trusted and experienced experts that can help to inform our risk assessment and mitigation efforts.
[52] Red‑Teaming Challenge - OpenAI gpt-oss-20b | Kagglekaggle.com
Description · Safety testing is at the heart of progress in AI. · gpt-oss-20b is an ideal target to push forward state of the art in red-teaming.