Welche KI führt 2026? Benchmark‑Vergleich von GPT‑5.5, Claude Opus 4.7, Gemini 3.5 Flash, Grok 4.3 und DeepSeek V4 | Deep Research