GPT-5.5 vs. Claude Opus 4.7, DeepSeek V4 und Kimi K2.6 im Benchmark-Vergleich | Deep Research