GPT-5.5、Claude Opus 4.7、DeepSeek V4 与 Kimi K2.6：公开基准测试怎么读 | Deep Research