GPT-5.5、Claude Opus 4.7、Kimi K2.6、DeepSeek V4 基準測試比較 | Deep Research