GPT-5.5、Claude Opus 4.7、DeepSeek V4、Kimi K2.6をベンチマークで比較 | Deep Research