Claude Opus 4.7 vs GPT-5.5 vs DeepSeek V4 vs Kimi K2.6：基準測試怎麼看？ | 深度研究