Claude Opus 4.7, GPT-5.5, DeepSeek V4 и Kimi K2.6: что показывают бенчмарки | Глубокие исследования