GPT-5.5, Claude Opus 4.7, DeepSeek V4 e Kimi K2.6: o que os benchmarks permitem concluir | Pesquisa Profunda