GPT-5.5はどれくらい強い？公開ベンチマークで見る実力と弱点 | Answer