GPT-5.5 有多強？公開基準測試看懂優勢與短板 | 答案