Claude Mythos Benchmarks: Die wichtigsten Scores und ihre Grenzen | Answer