Самый надёжный подход — выбирать модель под задачу и проверять её на одном и том же промпте.
По открытым публикациям, три модели семейства GPT 4.1 могут обрабатывать до 1 млн токенов контекста; такие окна называют пригодными для крупных документов и больших кодовых баз.[5][6]