studioglobal
熱門發現
答案已發布7 來源

Claude Opus 4.7 升級指南:轉模型前必查 7 個 workflow 風險

由 Claude Opus 4.6 升 Opus 4.7,Files API、PDF、vision、prompt caching、1M context 等主要能力通常唔使重做;高風險位係舊 workflow 有冇綁死已變更嘅 API 控制、token 估算同 tool/agent 規則。若由更舊版本升級,仲要另外比對原模型差異。[15] 最高優先級係移除舊式 budget tokens extended thinking;Anthropic 指 Opus 4.7 或之後唔再支援,會回 400,應改用 adaptive thinking。[15] 成本要重跑 benchmark:Opus 4.7 新 tokenizer 處理文字...

17K0
開發者檢查 Claude Opus 4.7 遷移 workflow、API 參數與 token 成本的抽象示意圖
Claude Opus 4.7 遷移指南:升級前最該檢查的 workflowAI 生成的 Claude Opus 4.7 workflow 遷移檢查示意圖。
AI 提示

Create a landscape editorial hero image for this Studio Global article: Claude Opus 4.7 遷移指南:升級前最該檢查的 workflow. Article summary: 從 Claude Opus 4.6 升到 Opus 4.7 通常不必重寫整套 workflow;Anthropic 表示 1M context window、128k max output、prompt caching、Files/PDF/vision/tools 等主要能力仍延續,但 API 控制與成本估算要重新校準。[15]. Topic tags: ai, anthropic, claude, agents, prompt engineering. Reference image context from search candidates: Reference image 1: visual subject "Claude Opus 4.7: Benchmarks, Breaking Changes, Migration Guide. Claude Opus 4.7 ships 87.6% on SWE-bench Verified, a new tokenizer, xhigh effort, and four API breaking changes. Ant" source context "Claude Opus 4.7: Benchmarks, Breaking Changes, Migration Guide | Rabinarayan Patra" Reference image 2: visual subject "# The Ultimate Guide to Claude Opus 4.7. ### What changed, the 10 migration moves, and 10 highest-ROI levers to keep costs down. Anthropic sh

openai.com

如果你而家用緊舊版 Claude,尤其係由 Claude Opus 4.6 搬去 Opus 4.7,最容易中伏嘅位,通常唔係 prompt 一夜之間全部壞晒,而係舊 workflow 將關鍵控制收埋喺 API 參數、token 預算、tool-use policy 或 provider gateway 映射入面。Anthropic 嘅遷移文件指,Opus 4.7 延續 Opus 4.6 嘅主要平台能力,但遷移時要處理 thinking configuration、sampling-parameter removal、task budgets 同 tokenization 等變更。[15][26]

本文以 Anthropic 文件明確講嘅 Opus 4.6 → Opus 4.7 遷移為基準;如果你係由更舊 Claude model 升級,可以用呢份清單做回歸測試起點,但仍要另行比對原本模型版本差異。[15]

先搞清楚:你用緊邊類 Claude workflow?

升級工作量取決於你點用 Claude。人手聊天、寫文件,多數係做 prompt 回歸測試;但 API、RAG(檢索增強生成,即先查資料再生成)、agent、coding 或 vision workflow,就要仔細查參數、工具規則同成本模型。[1][4][15][26][27]

使用方式升級前最應該 check
手動聊天、文件草稿、知識工作常用 prompt、語氣、輸出格式、引用同工具使用規則
Messages API / SDKmodel ID、thinking 設定、sampling 參數、token counting、錯誤處理
Tool use / RAG / web search幾時一定要查工具、幾時唔可以估、工具失敗點 fallback
長任務 agent / coding agenteffort、task budget、token budget、延遲同 regression eval
圖片、截圖、PDF、computer-use workflow影像解析度、downsample policy、token 成本同視覺辨識質素

1. 第一個 breaking change:extended thinking 要改 adaptive thinking

唔好一開始就只改 prompt。先掃 API 設定。Anthropic 指,開發者可以透過 Claude API 使用 claude-opus-4-7;如果你嘅 app 係硬編 model ID,應該先放入小流量測試或 shadow eval。[10]

更關鍵係 thinking 設定。Anthropic migration guide 明確寫到,Claude Opus 4.7 或之後唔再支援舊式 extended thinking 入面嘅 budget_tokens 設定,而且會回 400 error;遷移方向係改用 adaptive thinking。[15]

實務上,先做三件事:

  • 全文搜尋程式碼、SDK wrapper、prompt runner、內部平台設定入面嘅 budget_tokens
  • 移除舊式 extended thinking 設定,改用你所用 API 或 provider 支援嘅 adaptive thinking 設定。[15]
  • 唔好再將固定 thinking token budget 當成主要控制器;改用文件支援嘅 effort、task budget、prompt 約束同 eval 去校準任務深度。[26][27]

Anthropic 嘅 prompting best practices 亦將 effort levels、task budgets、thinking configuration、sampling-parameter removal 同 tokenization,列為由 Opus 4.6 遷移到 Opus 4.7 時要留意嘅 API 變更。[26]

2. Sampling 參數移除後,控制要搬返去 prompt 同 eval

如果舊 workflow 依賴 temperaturetop_ptop_k 去控制創意度、穩定度、輸出差異,升級時就要重新設計。Anthropic prompting 文件將 sampling-parameter removal 列入 Opus 4.7 遷移注意事項;OpenRouter 嘅 Claude 4.7 migration guide 亦列出 sampling parameters removed、adaptive-only thinking 同 provider-specific effort 行為。[26][14]

受影響嘅常見任務包括:

  • 創意寫作、廣告文案:以前可能靠較高 sampling 產生更發散版本。
  • 客服、合規、資料抽取:以前可能靠較低 sampling 追求穩定。
  • 批次生成:以前可能用 sampling 參數控制多樣性。

升級後,比較穩陣嘅做法係將規則寫返入 prompt 同 eval:清楚定義語氣、格式、禁止事項同成功標準;用 few-shot 例子固定輸出風格;對抽取、分類、報告產生用結構化輸出要求;再將舊版 Claude 嘅 golden examples 變成 regression eval,逐題比較 Opus 4.7 嘅格式遵循、正確率、成本同延遲。[26]

3. Tool use:將幾時查工具寫成明確 policy

如果舊 workflow 只係俾 Claude 一個寬鬆目標,等模型自己判斷幾時查工具,升級時最值得補強嘅就係 tool policy。Anthropic prompting best practices 指,Claude 最新模型受訓於精準跟指令,而且會受益於明確要求使用特定工具;同一份文件亦建議將 adaptive thinking 用於 multi-step tool use、complex coding tasks 同 long-horizon agent loops 等 agentic workload。[1]

可以將以下規則直接寫入 system prompt 或工作流 policy:

  • 涉及即時資訊、價格、政策、版本差異或外部文件時,必須先用指定查詢工具。
  • 內部 knowledge base 冇答案時,必須講明無法確認,不可以估。
  • 工具結果互相矛盾時,先列出衝突,再俾保守結論。
  • 最終答案要分清楚邊啲資訊來自工具結果,邊啲係模型推論。

呢一步通常比單純換 model ID 更重要,因為 tool policy 會直接影響 agent 會唔會漏查資料、資料不足時會唔會亂估,以及工具結果衝突時會唔會過度自信。[1]

4. 長任務 agent:成本要用 effort 同 task budget 去諗

Opus 4.7 其中一個遷移重點係長任務同 agentic workflow 嘅預算控制。Anthropic 文件指,Opus 4.7 introduces task budgets;官方文件亦講到,effort 參數可以喺能力、速度同 token spend 之間取捨,而 task budget 會俾 Claude 對整體任務可用 token 有概略估計。[4][27]

如果你嘅 workflow 係 coding agent、research agent、browser agent、長時間資料處理或多工具 loop,建議將 budget 分成三層:

  • 單次回覆 budget:最終輸出可以用幾多 token。
  • 推理與工具 budget:多步驟任務入面,模型可以投入幾多 reasoning、tool calls 同 tool results。
  • 任務級 budget:整段 agent loop 嘅成本同延遲上限。

唔好只用最終輸出上限去估整段 agent loop 成本。長任務成本可能來自多次工具查詢、工具結果回灌、圖片或 PDF 解析、重試同最終輸出;Opus 4.7 嘅 task budgets 同新 tokenizer,都令呢件事更需要重新 benchmark。[4][27]

5. Token、RAG、cache 同 batch:全部要重跑 benchmark

呢個係最容易被低估嘅遷移位。Anthropic 文件指,Opus 4.7 新 tokenizer 處理文字時,可能會比前代模型使用約 1x 到 1.35x token;/v1/messages/count_tokens 對 Opus 4.7 回傳嘅 token count 亦會同 Opus 4.6 唔同,Anthropic 建議用呢個 endpoint 重新估算。[4]

升級前應該重測:

  • RAG chunk size 同 overlap。
  • 長文件截斷門檻。
  • conversation memory 長度。
  • prompt caching 命中率同成本預估。
  • batch job 成本上限。
  • agent 每輪工具結果可以回灌幾大。
  • 圖片同 PDF 預處理策略。

如果舊 workflow 已經貼近成本上限或 context limit,千祈唔好直接沿用舊版 token 估算。先用核心 prompt、長文件樣本同高流量任務跑 token benchmark,再決定要唔要調整 chunking、截斷或 cache key 設計。[4]

6. 圖片、截圖同 PDF:前處理規則要重新定

Opus 4.7 文件提到 high-resolution image support;官方文件亦提醒,如果唔需要額外影像保真度,應該喺送入 Claude 之前先 downsample,以避免 token 使用增加。[4][27]

呢點會影響三類 workflow:

  • 截圖理解:例如 UI QA、表格截圖、dashboard 分析。
  • 文件影像處理:例如掃描 PDF、合約截圖、簡報頁面。
  • computer-use / browser automation:例如模型要理解畫面位置、按鈕、表單同錯誤訊息。

由 Opus 4.6 升上去時,PDF 同 vision 能力本身仍然係 Anthropic 列出嘅同一組主要平台能力;真正要重測嘅係送幾大張圖、係咪需要高解析度,以及 downsample 之後關鍵文字同 UI 元件仲認唔認到。[15][27]

7. Provider 或內部 gateway:唔好假設參數映射一樣

如果你唔係直接打 Anthropic API,而係經 OpenRouter、雲端平台或內部 gateway 叫 Claude,就唔可以假設欄位名稱、忽略規則同 effort 行為完全相同。OpenRouter 嘅 Claude 4.7 migration guide 就單獨列出 sampling parameters removed、adaptive-only thinking 同 provider-specific effort 行為。[14]

所以,除咗睇 Anthropic 文件,亦要睇你實際 provider 嘅 migration note。特別係多模型 router、fallback gateway、內部 prompt 平台,經常會將上游 API 參數包成自己嘅欄位;升級時要確認邊啲欄位仍然有效、邊啲會被忽略、邊啲會直接導致錯誤。[14]

邊啲通常唔使大改?

如果你係由 Opus 4.6 升到 Opus 4.7,平台能力唔係成套翻新。Anthropic migration guide 表示,Opus 4.7 支援同 Opus 4.6 相同嘅主要功能集合,包括 1M token context window、128k max output tokens、adaptive thinking、prompt caching、batch processing、Files API、PDF support、vision,以及完整 server-side / client-side tools。[15]

換句話講,第一優先通常唔係重寫以下基建:

  • Files API 同文件上傳流程。
  • PDF / vision 能力是否存在。
  • prompt caching 或 batch processing 是否可用。
  • 工具呼叫能力本身。
  • 長 context 能力本身。

真正要重校嘅係你點控制呢啲能力:幾時用工具、花幾多 token、用幾高 effort、圖片送幾大,以及失敗時點 fallback。[1][4][15][27]

實際遷移 checklist

可以將呢份清單交俾工程、AI platform owner 或負責 Claude workflow 嘅團隊,用嚟快速搵高風險位。

API 同參數

  • 將模型名稱切換到 claude-opus-4-7,並先做小流量或 shadow eval;Anthropic 指開發者可透過 Claude API 使用呢個 model ID。[10]
  • 搜尋 thinkingbudget_tokens 同舊式 extended thinking wrapper,改成 adaptive thinking;Opus 4.7 或之後唔支援舊設定,會回 400。[15]
  • 搜尋 temperaturetop_ptop_k 等 sampling 控制,改用 prompt、few-shot、schema 同 eval 管理穩定性。[26]
  • 如果經 OpenRouter 或其他代理層使用 Claude,另查該 provider 嘅 Claude 4.7 migration guide 同參數映射。[14]

Prompt 同 tool use

  • 將幾時必須用工具寫入 system prompt;Anthropic 文件指最新 Claude 模型受益於明確 tool-use 指示。[1]
  • 寫清楚幾時唔可以估答案,以及資料不足時要點答。
  • 寫清楚工具結果衝突、工具失敗、外部資料不足時嘅 fallback 行為。
  • 對資料抽取、分類、報告產生等 workflow 加結構化輸出格式。

Agent 同 coding workflow

  • 對 coding agent、research agent、browser agent 重新校準 effort 同任務預算;Anthropic 文件將 adaptive thinking 同 multi-step tool use、complex coding tasks、long-horizon agent loops 連埋一齊討論。[1]
  • 評估係咪使用 task budgets;Opus 4.7 文件列出 task budgets,亦提醒 token counting 會同前代唔同。[4]
  • 唔好只用最終輸出上限估整段 agent loop 成本;工具呼叫、工具結果、重試同最終輸出都要入成本模型。[4][27]
  • 用舊版 Claude 成功案例建立 regression eval,比較 Opus 4.7 嘅成功率、格式遵循、延遲同成本。

Token、文件同影像

  • /v1/messages/count_tokens 重新估算核心 prompt、RAG chunks、長文件同批次任務成本。[4]
  • 重測 chunk size、截斷門檻、conversation memory 同 prompt caching 策略。[4]
  • 對圖片、截圖同 PDF 頁面建立 downsample policy;唔需要高保真時先降低解析度,以控制 token 使用。[27]

建議升級順序

最穩陣嘅做法唔係一次過全面替換,而係分四步:

  1. 靜態掃描:搵出 model ID、thinking、sampling、token counting、image preprocessing 同 provider-specific 參數。
  2. 小流量 eval:用現有 golden set 比較舊版 Claude 同 Opus 4.7 嘅輸出質素、格式遵循、tool use、成本同延遲。
  3. 重寫高風險 prompt:優先處理 tool use、RAG、coding agent、資料抽取同合規任務。
  4. 逐步放量:監控 token 使用、工具呼叫次數、錯誤率、延遲同人工回報。

一句講晒:由舊版 Claude 搬到 Opus 4.7,核心唔係將 prompt 全部推倒重寫,而係將舊 workflow 入面隱藏嘅控制邏輯顯性化。thinking 改 adaptive,sampling 改由 prompt 同 eval 控制,長任務改用 budget 思維,圖片同 token 成本重新 benchmark;咁樣升級風險最低,亦最容易保留舊 workflow 嘅可控性。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查核事實

重點

  • 由 Claude Opus 4.6 升 Opus 4.7,Files API、PDF、vision、prompt caching、1M context 等主要能力通常唔使重做;高風險位係舊 workflow 有冇綁死已變更嘅 API 控制、token 估算同 tool/agent 規則。若由更舊版本升級,仲要另外比對原模型差異。[15]
  • 最高優先級係移除舊式 budget tokens extended thinking;Anthropic 指 Opus 4.7 或之後唔再支援,會回 400,應改用 adaptive thinking。[15]
  • 成本要重跑 benchmark:Opus 4.7 新 tokenizer 處理文字時可能用約 1x–1.35x token;Anthropic 建議用 /v1/messages/count tokens 重新估算。[4]

人們還問

「Claude Opus 4.7 升級指南:轉模型前必查 7 個 workflow 風險」的簡短答案是什麼?

由 Claude Opus 4.6 升 Opus 4.7,Files API、PDF、vision、prompt caching、1M context 等主要能力通常唔使重做;高風險位係舊 workflow 有冇綁死已變更嘅 API 控制、token 估算同 tool/agent 規則。若由更舊版本升級,仲要另外比對原模型差異。[15]

首先要驗證的關鍵點是什麼?

由 Claude Opus 4.6 升 Opus 4.7,Files API、PDF、vision、prompt caching、1M context 等主要能力通常唔使重做;高風險位係舊 workflow 有冇綁死已變更嘅 API 控制、token 估算同 tool/agent 規則。若由更舊版本升級,仲要另外比對原模型差異。[15] 最高優先級係移除舊式 budget tokens extended thinking;Anthropic 指 Opus 4.7 或之後唔再支援,會回 400,應改用 adaptive thinking。[15]

接下來在實務上我該做什麼?

成本要重跑 benchmark:Opus 4.7 新 tokenizer 處理文字時可能用約 1x–1.35x token;Anthropic 建議用 /v1/messages/count tokens 重新估算。[4]

接下來我應該探索哪個相關主題?

繼續“Claude Security 公測版:Anthropic 點樣用 AI 幫企業掃 code 漏洞”以獲得另一個角度和額外的引用。

開啟相關頁面

我應該將其與什麼進行比較?

對照「xAI Grok 4.3 API 解讀:1M context、低 token 價與語音平台野心」交叉檢查此答案。

開啟相關頁面

繼續你的研究

研究對話

研究問題

搜尋並查核事實:如果我原本就在用舊版 Claude,搬到 Opus 4.7 需要調整哪些 workflow?

Studio Global AI28 來源

引用的答案

如果你是從 Claude Opus 4.6 搬到 Opus 4.7,workflow 不用整套重寫,但要重點調整 4 類:thinking 設定、抽樣參數、成本/Token 預估、以及 tool/agent prompt 寫法。Anthropic 官方也說,既有的 Opus 4.6 prompts 和 evals 通常應該能有不錯的開箱表現;若你用的是 Claude Managed Agents,除了改 model name 外基本不用改。[8]

  • 先分清你是哪種用法:
    如果你用的是 Claude Managed Agents,官方說除了把模型名稱換成 claude-opus-4-7 之外,不需要額外改動。[8]
    如果你是自己調 Messages API、工具呼叫、agent loop,那就要檢查下面幾項。[8]

  • 把「extended thinking 預算」改成「adaptive thinking + effort」:
    Opus 4.7 之後不再支援舊的

    thinking: {type: "enabled", budget_tokens: ...}
    ;Anthropic 要你改用
    thinking: {type: "adaptive"}
    ,再用 output_config.effort 控制思考深度。[8]
    這代表你的 workflow 不應再靠固定 thinking token budget 來調參,而是改成用 effort 檔位和 prompt 校準「思考夠不夠深」。[8][10]

  • 如果你以前靠 temperature / top_p / top_k 調風格,要重做生成控制:
    Anthropic 的遷移指南把 sampling parameter removal 列為 Opus 4.7 的 breaking change。[8]
    實務上,原本靠抽樣參數控制創意、穩定度、一致性的 workflow,應改成更明確的 system prompt、few-shot 範例、結構化輸出要求,以及 eval 回歸測試。[10]

  • Prompt 要寫得更明確,尤其是 tool use:
    Anthropic 的 prompting best practices 明確寫到,最新 Claude 模型更精準遵循指令,而且「受益於明確要求它使用特定工具」。[10]
    所以如果你舊 workflow 是「給個寬鬆目標,讓模型自己決定怎麼做」,搬到 4.7 最值得補強的是:何時必須查工具、何時先思考再查、哪些情況禁止直接猜答案。[10]

  • 長任務 agent 要改成「effort/預算驅動」而不是只看 max_tokens
    Opus 4.7 新增 task budgets(beta),讓模型知道整個 agentic loop 可用多少 token,範圍包含 thinking、tool calls、tool results 和 final output。[11]
    Anthropic 也特別說,task budget 比較適合要控成本或延遲上限的 agent workflow;如果是開放式、品質優先的任務,反而不要設 task budget。[11]

  • 成本與 chunking 要重跑一次:
    Anthropic 說 Opus 4.7 的新 tokenizer 在處理文字時,可能會比前代模型用到大約 1x 到 1.35x 的 token,並建議用 /v1/messages/count_tokens 重新估算。[11]
    所以你原本的分段大小、截斷門檻、快取命中預估、成本警戒值,都應重新 benchmark 一次。[11]

  • 若你做 coding / agentic workflow,effort 預設值要拉高:
    Anthropic 在「What’s new」裡新增 xhigh effort,並建議 coding 與 agentic use cases 從 xhigh 開始;多數 intelligence-sensitive 任務至少用 high[11]
    也就是說,舊版如果你用低思考成本換速度,搬到 4.7 時最好把這件事明確變成 profile,而不是沿用同一組預設值。[11]

  • 如果你有 screenshot / 文件 / computer-use workflow,影像前處理要重設:
    Opus 4.7 支援更高解析度影像,最大到 2576px / 3.75MP,高於先前 1568px / 1.15MP;而且座標是 1:1 pixel 對應,對 screenshot 與 computer use 特別有利。[11]
    但官方同時提醒,高解析度會增加 token 消耗;不需要高保真時應先 downsample。[11]

  • 不用動太多的地方:
    從 4.6 升上來時,1M context window、128k max output、prompt caching、batch、Files API、PDF、vision 和整套工具能力都還在,平台能力沒有整個翻盤。[8][11]

我會把它濃縮成一個實際遷移清單:

  • 把 model ID 換成 claude-opus-4-7[8]
  • 搜尋程式碼中所有 thinking.enabled / budget_tokens,改成 adaptive thinking + effort。[8]
  • 搜尋所有 non-default temperature / top_p / top_k,移除並改用 prompt/eval 控制。[8][10]
  • 重寫 tool policy:把「何時必用工具、何時不能猜」寫進 system prompt。[10]
  • 重新跑 token/cost benchmark,特別是 chunk size、圖片大小、長任務成本。[11]
  • 對 coding/agent 用例重新校準 effort,先測 highxhigh[11]
  • 對長流程 agent,決定要不要引入 task budgets。[11]

如果你願意,我下一步可以直接幫你整理成一份「從舊版 Claude 升到 Opus 4.7 的 workflow diff checklist」,分成「聊天型工作流 / API 工作流 / agent 工作流」三份。

來源

  • [1] Prompting best practices - Claude API Docsdocs.anthropic.com

    Claude's latest models are trained for precise instruction following and benefit from explicit direction to use specific tools. Claude's latest models offer thinking capabilities that can be especially helpful for tasks involving reflection after tool use o...

  • [4] What's new in Claude Opus 4.7platform.claude.com

    Claude Opus 4.7 introduces task budgets. This new tokenizer may use roughly 1x to 1.35x as many tokens when processing text compared to previous models (up to 35% more, varying by content), and /v1/messages/count tokens will return a different number of tok...

  • [10] Introducing Claude Opus 4.7 - Anthropicanthropic.com

    Skip to main contentSkip to footer. Developers can use claude-opus-4-7 via the Claude API. . . ![Image 9: logo](

  • [14] Claude 4.7 Migration Guide | OpenRouter | OpenRouter | Documentationopenrouter.ai

    Migrate to Claude 4.7 Opus — sampling parameters removed, adaptive-only thinking, and new xhigh effort level. 2. Adaptive-only thinking — thinking.budget tokens is no longer supported; reasoning.effort and reasoning.max tokens are ignored (adaptive thinking...

  • [15] Migration guide - Claude API Docsplatform.claude.com

    It supports the same set of features as Claude Opus 4.6, including the 1M token context window at standard API pricing with no long-context premium, 128k max output tokens, adaptive thinking, prompt caching, batch processing, the Files API, PDF support, vis...

  • [26] Prompting best practices - Claude API Docsplatform.claude.com

    For API parameter changes when migrating from Claude Opus 4.6 (effort levels, task budgets, thinking configuration, sampling-parameter removal, and tokenization), see the migration guide. 4. Update thinking configuration : Claude 4.6 models use adaptive thi...

  • [27] Novità in Claude Opus 4.7 - Claude API Docsplatform.claude.com

    Claude Opus 4.7 supporta la finestra di contesto di 1M token, 128k token di output massimi, adaptive thinking, e lo stesso set di strumenti e funzionalità della piattaforma di Claude Opus 4.6. Se la fedeltà aggiuntiva dell'immagine non è necessaria, riduci...