تسعير Claude Opus 4.7 يبدو للوهلة الأولى سهلًا: 5 دولارات للإدخال و25 دولارًا للإخراج لكل مليون توكن. لكن في التطبيقات الحقيقية — روبوت دعم، وكيل برمجي، نظام تحليل مستندات، أو أداة داخلية طويلة السياق — الخطأ الشائع هو ضرب “إجمالي التوكنز” في سعر واحد. هذا سيعطيك رقمًا مضللًا.
تقول Anthropic إن المطورين يستطيعون استخدام النموذج عبر Claude API بالمعرّف claude-opus-4-7.[9] وتعرض مستندات التسعير الرسمية بنودًا منفصلة لتوكنز الإدخال الأساسية، وكتابة Prompt Cache، وقراءة الكاش، وتوكنز الإخراج.[
19] كما تعرض مؤشرات تسعير خارجية بداية السعر نفسها: 5 دولارات لكل مليون input tokens و25 دولارًا لكل مليون output tokens، لكن إذا وصلت إلى النموذج عبر مزوّد أو منصة وسيطة، فراجع فاتورة تلك المنصة وشروطها النهائية.[
7][
21]
الخلاصة السريعة: ليس السعر مجرد 5 و25 دولارًا
في هذا الدليل، سنستخدم “مليون توكن” للدلالة على 1,000,000 توكن. وبحسب صفحة تسعير Anthropic، يجب التعامل مع بنود التكلفة كفئات منفصلة، لا كرقم واحد.[19]
| بند التكلفة | السعر | ماذا يعني؟ |
|---|---|---|
| Base input tokens | 5 دولارات / مليون توكن | توكنز الإدخال العادية التي تُرسل إلى النموذج ولا تُحتسب ككتابة أو قراءة كاش.[ |
| Output tokens | 25 دولارًا / مليون توكن | التوكنز التي ينتجها Claude في الرد.[ |
| Prompt cache write — مدة 5 دقائق | 6.25 دولار / مليون توكن | عند كتابة محتوى قابل لإعادة الاستخدام في الكاش بمدة صلاحية 5 دقائق.[ |
| Prompt cache write — مدة ساعة | 10 دولارات / مليون توكن | عند استخدام مدة صلاحية ساعة واحدة لكتابة الكاش.[ |
| Cache read / hit | 0.50 دولار / مليون توكن | عند قراءة محتوى موجود مسبقًا في الكاش.[ |
المغزى العملي: إذا كان تطبيقك يستخدم Prompt Caching، فلا يكفي أن تحفظ “إجمالي التوكنز”. احتفظ بكل بند على حدة: إدخال عادي، إخراج، كتابة كاش، وقراءة كاش.[19]
معادلة التكلفة من دون Prompt Caching
إذا لم تستخدم Prompt Caching، فالمعادلة الأساسية هي:
التكلفة = input_tokens ÷ 1,000,000 × 5 + output_tokens ÷ 1,000,000 × 25
مثال: إذا كان الطلب الواحد يحتوي على 200,000 توكن إدخال و20,000 توكن إخراج، فالتكلفة التقريبية قبل أي كاش أو رسوم منصة أخرى هي:
200,000 ÷ 1,000,000 × 5 = 1.00 دولار
20,000 ÷ 1,000,000 × 25 = 0.50 دولار
أي أن الإجمالي يساوي 1.50 دولار لهذا الطلب، وفق أسعار Anthropic API الأساسية للإدخال والإخراج.[19]
معادلة التكلفة عند استخدام Prompt Caching
مع Prompt Caching، احسب كل جزء بسعره:
التكلفة = base_input_tokens ÷ 1,000,000 × 5 + output_tokens ÷ 1,000,000 × 25 + cache_write_5m_tokens ÷ 1,000,000 × 6.25 + cache_write_1h_tokens ÷ 1,000,000 × 10 + cache_read_input_tokens ÷ 1,000,000 × 0.50
إذا كنت تستخدم نوعًا واحدًا فقط من مدة صلاحية الكاش، فاحتفظ ببند الكتابة المناسب فقط. تعرض وثائق Anthropic في أمثلة streaming حقول استخدام مثل input_tokens وoutput_tokens وcache_creation_input_tokens وcache_read_input_tokens، كما تفصل صفحة التسعير بين كتابة الكاش وقراءة الكاش.[15][
19]
كيف تعرف عدد التوكنز قبل إرسال الطلب؟ استخدم count_tokens
لا تحاول تقدير التكلفة من عدد الكلمات العربية أو الإنجليزية أو من عدد الحروف. التوكنز ليست “كلمات” بالضرورة، وقد تختلف حسب اللغة، التنسيق، الأدوات، والصور أو ملفات PDF داخل الطلب.
الطريقة الأكثر أمانًا هي استخدام endpoint الرسمي:
/v1/messages/count_tokens
توضح Anthropic أن هذا endpoint يحسب عدد التوكنز في الرسالة قبل إرسالها إلى Claude، ويقبل بنية إدخال مشابهة لإنشاء رسالة في Messages API، بما في ذلك system prompts وtools والصور وملفات PDF، ثم يعيد إجمالي توكنز الإدخال. كما تشير الوثائق إلى أن كل النماذج النشطة تدعم عدّ التوكنز.[18]
عمليًا، أرسل إلى count_tokens النسخة نفسها تقريبًا من الـ payload الذي سترسله إلى Messages API: رسائل المستخدم، system prompt، تعريفات الأدوات، الصور، وملفات PDF إن وجدت. بهذه الطريقة يمكنك وضع حد أقصى للتكلفة، أو إظهار تحذير للمستخدم، أو منع الطلبات المكلفة قبل تنفيذها.[18]
بعد تنفيذ الطلب: اعتمد على usage لا على طول النص
بعد انتهاء الطلب، لا تُعدّ كلمات الرد لتخمين التكلفة. سجّل حقول usage التي ترجعها الاستجابة.
أمثلة Messages API في وثائق Anthropic تعرض حقولًا مثل input_tokens وoutput_tokens، بينما تعرض وثائق streaming حقولًا إضافية مرتبطة بالكاش مثل cache_creation_input_tokens وcache_read_input_tokens.[15][
17]
إذا كنت تستخدم streaming، انتبه لنقطة مهمة: توضح وثائق Anthropic أن عدد التوكنز في message_delta.usage هو عدد تراكمي، وليس زيادة جديدة في كل حدث. إذا جمعت كل delta كما لو أنها أرقام مستقلة، فستحسب التوكنز نفسها أكثر من مرة.[15]
للمحاسبة الشهرية: استخدم Usage & Cost Admin API
سجلّ الاستجابة لكل طلب مفيد للمراقبة الفورية داخل التطبيق، لكنه ليس دائمًا كافيًا لإغلاق حسابات فريق كامل أو تقسيم التكلفة بين مساحات عمل متعددة.
توفر Anthropic واجهة Usage & Cost Admin API للوصول البرمجي والتفصيلي إلى بيانات الاستخدام والتكلفة التاريخية للمؤسسة. وتذكر الوثائق أن تقارير الاستخدام يمكن تقسيمها حسب النموذج، وworkspace، وservice tier.[16]
بصيغة أبسط: استخدم usage داخل التطبيق لضبط الميزانية لحظيًا، واستخدم Usage & Cost Admin API للمراجعة الشهرية، وتحليل الاتجاهات، وتقسيم الفواتير بين الفرق.[16]
الترقية إلى Opus 4.7؟ أعد حساب ميزانية التوكنز
لا تفترض أن الفاتورة ستبقى كما هي لمجرد أن السعر الأساسي هو 5 دولارات و25 دولارًا لكل مليون توكن. توضح وثائق Anthropic أن Claude Opus 4.7 يستخدم tokenizer جديدًا قد يستهلك تقريبًا من 1x إلى 1.35x من عدد التوكنز مقارنة بالنماذج السابقة عند معالجة النصوص، أي حتى نحو 35% أكثر بحسب المحتوى. كما أن /v1/messages/count_tokens قد يعيد رقمًا مختلفًا لـ Opus 4.7 مقارنةً بـ Opus 4.6 على النص نفسه.[20]
لذلك، قبل نقل نظام إنتاجي من Opus 4.6 أو نموذج أقدم إلى Opus 4.7، خذ عيّنة من أكثر الطلبات استخدامًا وكلفة: المطالبات الطويلة، السياقات الممتدة، تعريفات الأدوات، وسير العمل الذي ينتج مخرجات كبيرة. شغّلها عبر /v1/messages/count_tokens، ثم حدّث حدود الإنفاق والتنبيهات وقيود الاستخدام بناءً على الأرقام الجديدة.[18][
20]
قائمة فحص سريعة قبل الإطلاق
- تأكد من استخدام model ID الصحيح:
claude-opus-4-7.[9]
- قبل الإطلاق أو الترقية، اختبر payloads ممثلة عبر
/v1/messages/count_tokens.[18]
- خزّن
input_tokensوoutput_tokensوcache_creation_input_tokensوcache_read_input_tokensكبنود منفصلة، لا كرقم إجمالي واحد.[15][
19]
- عند استخدام streaming، تذكّر أن
message_delta.usageتراكمي، فلا تجمعه حدثًا بعد حدث على أنه زيادات منفصلة.[15]
- استخدم Usage & Cost Admin API للمحاسبة التاريخية، وتقسيم التكلفة حسب النموذج أو workspace أو service tier.[
16]
- إذا كنت تنتقل من نموذج Claude أقدم إلى Opus 4.7، أعد اختبار أثر الـ tokenizer الجديد على مطالباتك الفعلية.[
20]
الخلاصة: سعر Claude Opus 4.7 API الأساسي واضح — 5 دولارات لكل مليون توكن إدخال و25 دولارًا لكل مليون توكن إخراج. لكن التكلفة الدقيقة تحتاج إلى ثلاث عادات: عدّ التوكنز قبل الإرسال، تسجيل usage بعد الاستجابة، وفصل Prompt Caching والـ tokenizer الجديد في نموذج التكلفة.[18][
19][
20]




