Nhưng thực tế là Anthropic đã và đang hành động rất quyết liệt về giá. Vào ngày 9 tháng 6, chỉ hai ngày trước khi câu chuyện của OpenAI nổ ra, Anthropic đã ra mắt Claude Fable 5 với mức giá 10 đô la cho mỗi triệu token đầu vào và 50 đô la cho mỗi triệu token đầu ra — chỉ bằng một nửa so với mô hình Mythos Preview trước đó. Mô hình mới này đạt 80.3% trên bài kiểm tra SWE-Bench Pro, dẫn trước GPT-5.5 tới 22 điểm (58.6%) . Anthropic cũng giới thiệu chế độ "Compact" rẻ hơn tới 8 lần, và vào ngày 14 tháng 5, đã đại tu cấu trúc đăng ký để những người dùng nhiều Claude Agent SDK sẽ bị chuyển khỏi gói đăng ký trọn gói sang hình thức thanh toán theo mức sử dụng API bắt đầu từ ngày 15 tháng 6
.
Một cái nhìn trung thực vào bối cảnh cạnh tranh cho thấy OpenAI không hành động từ thế mạnh. Việc cắt giảm giá là phản ứng trước một vị thế thị trường đã mất, không phải một cử chỉ hào phóng .
Giám đốc điều hành OpenAI, Sam Altman, đã công khai thừa nhận tại một sự kiện gần đây rằng chi phí sử dụng AI đã trở thành "một vấn đề lớn" đối với khách hàng doanh nghiệp . Alexander Embiricos, người đứng đầu mảng doanh nghiệp của OpenAI, nói với TechCrunch rằng các cuộc trò chuyện với khách hàng đã thay đổi về cơ bản: "Sáu tháng trước, tôi nói chuyện với khách hàng và tất cả chỉ xoay quanh 'Nó có thể làm gì? Nó đã đủ tốt chưa?'. Các cuộc trò chuyện của chúng tôi bây giờ không bao giờ là về điều đó nữa. Bây giờ, họ nói về 'này, chúng tôi đang tiêu quá nhiều tiền. Các anh có công cụ giám sát chi tiêu nào không? Có khả năng kiểm toán không?'"
.
Quy mô chi tiêu của doanh nghiệp thật đáng kinh ngạc. Altman tiết lộ rằng một khách hàng lớn của OpenAI tiêu thụ tới 100 tỷ token mỗi tháng, tương đương với khoảng 100.000–300.000 đô la mỗi tháng theo mức giá doanh nghiệp hỗn hợp . Altman từng nói công ty muốn tính phí AI "như tiền điện" — một mô hình trả tiền theo mức sử dụng nghe có vẻ hấp dẫn về lý thuyết nhưng lại trở nên đáng sợ với các giám đốc tài chính khi đồng hồ đo không bao giờ ngừng chạy
.
Cả hai công ty đều coi công cụ dành cho lập trình viên là bàn đạp quan trọng để thâm nhập thị trường AI doanh nghiệp. OpenAI đã giảm giá gói đăng ký "Pro" xuống còn 100 đô la mỗi tháng vào tháng 4 năm 2026, đặc biệt để làm cho các công cụ lập trình Codex của mình rẻ hơn cho các lập trình viên chuyên nghiệp . Claude Code và Agent SDK của Anthropic được định vị là những lựa chọn thay thế trực tiếp.
Đợt đại tu tín dụng tháng 6 của Anthropic đã loại bỏ một cách hiệu quả khoản trợ giá gấp 15–30 lần vốn khiến việc sử dụng nhiều SDK trở nên rẻ một cách giả tạo theo các gói cước trọn gói, điều này sẽ làm tăng đáng kể chi phí cho những người dùng Claude Code nhiều nhất . Thời điểm OpenAI được cho là sẽ cắt giảm giá, chỉ vài ngày sau khi Anthropic ra mắt mô hình mới và ngay trước hạn chót thay đổi cách tính phí ngày 15 tháng 6, cho thấy một nỗ lực có chủ ý nhằm khai thác khoảnh khắc khách hàng bị "sốc" vì hóa đơn.
Không thể hiểu được cuộc khủng hoảng giá cả này nếu không nhìn vào sự sụp đổ song song của câu chuyện năng suất mang tên "tokenmaxxing". Tokenmaxxing — thói quen coi lượng token AI tiêu thụ là thước đo cho năng suất của kỹ sư — đã trở thành văn hóa nội bộ khắp Thung lũng Silicon trong suốt năm 2025 và đầu năm 2026. Tờ New York Times đưa tin vào tháng 3 rằng một kỹ sư của OpenAI đã xử lý 210 tỷ token chỉ trong một tuần, và tại Amazon, một số nhân viên đã tạo ra các tác nhân AI để hoàn thành "những nhiệm vụ hoàn toàn vô nghĩa hoặc không cần thiết" chỉ đơn giản là để giữ chỉ số sử dụng token của họ ở mức cao .
Nhưng dữ liệu đã quay ngoắt 180 độ chống lại thói quen này. Công ty phân tích kỹ thuật Faros AI, khi phân tích dữ liệu từ 22.000 lập trình viên trên 4.000 nhóm, đã phát hiện ra rằng trong khi việc áp dụng AI thúc đẩy tốc độ hoàn thành công việc (tác vụ tăng 34%, sử thi tăng 66%), nó cũng khiến lỗi trên mỗi lập trình viên tăng 54%, thời gian xem xét mã trung bình tăng gấp 5 lần, và tỷ lệ thay đổi mã (code churn) tăng một con số đáng kinh ngạc là 861% trong các môi trường áp dụng AI cao .
Tỷ lệ chấp nhận mã ban đầu từ 80–90% — thứ mà các nhà quản lý từng ăn mừng — hóa ra chỉ là ảo ảnh. Khi các nhà nghiên cứu theo dõi các bản sửa đổi mã trong những tuần tiếp theo, tỷ lệ chấp nhận thực tế giảm mạnh xuống còn 10–30%, cho thấy một khoản nợ kỹ thuật tiềm ẩn đáng kể . Jellyfish phát hiện ra rằng 10% người dùng Claude Code hàng đầu tiêu thụ lượng token gấp khoảng 10 lần so với lập trình viên trung bình nhưng chỉ tạo ra sản lượng đầu ra gấp đôi
. Chi phí cho mỗi yêu cầu hợp nhất (pull request) được chấp nhận đã tăng từ 0,28 đô la khi sử dụng AI ở mức độ nhẹ lên tới mức cao nhất là 89 đô la khi sử dụng nhiều, theo dữ liệu từ công ty phần mềm Jellyfish
.
Thậm chí vượt ra ngoài lĩnh vực kỹ thuật, lập luận về năng suất nói chung cũng đang sụp đổ. Báo cáo AI tại Nơi làm việc Toàn cầu năm 2026 của BCG, khảo sát gần 12.000 nhân viên tuyến đầu, cho thấy 42% người dùng AI thường xuyên tiết kiệm được tám giờ mỗi tuần, tương đương với một ngày làm việc. Nhưng 66% nói rằng họ nhận được rất ít hoặc không có hướng dẫn về việc phải làm gì với thời gian tiết kiệm được, và một nửa cho biết họ không thực sự làm việc hiệu quả hơn một cách có thể đo lường được . Giám đốc điều hành Uber, Andrew Macdonald, thừa nhận công ty đã phải vật lộn để kết nối sự gia tăng năng suất cá nhân của người lao động với bất kỳ tác động nào trên toàn công ty
.
Giám đốc Khách hàng của ServiceNow, Chris Bedi, đã nắm bắt được sự hoài nghi ngày càng tăng một cách thẳng thắn: "Nó gần giống như việc đo lường sự thành công của một nhà hàng bằng lượng thực phẩm họ mua vào, chứ không phải bằng số lượng khách hàng hài lòng rời đi. Có một hóa đơn phải trả cho những token đó" .
Cuộc trò chuyện của doanh nghiệp đã chuyển từ "tăng tốc" sang "chúng tôi cần rào chắn an toàn" . Sự thay đổi đó đe dọa trực tiếp đến mô hình doanh thu cốt lõi của các nhà cung cấp AI, những người hưởng lợi từ việc sử dụng không giới hạn.
Cả OpenAI và Anthropic đều được cho là đang chuẩn bị cho các đợt phát hành cổ phiếu lần đầu ra công chúng . Dòng thời gian đó khiến cho tính kinh tế của một cuộc chiến giá cả trở nên đặc biệt nguy hiểm. Việc cắt giảm giá token một cách quyết liệt sẽ trực tiếp thu hẹp biên lợi nhuận vào đúng thời điểm cả hai công ty cần chứng minh tính kinh tế đơn vị bền vững với các nhà đầu tư thị trường đại chúng. Giảm giá mà không có sự cắt giảm tương ứng trong chi phí điện toán khổng lồ cần thiết cho việc đào tạo và suy luận có thể khiến lợi nhuận càng trở nên xa vời hơn
.
Nhưng mối quan tâm sâu xa hơn của nhà đầu tư là về chi phí chuyển đổi — hay chính xác hơn là sự thiếu vắng của chúng. Một cuộc khảo sát vào tháng 3 và tháng 4 năm 2026 với 200 giám đốc điều hành do Wakefield Research thực hiện cho thấy 79% trong số họ hơi hoặc rất lo ngại về việc bị khóa chặt (lock-in) với nhà cung cấp AI hiện tại của mình . Khi đầu ra của một mô hình AI này gần như tương đương với một mô hình khác cho một tác vụ nhất định, và việc tích hợp API tương đối đơn giản, khách hàng doanh nghiệp có thể chuyển sang lựa chọn rẻ hơn với rất ít trở ngại.
Kỷ nguyên AI "ăn uống thả ga" đã kết thúc . Những gì đang nổi lên thay thế nó trông ít giống một cuộc chiến nền tảng "kẻ thắng được tất cả" mà giống một cuộc chiến định giá hàng hóa hơn, nơi nhà cung cấp có cơ cấu chi phí tinh gọn nhất sẽ sống sót. Kế hoạch giảm giá được báo cáo của OpenAI, về bản chất, là một sự thừa nhận rằng bản thân sản phẩm không đủ khác biệt để có thể yêu cầu một mức giá cao khi khách hàng đang soi xét từng token một.
Comments
0 comments