오픈AI의 CEO 샘 올트먼은 최근 한 행사에서 AI 사용 비용이 기업 고객들에게 "심각한 문제(a huge issue)"가 되었다고 공개적으로 인정했다 . 오픈AI의 엔터프라이즈 총괄인 알렉산더 엠비리코스는 테크크런치와의 인터뷰에서 고객과의 대화가 근본적으로 바뀌었다고 말했다. "6개월 전만 해도 고객과 나누는 대화는 '무엇을 할 수 있나요? 충분히 성능이 좋나요?'에 집중되었습니다. 지금 우리의 대화는 절대 그런 것들이 아닙니다. 이제 대화는 '이봐요, 우리 너무 많은 돈을 쓰고 있어요. 어떤 가시성을 제공할 수 있죠? 감사(auditability) 기능은 어떻게 되나요?'에 관한 것입니다"
.
기업들의 지출 규모는 경악스러운 수준이다. 올트먼은 오픈AI의 한 파워 유저가 매달 1,000억 개의 토큰을 소모하고 있으며, 이는 기업 할인율을 적용한 혼합 요율로 월 약 10만30만 달러(한화 약 1억 4천만4억 2천만 원)에 달한다고 밝혔다 . 올트먼은 AI 과금을 "전기 요금처럼" 매기고 싶다고 언급했는데, 이는 이론상으로는 합리적으로 들리지만 미터기가 절대 멈추지 않을 때 CFO들에겐 공포 그 자체가 된다
.
양사는 개발자 도구를 기업 AI 도입의 중요한 교두보로 여기고 있다. 오픈AI는 2026년 4월, 'Pro' 구독 요금을 월 100달러로 대폭 낮추며 전문 개발자들이 코딩 도구인 'Codex'를 더 저렴하게 사용할 수 있도록 했다 . 앤트로픽의 Claude Code와 Agent SDK는 이에 대한 직접적인 대안으로 자리매김하고 있다.
앤트로픽의 6월 크레딧 정책 개편은 기존에 정액 요금제 아래에서 고중량 사용자에게 제공되던 15~30배의 사실상의 보조금을 제거함으로써, Claude Code를 가장 많이 사용하는 고객들의 비용을 대폭 상승시키게 된다 . 오픈AI의 가격 인하 보도 시점이 앤트로픽의 모델 출시 직후이자 구독 정책 변경일(6월 15일)을 앞둔 때와 정확히 맞물린다는 점은, 고객들이 비용 충격을 받는 그 순간을 의도적으로 파고들려는 전략임을 암시한다.
가격 위기는 이와 동시에 붕괴하고 있는 '토큰맥싱(tokenmaxxing)'이라는 생산성 신화 없이는 이해할 수 없다. AI 토큰 소비량을 공학적 생산성의 대리 지표로 삼는 관행인 토큰맥싱은 2025년과 2026년 초 실리콘밸리 전역의 내부 문화로 자리 잡았다. 뉴욕타임즈는 3월, 오픈AI의 한 엔지니어가 단 일주일 만에 2,100억 개의 토큰을 처리했으며, 아마존에서는 일부 직원들이 단순히 토큰 사용 통계를 높게 유지하기 위해 "완전히 무의미하거나 불필요한 작업"을 수행하도록 AI 에이전트를 가동했다고 보도했다 .
그러나 데이터는 이 관행에 결정적으로 반하는 방향으로 돌아섰다. 엔지니어링 분석 회사인 Faros AI가 4,000개 팀의 개발자 22,000명의 데이터를 분석한 결과, AI 도입이 작업 처리량(Task throughput)을 가속했지만(작업 완료율 34% 증가, 에픽 66% 증가) 동시에 개발자당 버그 수는 54% 증가했고, 코드 리뷰 소요 시간 중간값은 5배 증가했으며, AI 사용률이 높은 환경에서는 코드 이탈률(Code Churn)이 무려 861% 급증한 것으로 나타났다 .
관리자들이 환영했던 8090%의 초기 코드 수용률은 신기루임이 드러났다. 연구원들이 이후 몇 주 동안의 코드 수정 사항을 추적하자, 실제 수용률은 1030%로 급락했으며 막대한 기술 부채가 쌓여 있음을 보여주었다 . 소프트웨어 회사인 Jellyfish의 데이터에 따르면, Claude Code 상위 10% 사용자는 중간값 개발자보다 약 10배 많은 토큰을 소비했지만, 생산량은 약 2배에 그쳤다
. 또한 Jellyfish의 데이터를 보면, AI를 가볍게 사용할 때 병합된 풀 리퀘스트(PR)당 비용이 0.28달러였으나, 대량 사용 시 최대 89달러까지 치솟았다
.
공학 분야를 넘어서, 더 넓은 범위의 생산성 증명도 무너지고 있다. 보스턴 컨설팅 그룹(BCG)의 2026년 글로벌 AI at Work 보고서는 약 12,000명의 현장 직원을 조사한 결과, 정기적으로 AI를 사용하는 직원의 42%가 주당 8시간, 즉 하루 근무 시간 전체를 절약했다고 응답했다. 그러나 66%는 그 절약된 시간을 어떻게 써야 하는지에 대한 지침을 거의 또는 전혀 받지 못했으며, 절반은 자신들이 측정 가능할 정도로 더 생산적이지 않다고 답했다 . 우버의 최고운영책임자(COO)인 앤드류 맥도날드는 회사가 개별 직원의 생산성 향상을 회사 전체의 영향력과 연결 짓는 데 여전히 어려움을 겪고 있다고 인정했다
.
서비스나우(ServiceNow)의 최고 고객 책임자인 크리스 베디는 커져가는 회의론을 직설적으로 표현했다. "그건 마치 식당의 성공을 구매한 식재료의 양으로 측정하는 것과 같습니다. 그 토큰에는 지불해야 할 청구서가 따라오는데 말이죠."
오픈AI와 앤트로픽은 모두 기업공개(IPO)를 준비 중인 것으로 알려졌다 . 이 시한폭탄 같은 일정은 가격 전쟁의 경제학을 특히 위험하게 만든다. 공격적인 토큰 가격 인하는 양사가 공개 시장 투자자들에게 지속 가능한 단위 경제성을 입증해야 하는 바로 그 순간에 마진을 압박한다. 모델 훈련 및 추론에 필요한 막대한 컴퓨팅 비용을 획기적으로 줄이지 않은 상태에서 가격만 낮춘다면 수익성은 더욱 요원해질 수 있다
.
하지만 더 깊은 투자자들의 우려는 전환 비용, 즉 그 비용의 부재에 있다. Wakefield Research가 2026년 3월과 4월에 걸쳐 200명의 경영진을 대상으로 실시한 설문 조사에서, 응답자의 79%가 현재의 AI 공급업체에 종속(Lock-in)되는 것에 대해 약간 또는 매우 우려하고 있는 것으로 나타났다 . 특정 작업에 대해 한 AI 모델의 출력이 다른 모델과 비슷하고, API 통합이 비교적 간단하다면, 기업 고객들은 최소한의 마찰만으로 더 저렴한 옵션으로 갈아탈 수 있다.
AI의 '무한리필' 시대는 끝났다 . 그 자리를 대신해 떠오르는 것은 승자 독식의 플랫폼 전쟁이라기보다는, 가장 날렵한 비용 구조를 가진 사업자가 살아남는 소모품 가격 전쟁에 가깝다. 오픈AI의 가격 인하 계획은, 그 본질에서, 고객들이 모든 토큰을 검열하는 순간에도 프리미엄 가격을 명령할 만큼 제품 자체가 충분히 차별화되지 않았음을 인정하는 셈이다.
Comments
0 comments