마이크로소프트는 2025년 12월, 윈도우, 마이크로소프트 365, 팀즈, 아웃룩, 서피스 엔지니어링 팀을 총괄하는 경험 및 디바이스(Experiences + Devices) 부서의 수천 명의 직원에게 앤트로픽(Anthropic)의 '클로드 코드(Claude Code)'에 대한 접근 권한을 부여했다 . 이 실험은 큰 인기를 끌었지만, 토큰 기반 과금 방식이 곧바로 재정적 문제로 이어졌다. 여러 보고서에 따르면 이 프로그램은 몇 달 만에 연간 AI 예산 전체를 소진했으며, 회사는 2026년 5월 14일부터 대부분의 사내 라이선스를 취소하기 시작했다
.
전환을 위한 최종 기한은 마이크로소프트 회계연도 마지막 날인 2026년 6월 30일이다. 이 시기는 라이선스 취소 조치가 제품 전략만큼이나 '예산 건전성 관리'의 성격이 강하다는 점을 시사한다 . 영향을 받는 엔지니어들은 마이크로소프트가 완전히 소유한 도구인 깃허브 코파일럿 CLI(GitHub Copilot CLI)로 전환하도록 안내받고 있다
. 마이크로소프트는 앤트로픽의 클로드 모델이 마이크로소프트 파운드리(Foundry)와 마이크로소프트 365 코파일럿 내에서 계속 접근 가능하다는 점을 강조했지만, 인터페이스와 비용 소유 구조는 크게 변화할 예정이다
.
통제 불능의 비용을 보여주는 가장 극적인 사례는 아마도 우버일 것이다. 최고기술책임자(CTO) 프라빈 네팔리 나가(Praveen Neppalli Naga)는 2026년 4월 디 인포메이션(The Information)과의 인터뷰에서 회사가 회계연도 시작 4개월도 채 안 되어 연간 AI 도구 예산을 이미 모두 소진했음을 확인했다 . 주된 원인은 2025년 12월 출시 이후 약 5,000명의 엔지니어들 사이에서 앤트로픽의 클로드 코드가 급속도로 광범위하게 도입된 것이었다
.
우버는 또한 엔지니어링 그룹별 AI 사용량 순위를 매기는 사내 팀 리더보드를 운영했는데, 이는 두 달 만에 클로드 코드 도입률을 32%에서 84%까지 끌어올리는 촉매제 역할을 했다 . 4월까지 우버 엔지니어의 95%가 매달 AI 도구를 사용하고 있었으며, 커밋된 코드의 70%가 AI에 의해 생성되고 있었다
. 개별 엔지니어들은 API 비용으로 매달 500달러에서 2,000달러를 지출한 것으로 알려졌다
.
이러한 놀라운 도입률 수치에도 불구하고, 사업적 근거는 여전히 찾기 어려운 것으로 드러났다. 우버 최고운영책임자(COO) 앤드류 맥도날드는 '래피드 리스폰스(Rapid Response)' 팟캐스트에서 AI 지출과 소비자 제품 개선 사이의 직접적인 연관성을 찾을 수 없다고 공개적으로 밝혔다. "그 연결고리는 아직 존재하지 않습니다."라고 그는 말했다. "아마도 암묵적으로 더 많은 것들이 출시되고 있을 수는 있지만, '자, 이제 우리가 실제로 소비자에게 유용한 기능을 25% 더 많이 생산하고 있구나'라고 통계치 사이에 선을 긋는 것은 매우 어렵습니다" . CTO 나가는 디 인포메이션에 "제가 필요할 것이라고 생각했던 예산이 이미 바닥나서 이제 원점으로 돌아가 다시 계획을 짜야 합니다"라고 토로했다
.
이러한 여러 사건의 근저에는 굿하트의 법칙(Goodhart's Law)으로 설명되는 관리의 실패가 자리 잡고 있다. "측정 지표가 목표가 되는 순간, 그것은 더 이상 좋은 지표가 될 수 없다" . AI 도입을 과시하고 싶었던 기업들은 토큰 소비량이나 AI 도구 호출 횟수를 기준으로 직원이나 팀의 순위를 매기는 사내 리더보드를 만들었다. 합리적인 직원들은 결과물이 아닌 측정 지표 자체에 최적화된 행동을 선택했다. 그 결과, 비즈니스 가치는 전혀 창출하지 못하면서 인프라 비용만 직접적으로 폭증시키는, 가치가 낮은 불필요한 AI 호출이 폭발적으로 증가했다
.
이러한 관행은 아마존과 우버에만 국한되지 않았다. 여러 보고서에 따르면 다른 주요 기술 기업들에서도 토큰맥싱이 관찰되었지만, 아마존이 리더보드를 공개적으로 폐지한 것이 이 관행의 실패를 보여주는 가장 눈에 띄는 상징이 되었다 .
이러한 사건들을 관통하는 공통적인 주제는 AI 도구가 실패했다는 것이 아니라, 원시 소비량만을 측정하고 보상하는 방식이 오히려 AI가 대체해야 할 작업 자체보다 더 큰 비용을 초래할 수 있는 왜곡된 유인을 만들어낸다는 것이다. 이제 기업들은 도입률 자체를 평가 지표로 삼는 방식에서 벗어나 측정 가능한 비즈니스 가치라는 질문으로 전환하고 있다. AI의 도움이 실제로 출시된 제품을 개선했는가?
AI 도입을 향한 무조건적인 경쟁은 이제 강제된 비용 관리 훈련으로 변모하고 있다. '가능한 한 많은 토큰을 소비하는 것'이 중요했던 시대는 저물고, '실제 결과물로 비용을 정당화하는 것'을 요구하는 시대가 시작되고 있다.
Comments
0 comments