Điểm mấu chốt: tài sản bị đánh cắp không nhất thiết là mật khẩu. Ngày càng nhiều vụ tấn công nhắm vào chính “quyền truy cập đã được xác thực”. SpyCloud cho biết họ đã thu hồi 18,1 triệu API key và token bị lộ trong năm 2025, đồng thời mô tả xu hướng kẻ tấn công chuyển từ việc chỉ săn tên đăng nhập/mật khẩu sang đánh cắp API key, token phiên và credential tự động hóa .
Trộm token AI thường đi theo hai hướng chính.
Một số nhóm lạm dụng tạo hàng loạt tài khoản mới nhằm nhận tín dụng dùng thử hoặc ưu đãi compute. Fortune đưa tin CEO Stripe Patrick Collison nói rằng, trong bối cảnh một số công ty AI, kẻ trộm token đã trở thành một phần đáng kể trong lượng đăng ký khách hàng mới, có nơi lên tới 1 trong 6 lượt đăng ký mới . Con số này không nên được hiểu là chuẩn chung cho toàn ngành, nhưng nó cho thấy vì sao quy trình onboarding của sản phẩm AI đang trở thành mục tiêu gian lận.
Lý do rất dễ hiểu: một gói dùng thử hào phóng không còn chỉ là chi phí marketing. Nếu tài khoản mới được cấp tín dụng có thể kích hoạt inference thật, mỗi lượt đăng ký bị lạm dụng đều tạo ra chi phí compute thật .
Hướng thứ hai là đánh cắp credential. Kẻ tấn công tìm hoặc lấy được API key AI, rồi dùng key đó để chạy workload trên tài khoản nạn nhân. Mô hình này thường được gọi là LLMjacking .
Một bài phân tích về LLMjacking nêu trường hợp một startup vốn chỉ trả khoảng 400 USD mỗi tháng cho OpenAI, nhưng sau khi API key bị lộ đã nhận hóa đơn 67.000 USD. Key này được cho là đã nằm trong một kho GitHub công khai 11 ngày và bị bot tự động phát hiện chỉ trong vài phút sau khi commit . Một hướng dẫn phòng thủ khác nhận định kiểu tấn công này đã phát triển từ việc chộp lấy key bị lộ một cách cơ hội thành dạng lạm dụng có tổ chức hơn, nhắm vào nhà cung cấp AI và dịch vụ AI trên cloud
.
Nhiều startup AI sống nhờ tốc độ: đăng ký tự phục vụ, demo nhanh, cấp tín dụng miễn phí và mở API gần như ngay lập tức. Những cơ chế giúp tăng trưởng này cũng tạo ra bề mặt gian lận khi compute đắt đỏ nhưng lại có thể bị tiêu thụ ở quy mô lớn .
Rủi ro còn tăng lên vì credential rất dễ rò rỉ trong môi trường phát triển nhanh. CSO dẫn nghiên cứu của Wiz cho biết 65% công ty trong danh sách Forbes AI 50 có secret bị lộ đã được xác minh, bao gồm API key và access token xuất hiện trên GitHub . Điều đó không có nghĩa mọi secret bị lộ đều dẫn tới trộm token AI, nhưng nó cho thấy các credential giá trị có thể thoát khỏi quy trình phát triển nhanh đến mức nào.
Kinh tế của kiểu gian lận này cũng khác nhiều so với lạm dụng đăng ký trong các sản phẩm SaaS truyền thống. Một tài khoản giả trong phần mềm thuê bao thông thường có thể làm méo số liệu tăng trưởng hoặc tốn thời gian hỗ trợ. Nhưng một tài khoản AI giả, hoặc một tài khoản AI bị chiếm quyền, có thể ngay lập tức đốt inference dựa trên GPU, tín dụng nhà cung cấp mô hình hoặc ngân sách cloud .
Trộm token thường trông giống hoạt động hợp lệ, vì kẻ tấn công đang dùng key hợp lệ, phiên đăng nhập hợp lệ hoặc tài khoản mới được tạo đúng quy trình. Các cảnh báo về token theft cho biết cookie phiên, OAuth token và những “hiện vật” xác thực tương tự có thể giúp kẻ tấn công vượt qua kiểm soát đăng nhập và giả danh người dùng hợp lệ .
Với công ty AI, tín hiệu hữu ích thường nằm ở hành vi: tài khoản mới tiêu sạch tín dụng quá nhanh, API key đột ngột chuyển từ lưu lượng bình thường sang gọi mô hình với tần suất cao, hoặc chi tiêu tăng vọt xa khỏi lịch sử của tài khoản. Những dấu hiệu này khớp trực tiếp với các mô hình đã được ghi nhận: tài khoản giả để rút tín dụng compute và key bị lộ gây ra hóa đơn lớn .
Không có một nút bấm duy nhất để xử lý trộm token, vì nó nằm giữa ba vùng: chống gian lận, bảo mật danh tính và kiểm soát chi phí cloud. Cách tiếp cận tốt nhất là kết hợp cả ba.
Tín dụng miễn phí nên được xem là khoản rủi ro chi tiêu, không chỉ là ngân sách thu hút người dùng. Đội ngũ AI có thể giảm rủi ro bằng cách thu nhỏ mức trial mặc định, mở khóa tín dụng theo từng bước, đặt quota theo tài khoản và theo key, dùng rate limit, và cảnh báo khi mức sử dụng tăng bất thường .
Các nhóm phát triển nên giả định API key có thể rò rỉ nếu quy trình không chủ động ngăn chặn. Quét secret trong repository và hệ thống CI/CD, xoay vòng key, cấp quyền tối thiểu và thu hồi nhanh key bị lộ là những kiểm soát cốt lõi, đặc biệt khi đã có ghi nhận về tình trạng credential của công ty AI xuất hiện trên GitHub .
Một hệ thống chống gian lận chỉ nhìn vào dữ liệu đăng ký có thể bỏ sót API key bị đánh cắp. Một hệ thống bảo mật chỉ nhìn sự kiện đăng nhập có thể bỏ qua hành vi “cày” tín dụng miễn phí. Nền tảng AI cần liên kết tuổi tài khoản, tốc độ tiêu thụ tín dụng, khối lượng API, lựa chọn mô hình và tốc độ phát sinh chi phí để phát hiện lạm dụng trước khi nó biến thành hóa đơn lớn .
Thay đổi quan trọng nhất là tư duy: token truy cập AI có giá trị gần giống tiền mặt. Nó có thể mở khóa compute khan hiếm, bị bán lại, hoặc được dùng để vận hành hoạt động khác trong khi đẩy chi phí cho người khác . Khi startup nhìn token như một công cụ tài chính bên cạnh vai trò credential kỹ thuật, các biện pháp như giới hạn chi tiêu, phát hiện bất thường và quản lý vòng đời key sẽ trở thành hạ tầng sản phẩm cốt lõi, không còn là việc bảo mật “hậu trường”.
Trộm token AI là gian lận nhắm vào lớp đo đếm chi phí của nền tảng AI. Thứ bị lấy có thể là API key, token phiên, OAuth token hoặc số dư dùng thử; thứ bị kiếm tiền hóa là compute có trả phí . Với startup, đây không chỉ là vấn đề bảo mật tài khoản. Nó có thể bào mòn biên lợi nhuận, làm sai lệch phễu tăng trưởng và khiến các gói dùng thử mở rộng trở nên quá đắt nếu thiếu lớp kiểm soát mạnh hơn
.
Comments
0 comments