Đây không phải là một cây quyết định đơn giản dựa trên kích thước tệp hay loại tác vụ. Như ông Srinivas đã giải thích, bộ điều phối này sẽ "suy luận về việc công việc nào nên chạy trên thiết bị của bạn và công việc nào nên được giao cho các tác nhân trên đám mây" theo thời gian thực .
Thông báo tại Computex đã làm nổi bật một số khả năng cốt lõi giúp định vị bộ điều phối này cho mục đích sử dụng của doanh nghiệp:
Thiết Kế Không Phụ Thuộc Vào Nhà Sản Xuất Chip (Chip-Agnostic)
Mặc dù buổi trình diễn trên sân khấu chỉ sử dụng phần cứng của Intel, Perplexity đã cẩn thận nhấn mạnh rằng bộ điều phối này không bị khóa vào hệ sinh thái của Intel. Trong một cuộc phỏng vấn sau bài phát biểu quan trọng, CEO Aravind Srinivas đã nói rõ rằng nền tảng này là "không phụ thuộc vào nhà sản xuất chip", được thiết kế để hoạt động trên nhiều loại chip của các nhà cung cấp khác nhau . Việc ra mắt lần đầu trên PC Windows chạy chip Intel là một cột mốc quan hệ đối tác, không phải là sự ràng buộc vĩnh viễn
.
Điều Phối Đa Mô Hình Quy Mô Lớn
Bộ điều phối hoạt động trong hệ điều hành AI "Computer" rộng lớn hơn của Perplexity, hệ thống có thể điều phối tới 20 mô hình AI khác nhau cùng một lúc. Đối với bất kỳ tác vụ con nào, hệ thống sẽ chọn mô hình tối ưu dựa trên khả năng, tốc độ và chi phí—đảm bảo bạn không phải 'dùng dao mổ trâu để giết gà' .
Một Bức Tường Lửa Bảo Mật Thực Sự
Đối với các ngành được quản lý chặt chẽ như tài chính và chăm sóc sức khỏe, việc giữ dữ liệu nhạy cảm khỏi các máy chủ đám mây của bên thứ ba là điều không thể thương lượng. Bộ điều phối hoạt động như một người gác cổng bảo mật, đảm bảo rằng các tài liệu liên quan đến tuân thủ được phân tích cục bộ trước khi bất kỳ ngữ cảnh không nhạy cảm nào được gửi lên đám mây để làm giàu thêm .
Giảm Chi Phí Đáng Kể
Việc chạy mọi truy vấn AI của doanh nghiệp thông qua một mô hình tiên tiến trên đám mây đang trở nên cực kỳ tốn kém. Bằng cách chuyển các tác vụ đơn giản hoặc riêng tư sang NPU trên thiết bị một cách thông minh, cách tiếp cận lai ghép này được ước tính có thể cắt giảm chi phí suy luận từ 30 đến 50 phần trăm .
Buổi trình diễn trực tiếp tại Computex đã giới thiệu một chiếc laptop được trang bị bộ xử lý Intel Core Ultra Series 3 mới, được xây dựng trên tiến trình 18A tiên tiến của công ty . Màn trình diễn đã cho thấy cách một nhà phân tích vốn cổ phần tư nhân có thể tải một dự án có tên mã "Project Falcon"—cùng với các thỏa thuận bảo mật (NDA), mô hình tài chính và bản ghi chép bảo mật—và để chip Intel cục bộ xử lý việc phân tích tài liệu nhạy cảm trong khi các tác nhân đám mây đồng thời thu thập nghiên cứu thị trường bên ngoài, tất cả mà không làm lộ dữ liệu riêng tư
.
Intel đã định hình sự hợp tác này như một sự xác nhận rằng suy luận trên thiết bị không còn là một điều mới lạ. GPU và NPU tích hợp của Core Ultra Series 3 có thể xử lý các khối lượng công việc AI có ý nghĩa mà trước đây chỉ có thể thực hiện ở trung tâm dữ liệu, cho phép một sự phân công lao động thực sự nhằm "tối đa hóa giá trị token trên mỗi watt" . Tại thời điểm ra mắt, khả năng suy luận lai ghép này là độc quyền cho ứng dụng Perplexity trên PC Windows chạy chip Intel, nhưng kiến trúc cơ bản của bộ điều phối được thiết kế để hỗ trợ phạm vi phần cứng rộng hơn nhiều trong tương lai
.
Buổi trình diễn của Perplexity-Intel không phải là một thử nghiệm đơn lẻ—nó là thông báo hàng đầu cho một chủ đề thống trị tại Computex 2026: sự phân phối khối lượng công việc AI trên khắp các thiết bị biên (edge) và đám mây.
Intel đã sử dụng toàn bộ bài phát biểu quan trọng tại Computex của mình để củng cố tương lai phân tán này, công bố các quan hệ đối tác bổ sung với SambaNova, Vista Equity và Cambium cho suy luận tiết kiệm chi phí, và định hình tính toán lai ghép là nền tảng kiến trúc cho kỷ nguyên "AI tác nhân" sắp tới .
Thông điệp rất rõ ràng: trung tâm dữ liệu không biến mất, nhưng nó không còn là nơi duy nhất trí thông minh diễn ra. Trong mô hình lai ghép mà Perplexity và Intel đang đặt cược, tương lai của AI là một cuộc đối thoại giữa thiết bị của bạn và đám mây—được điều phối một cách tự động, thông minh và riêng tư.
Comments
0 comments