Poindexter Labs cho rằng mô hình cũ kỹ này chính là mắt xích yếu nhất trong chuỗi cung ứng AI, gọi đó là một đường ống “hỏng” đối với các mô hình AI tạo sinh . Công ty tập trung sản xuất thứ mà họ gọi là "bộ dữ liệu huấn luyện và đánh giá chất lượng cao", tích hợp các chứng minh, dấu vết chuỗi tư duy (chain-of-thought), logic đa bước nhảy (multi-hop) và nhật ký từng bước chi tiết trên các lĩnh vực STEM, pháp lý, y tế, tài chính và kỹ thuật
.
Giải pháp công nghệ của Poindexter có tên là Syncronus, thay thế mô hình gán nhãn đơn lẻ, biệt lập bằng một quy trình phản biện chéo có cấu trúc . Thay vì để một nhân công tự do hoàn thành nhiệm vụ trong phòng kín, các bài toán được tạo ra và xem xét lại bởi một mạng lưới đã được thẩm định gồm những người đoạt huy chương Olympiad, tiến sĩ và giáo sư
.
Một tác vụ điển hình trên nền tảng có thể là sáng tác một bài toán gốc trong khoa học máy tính yêu cầu chứng minh đa bước. Lời giải được ghi lại với đầy đủ bằng chứng tiến trình—suy luận nháp, nhật ký từng bước, và các bản ghi thay đổi LaTeX—và sau đó được một chuyên gia độc lập xem xét về tính chính xác và rõ ràng . Quá trình này tạo ra một dấu vết giấy tờ về nhận thức chuyên gia, có thể sử dụng trực tiếp cho các bộ dữ liệu tinh chỉnh mô hình (instruction-tuning sets) và chương trình suy luận, hoặc để chạy các đợt tinh chỉnh mô hình quy mô nhỏ và vừa
.
Poindexter cấp phép nền tảng Syncronus cho các doanh nghiệp và cơ quan chính phủ muốn tạo ra những bộ dữ liệu chuyên gia được tuyển chọn của riêng họ. Công ty cũng vận hành một dịch vụ gán nhãn dữ liệu nội bộ để bàn giao trực tiếp các bộ dữ liệu đã qua phản biện cho các phòng thí nghiệm AI tạo sinh hàng đầu .
Poindexter dự định chủ yếu dùng nguồn vốn mới để đẩy nhanh quá trình phát triển nền tảng Syncronus và mở rộng mạng lưới cộng tác viên . Trong bối cảnh nhu cầu từ các phòng thí nghiệm AI về dữ liệu suy luận chất lượng cao cho cả huấn luyện lẫn đánh giá ngày càng tăng, Poindexter đặt cược rằng mô hình của mình—kết hợp công nghệ nền tảng với mạng lưới chuyên gia ưu tú—có thể trở thành mảnh ghép hạ tầng không thể thiếu cho thế hệ hệ thống AI tiếp theo.
Comments
0 comments