Poindexter Labs 的核心使命,就是生產它們所謂的「高擬真訓練與評測資料集」。這些資料集不僅涵蓋科學、技術、工程、數學(STEM)領域,更擴及法律、醫學、金融與工程等高度專業的範疇。資料內容包含完整的證明過程、跳躍式推論(Multi-hop)、思維軌跡與詳細的解題步驟日誌 。
在這個封閉且經過嚴格審查的網路中,參與者並非一般的標註工,而是奧林匹亞獎牌得主、博士與大學教授 。平台上一個典型的任務流程是這樣的:某位專家先原創一道電腦科學難題,並附上包含手稿推理、步驟紀錄與 LaTeX 修改紀錄的完整解題過程證據;隨後,這份解題內容會交由另一位獨立專家進行正確性與清晰度的審查
。
這樣產出的並非死板的問答對,而是專家認知過程的完整「紙本軌跡」。這些資料能直接被用來進行 AI 模型的指令微調(Instruction-tuning)、建構推理課程,或執行中小規模的模型微調(Fine-tunes)。Poindexter 除了將 Syncronus 平台授權給想自行策展資料的企業與政府單位外,也直接提供「一站式」的內部資料標註服務,交付經過同儕審查的成品資料集給前端 AI 實驗室
。
獲得這筆 200 萬英鎊資金後,Poindexter Labs 將雙軌加速布局。一方面,公司將投入更多資源在 Syncronus 平台的技術開發上,讓專家協作流程更加流暢;另一方面,隨著前端 AI 實驗室對「推理級」訓練與評測資料的需求持續升溫,該公司也將大舉擴張其專家貢獻者網路的規模 。
在 AI 模型追求通用人工智慧的狂潮下,Poindexter Labs 這類「以人為本」的精英資料網路,正逐漸成為決定模型推理能力的關鍵軍火庫。
Comments
0 comments