Zaawansowane modele nie potrzebują już po prostu więcej danych – potrzebują danych lepszych. Wytrenowanie modelu do rozwiązywania skomplikowanego problemu rachunkowego, budowania argumentacji prawnej czy przeprowadzania wieloetapowego dowodu fizycznego wymaga zbiorów danych, które oddają autentyczny, ekspercki tok rozumowania, a nie tylko poprawne odpowiedzi końcowe. Tradycyjne platformy do anotacji zupełnie nie nadają się do tego zadania, ponieważ zostały zaprojektowane do liniowego, jednoetapowego etykietowania, gdzie pojedynczy pracownik wydaje prostą ocenę .
Poindexter Labs twierdzi wprost, że ten przestarzały model to najsłabsze ogniwo w łańcuchu dostaw AI, nazywając go „zepsutym” (broken) . Firma specjalizuje się w tworzeniu tak zwanych „wysokiej wierności zbiorów danych treningowych i ewaluacyjnych”, które zawierają pełne dowody, ślady rozumowania łańcuchowego (chain-of-thought), logikę wieloetapową (multi-hop) oraz szczegółowe dzienniki kroków w dziedzinach STEM, prawa, medycyny, finansów i inżynierii
.
Technologiczną odpowiedzią firmy jest platforma o nazwie Syncronus. Zamiast modelu odizolowanego anotatora, który samodzielnie wykonuje zadanie, wprowadza ona ustrukturyzowany, oparty na współpracy proces recenzji eksperckiej (tzw. peer-review) . Problemy nie są po prostu opisywane przez przypadkowe osoby – są one tworzone, a następnie sprawdzane przez zweryfikowaną sieć medalistów olimpiad przedmiotowych, doktorów i profesorów
.
Typowe zadanie na platformie może polegać na stworzeniu autorskiego problemu z informatyki, który wymaga wieloetapowego dowodu. Rozwiązanie jest rejestrowane z pełną dokumentacją procesu – wstępnym tokiem rozumowania, dziennikami kroków i śladami zmian w zapisie LaTeX – a następnie recenzowane przez innego, niezależnego eksperta pod kątem poprawności i przejrzystości . W ten sposób powstaje szczegółowy zapis eksperckiego poznania, który może być bezpośrednio wykorzystany do tworzenia zestawów instruktażowych i programów nauczania dla modeli AI lub do przeprowadzania małych i średnich dostrojeń (fine-tuning)
.
Poindexter udostępnia platformę Syncronus na licencji przedsiębiorstwom i instytucjom rządowym, które chcą tworzyć własne, specjalistyczne zbiory danych. Równolegle firma prowadzi wewnętrzną usługę anotacji danych, dostarczając gotowe, zrecenzowane zbiory danych bezpośrednio do najbardziej zaawansowanych laboratoriów AI .
Firma planuje przeznaczyć pozyskany kapitał przede wszystkim na przyspieszenie rozwoju platformy Syncronus oraz na skalowanie swojej sieci ekspertów-współtwórców . W miarę jak rośnie zapotrzebowanie ze strony laboratoriów AI, które potrzebują wysokiej jakości danych do rozumowania zarówno do treningu, jak i ewaluacji, Poindexter Labs stawia na model łączący technologię platformową z elitarną siecią ludzkich ekspertów. Jeśli ten zakład się powiedzie, Syncronus może stać się kluczowym elementem infrastruktury dla następnej generacji systemów sztucznej inteligencji.
Comments
0 comments