Современным моделям уже недостаточно большего объёма данных — им нужны данные принципиально иного качества. Обучить систему решать олимпиадную задачу по физике или писать многоходовое математическое доказательство можно только на датасетах, которые содержат полный процесс размышления эксперта: черновики, пошаговые логи, исправления и тупиковые ветви рассуждений.
Стандартные платформы для разметки для этого не годятся — они заточены под линейный конвейер, где один исполнитель выносит простой вердикт и переходит к следующему заданию. Именно эту классическую модель в Poindexter Labs называют «сломанной» цепочкой поставок данных для передового ИИ . Компания целенаправленно создаёт так называемые «высокоточные наборы данных для обучения и оценки», содержащие доказательства, трассировку цепочек мыслей и многошаговую логику в таких областях, как точные науки, право, медицина, финансы и инженерия
.
Ключевой актив стартапа — платформа Syncronus. Она отказывается от привычной модели изолированного аннотатора в пользу структурированного коллегиального рецензирования . Вместо того чтобы фрилансер в одиночку выполнял задание, задачи на платформе создаются и затем проверяются проверенной сетью экспертов: призёрами международных олимпиад, обладателями докторских степеней и университетскими профессорами
.
Процесс выглядит примерно так: один специалист составляет оригинальную задачу по Computer Science, требующую многошагового доказательства. Решение фиксируется со всеми «уликами» мыслительного процесса — черновыми расчётами, логами шагов и LaTeX-диффами — после чего другой эксперт независимо проверяет его на корректность и ясность изложения . Такой подход создаёт «бумажный след» экспертного мышления, который можно напрямую использовать для составления обучающих выборок и учебных программ, а также для файн-тюнинга моделей малого и среднего размера
.
Poindexter лицензирует платформу Syncronus предприятиям и государственным органам, желающим создавать собственные курируемые датасеты. Кроме того, у компании есть собственный сервис аннотирования данных премиум-класса, который поставляет готовые, прошедшие рецензирование наборы данных напрямую ведущим лабораториям передового ИИ .
Привлечённый капитал (£2 млн) компания планирует направить прежде всего на ускорение разработки платформы Syncronus и масштабирование сети контрибьюторов . По мере того как спрос на высококачественные данные для рассуждений со стороны ИИ-лабораторий растёт, Poindexter Labs делает ставку на то, что её модель — гибрид технологической платформы и элитной экспертной сети — способна стать одним из критически важных элементов инфраструктуры для следующего поколения систем искусственного интеллекта.
Comments
0 comments