Выбрано
Топ
Zyphra преобразовала свою MoE‑модель ZAYA1‑8B в диффузионную языковую модель, которая может генерировать блоки из 16 токенов параллельно.