さらに最近のAIモデルでは次のような変化が起きています。
Fractileが開発しているのは、**「インメモリ計算(in‑memory compute)」**と呼ばれる設計です。
主な特徴は次の通りです。
同社によると、このアーキテクチャは最先端モデルの推論を最大25倍高速化し、コストを約10分の1に削減できる可能性があるとしています。過去の開発目標では、条件によって最大100倍高速・10分の1コストという数値も示されていましたが、これらは現時点では独立ベンチマークによる検証ではなく、企業側の目標値とされています。
Fractileの**シリーズB(2億2000万ドル)**は、Accel、Factorial Funds、Founders Fundが主導し、Conviction、Gigascale Capital、O1A Ventures、Felicis、Buckley Ventures、8VCなどが参加しました。
資金の主な用途は以下です。
もしFractileのようなアーキテクチャが推論性能を大幅に改善できれば、AIの使い方そのものが変わる可能性があります。
対話型AIでは応答の遅延がユーザー体験を大きく左右します。トークン生成速度が上がれば、より自然なリアルタイム会話に近づきます。
企業がAIコパイロットやAPIを大量運用する場合、重要になるのはトークンあたりのコストとスループットです。専用推論チップは運用コストを大きく下げる可能性があります。
Fractileの取り組みは、AI業界の大きな転換点を示しています。AIが研究段階から実用段階に移るにつれ、トレーニング性能だけでなく推論効率が決定的に重要になるという認識が広がっています。
ただし、新しいチップアーキテクチャがNvidia中心の成熟したGPUエコシステムと競争するのは簡単ではありません。現時点で示されている性能数値の多くは、まだ実機ベンチマークで検証されていない目標値です。
Comments
0 comments