MediaTek a obtenu une commande exclusive pour la puce Triggerfish . La commande a un prix unitaire environ 30 % plus élevé que la puce Humufish de base
, signalant une collaboration plus profonde qui va au-delà de la simple fourniture de composants. Kuo note que cela valide davantage MediaTek en tant que partenaire de premier choix de Google pour toute la génération TPU v9, indiquant que MediaTek gère davantage de travaux d'architecture et d'intégration — une évolution vers une collaboration de conception au niveau système
.
Triggerfish apporte trois changements architecturaux principaux par rapport au TPU v9 (Humufish) actuel :
Ces changements ciblent directement les goulots d'étranglement courants des ASIC IA : le « CPU wall » et le « memory wall » .
Triggerfish est explicitement conçu pour la prochaine vague de charges de travail IA : les agents IA et l'apprentissage par renforcement .
Cette orientation s'aligne sur la stratégie IA plus large de Google. Comme indiqué dans la documentation de Google Cloud, « le passage à l'IA agentive nécessite une infrastructure capable de raisonnement en plusieurs étapes et d'apprentissage par renforcement continu ». Les TPU sont conçus pour « briser le "memory wall" de l'inférence en hébergeant de vastes caches KV entièrement sur silicium, en utilisant une SRAM sur puce étendue » .
Selon l'enquête de Kuo sur la chaîne d'approvisionnement :
| Étape | Estimation |
|---|---|
| Début de la production | Fin 2027 (S2 2027) |
| Montée en volume | 2028 |
| Expéditions totales (Triggerfish) | 100 à 200 millions d'unités (en plus des 400 à 500 millions d'unités Humufish) |
Ces volumes sont relativement modestes par rapport au TPU v9 de base, reflétant la position de Triggerfish en tant que mise à niveau ciblée pour des charges de travail d'inférence spécifiques et de grande valeur, plutôt qu'un remplacement de masse.
Triggerfish fait partie de la stratégie de longue date de Google visant à développer son propre silicium sur mesure (TPU) pour réduire sa dépendance vis-à-vis des GPU Nvidia pour les charges de travail IA .
En améliorant le TPU v9 plutôt que d'attendre une v10 complète, Google peut itérer plus rapidement sur des améliorations spécifiques à l'inférence pour les charges de travail émergentes comme les agents IA et le RL — des domaines où les GPU à usage général de Nvidia peuvent être surdimensionnés pour la pure inférence .
La puce est conçue pour la « maximisation du calcul effectif » — en gardant les données actives sur la puce pour réduire le coût et la latence, en concurrençant directement sur le coût total de l'inférence contre le matériel de classe H100/B200 de Nvidia .
Tous les détails proviennent d'une seule enquête d'analyste (Ming-Chi Kuo, TF International Securities, 22 juin 2026). Google n'a pas confirmé le nom de code Triggerfish, les spécifications ou le calendrier. Les prix, les volumes et l'exclusivité des partenaires restent non vérifiés par les entreprises concernées. Jusqu'à ce que Google fasse une annonce officielle, ces informations doivent être traitées comme un rapport crédible mais non confirmé de l'industrie .
Comments
0 comments