レポート公開済み2 か月前Last edited 先月22 ソース

米国と中国のAIチップを徹底比較：アーキテクチャ、性能、エコシステム

米国はAIアクセラレータの性能とソフトウェアエコシステムで依然優位。AMD MI325Xは約1.3PFLOPS FP16と256GB HBM3Eを搭載し、大規模モデル処理に特化している。[83] 中国はHuawei AscendシリーズやBiren GPUなど複数の国産チップで対抗し、AI計算基盤の自立を目指している。[36][48] AIチップ競争は単体性能だけでなく、メモリ帯域、製造プロセス、クラスタ接続技術、ソフトウェアエコシステムなど総合力で決まる。

Studio Global AIで検索して事実確認さらにトレンドページを見る

Editorial illustration representing the competition between US and Chinese AI chips — Research US vs China AI Chips and compare them as comprehensively as possible in table formatThe global AI accelerator race increasingly centers on competing chip ecosystems in the United States and China.
AI プロンプト
Create a landscape editorial hero image for this Studio Global article: Research US vs China AI Chips and compare them as comprehensively as possible in table format. Article summary: The US side in this evidence set includes Nvidia H200, AMD MI325X, and Google TPU v6e, while the China side is represented mainly by Huawei’s Ascend 910B.. Topic tags: deepresearch, documentation, general web, education, user generated. Reference image context from search candidates: Reference image 1: visual subject "RAND's divisions conduct research on a uniquely broad front for clients around the globe. #### U.S. research divisions. U.S. and China flags on a computer chip on a motherboard. **" source context "China's AI Models Are Closing the Gap—but America's Real Advantage Lies Elsewhere | RAND" Reference image 2: visual subject "RAND's divisions conduct research on a uniquely broad front for clients a
openai.com

世界のAIコンピューティング競争は、米国と中国の半導体エコシステムの競争として語られることが多くなっています。

米国ではNvidia、AMD、Googleなどが高性能AIアクセラレータを開発し、クラウドやスーパーコンピュータで広く利用されています。一方、中国はHuawei、Biren、Cambriconなどの企業を中心に、独自のAIチップを急速に開発しています。

ただし、この競争は単なる「計算性能」だけでは測れません。AIチップの評価には次のような要素が関わります。

チップアーキテクチャ
メモリ容量と帯域
製造プロセス
ソフトウェアエコシステム
大規模クラスタの構築能力

以下では、公開仕様をもとに主要なAIアクセラレータを比較します。

米国と中国の主要AIチップ

米国

AMD Instinct MI325X
Google TPU v6e（Trillium）

中国

Huawei Ascend 910シリーズ（910Cなど）
Biren BR100 / BR104
Cambricon MLU370‑X8

これらは主に次の用途を想定しています。

大規模言語モデル（LLM）の学習
AI推論サービス
科学計算

AIチップ仕様比較

チップ	国 / 企業	アーキテクチャ・製造	理論性能	メモリ	メモリ帯域	消費電力	特徴
AMD Instinct MI325X	米国 / AMD	CDNA3	約1.3 PFLOPS FP16（FP8は最大2.6 PFLOPS）	256GB HBM3E	約6 TB/s	最大約750〜1000W	大規模AIモデル向けの非常に大きいHBM容量。
Google TPU v6e	米国 / Google	TPU専用設計	918 TFLOPs bf16	32GB HBM	約1.6 TB/s	非公開	最大256チップのTPU Podでスケール可能。
Huawei Ascend 910	中国 / Huawei	Da Vinci、7nm級	約256 TFLOPS FP16	HBM	約1.2 TB/s	約350W	2019年発表のHuaweiの主力AIチップ。
Huawei Ascend 910C	中国 / Huawei	チップレット設計	約800 TFLOPS FP16（推定）	約96〜128GB HBM	約3.2 TB/s	約310W	A100/H100クラスを意識した設計。
Biren BR100	中国 / Biren	デュアルダイGPU、TSMC 7nm CoWoS	256 TFLOPS FP32 / 約2048 TOPS INT8	64GB HBM2E	約2.3 TB/s	約550W	約770億トランジスタのデータセンターGPU。
Biren BR104	中国 / Biren	単一ダイGPU	約128 TFLOPS FP32	32GB HBM2E	約819 GB/s	約300W	PCIeアクセラレータカード向け。
Cambricon MLU370‑X8	中国 / Cambricon	MLUarch03、7nm	96 TFLOPS FP16 / 256 TOPS INT8	48GB LPDDR5	約614 GB/s	約250W	MLU‑Linkで複数カードを接続可能。

アーキテクチャと計算性能

公開されているスペックを見る限り、純粋な理論演算性能では米国製アクセラレータが依然として優位です。

例えばAMDのMI325Xは

約1.3 PFLOPS（FP16）

という非常に高い半精度性能を持っています。

GoogleのTPU v6eも

918 TFLOPs bf16 / チップ

という性能を持ち、GoogleのAIモデル（Geminiなど）を支えるクラウドインフラとして設計されています。

中国側ではHuaweiのAscend 910Cが

約800 TFLOPS FP16

と推定され、Nvidia A100クラスに近い性能を狙っています。

またBirenのBR100は

256 TFLOPS FP32
約2,048 TOPS INT8

というAI推論・トレーニング向けの高い演算性能を持っています。

メモリ容量と帯域

AIモデルの巨大化に伴い、メモリ容量と帯域幅は計算性能と同じくらい重要になっています。

AMD MI325X
- 256GB HBM3E
- 約6 TB/s帯域
- 現行AIアクセラレータの中でも最大級の容量。
TPU v6e
- 32GB HBM
- 約1.6 TB/s帯域
- 大規模クラスタ前提の設計。
Huawei Ascend 910C
- 約3.2 TB/s帯域
- 大規模モデルの学習を想定。
Biren BR100
- 64GB HBM2E
- 約2.3 TB/s帯域。

AIトレーニングでは巨大なテンソルを頻繁にメモリへ読み書きするため、帯域幅がボトルネックになることが多いのが特徴です。

インターコネクトとスケーリング

現代のAIモデルは1枚のチップではなく、数百〜数千のアクセラレータを接続したクラスタで学習されます。

代表例：

Google TPU v6e
- 専用ネットワーク「ICI」
- 最大256チップのTPU Pod。
Cambricon MLU370‑X8
- MLU‑Link
- カード間通信200GB/s。
Biren GPU
- GPU同士の高速インターコネクトを搭載。

このため現在のAI競争では、単一チップ性能よりもクラスタ設計が重要になりつつあります。

製造技術とサプライチェーン

半導体製造技術は性能と電力効率に直結します。

例えばBirenのBR100は

TSMCの7nmプロセス
CoWoS先端パッケージング

で製造されています。

HuaweiのAscendシリーズでは

SMICの7nm級プロセス
制裁前に確保されたウェハ

など複雑な供給チェーンが使われていると報告されています。

米国企業は通常、TSMCなど最先端ファウンドリを利用できるため、製造技術面で優位とされることが多いです。

ソフトウェアとエコシステム

AIハードウェアの成功は、ソフトウェアに大きく依存します。

米国側の例

Nvidia CUDA
AMD ROCm
Google TPUソフトウェアスタック

中国側ではHuaweiが

CANN（Compute Architecture for Neural Networks）

というフレームワークを推進しています。

実際のAI開発では

フレームワーク対応
開発ツール
クラウド環境

などの要素が採用を大きく左右します。

この比較から見えること

現在のAIアクセラレータ市場にはいくつかの特徴があります。

1. 米国が性能とエコシステムで先行

AMDやGoogleなどのチップは、公開スペックでは依然としてトップクラスの性能を示しています。

2. 中国は国産代替路線を強化

Huawei Ascend、Biren GPU、Cambriconなど複数のチップが開発され、海外GPUへの依存を減らそうとしています。

3. 勝負は「AIインフラ全体」へ

今の競争はチップ単体ではなく

AIスーパーコンピュータ
クラウドAIインフラ
ソフトウェアエコシステム

を含む総合戦になっています。

AIモデルが今後さらに巨大化すれば、アーキテクチャ設計・メモリ技術・ソフトウェア基盤の差が、どのプラットフォームが主流になるかを左右する可能性が高いでしょう。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AIで検索して事実確認

人々も尋ねます