Skip to main content

Tesla AI Infra & AI Platform Engineering Manager の Tim Zaman 氏は最近、電気自動車メーカーは GPU 数で世界第 7 位のスーパーコンピューターを保有しており、それは同社が独自の Dojo スーパーコンピューターを展開する前でもあると述べました。 大規模なグラフィックス スーパーコンピューターは、Tesla が Autopilot や Full Self-Driving などのデータとコンピューティングを多用するプロジェクトに注力していることを示唆しています。

Zaman 氏は、Tesla の新しいハードウェアを Twitter や LinkedIn などのソーシャル メディア プラットフォームに投稿しました。 彼の投稿で、AI と Autopilot のリーダーは、EV メーカーが MLSys Conference を後援していると述べました。 彼はその後、Tesla が GPU スーパーコンピューターを 7,360 A-100(80GB) GPU にアップグレードしたと述べました。 これにより、Tesla のスーパーコンピューターは事実上、GPU 数で世界最大の 1 つになっています。

Data Center Dynamics のレポートで指摘されているように、A100 GPU は Nvidia によって製造されています。興味深いことに、Zaman が Tesla に入社する前に働いていたのは Nvidia です。 各プロセッサには 80 GB のグラフィックス メモリが搭載されており、毎秒 2 TB のメモリ帯域幅を誇っています。 これは本格的なハードウェアですが、テスラの野心的なプロジェクトにはこれほどの (そしておそらくそれ以上の) パワーが必要です。

テスラの現在のスーパーコンピューターは、Dojo の前駆クラスターです。 興味深いことに、Tesla は昨年、同社の Dojo 以前のスーパーコンピューターが 5,760 台の Nvidia A100 を搭載しており、すでに世界で 5 番目に強力であると述べていました。 それ以来、同社は約 1,600 個の GPU をシステムに追加したようで、これは約 27% に相当します。

テスラの Dojo スーパーコンピューターは社内で設計されているため、大規模なマシンは Nvidia A100 チップに依存しません。 代わりに、FP32、BFP16、および CFP8 でサポートされるテスラのカスタム D1 チップを利用します。 Dojo は、機械学習ワークロード、特にテスラのオートパイロットと完全自動運転の取り組み向けに最適化されます。 Dojo が登場すれば、Autopilot と FSD の改善が加速される可能性があります。

Dojo の非常に注目すべき点は、その野獣的な仕様が、自動運転車の実現という 1 つのことだけを目的として設計されているという事実です。 昨年の AI Day のプレゼンテーションで、Tesla は Dojo が 500,000 以上のトレーニング ノードを組み合わせて構築された純粋な学習マシンであることを強調しました。 テスラはまた、Dojo は進行中の作業であることを強調したため、同社が AI Day で紹介した印象的な仕様や機能でさえ、スーパーコンピューターが導入されたときに改善されるでしょう。

テスラは GPU 数で世界第 7 位のスーパーコンピューターを保有:AI がリード

Leave a Reply