Skip to main content

Tesla AI 인프라 및 AI 플랫폼 엔지니어링 관리자인 Tim Zaman은 최근 전기 자동차 제조업체가 GPU 수 기준으로 세계에서 7번째로 큰 슈퍼컴퓨터를 보유하고 있으며 이는 회사가 맞춤형 Dojo 슈퍼컴퓨터를 배포하기 전의 일이라고 최근 밝혔습니다. 거대한 그래픽 슈퍼컴퓨터는 Tesla가 Autopilot 및 Full Self-Driving과 같은 데이터 및 컴퓨팅 집약적 프로젝트에 집중하고 있음을 암시합니다.

Zaman은 Twitter 및 LinkedIn과 같은 소셜 미디어 플랫폼에 Tesla의 새 하드웨어를 게시했습니다. AI 및 Autopilot 리더는 자신의 게시물에서 EV 제조업체가 MLSys Conference를 후원하고 있다고 언급했습니다. 그는 Tesla가 GPU 슈퍼컴퓨터를 7,360 A-100(80GB) GPU로 업그레이드했다고 말했습니다. 이로써 Tesla의 슈퍼컴퓨터는 GPU 수로 세계 최대의 슈퍼컴퓨터가 되었습니다.

Data Center Dynamics 보고서에 언급된 바와 같이 A100 GPU는 흥미롭게도 Zaman이 Tesla에 고용되기 전에 일했던 Nvidia에서 생산합니다. 각 프로세서에는 80GB의 그래픽 메모리가 있으며 초당 2TB의 메모리 대역폭을 자랑합니다. Tesla의 야심 찬 프로젝트에는 그러한 전력(및 그 이상)이 필요하지만 이는 일부 심각한 하드웨어입니다.

Tesla의 현재 슈퍼컴퓨터는 Dojo의 전구체 클러스터입니다. 흥미롭게도 Tesla는 작년에 회사의 Dojo 이전 슈퍼컴퓨터가 이미 5,760개의 Nvidia A100으로 세계에서 5번째로 강력하다고 언급했습니다. 회사는 그 이후로 시스템에 약 1,600개 또는 약 27%의 GPU를 추가한 것으로 보입니다.

Tesla의 Dojo 슈퍼컴퓨터는 사내에서 설계되었기 때문에 이 거대한 기계는 Nvidia A100 칩에 의존하지 않을 것입니다. 대신 FP32, BFP16 및 CFP8에서 지원되는 Tesla의 맞춤형 D1 칩을 사용합니다. Dojo는 머신 러닝 워크로드, 특히 Tesla의 Autopilot 및 Full Self-Driving 노력에 최적화될 것입니다. 그림에서 Dojo를 사용하면 Autopilot 및 FSD의 개선이 가속화될 것입니다.

Dojo에서 매우 놀라운 점은 그 괴물 같은 사양이 실제로 한 가지 일, 즉 자율 차량을 가능하게 하도록 설계되었다는 사실입니다. 작년 AI Day 프레젠테이션에서 Tesla는 Dojo가 500,000개 이상의 교육 노드가 함께 구축된 순수한 학습 기계임을 강조했습니다. Tesla는 또한 Dojo가 진행중인 작업이므로 AI Day에서 회사가 예고한 인상적인 사양과 기능도 슈퍼컴퓨터가 배치되면 개선될 것이라고 강조했습니다.

Tesla는 GPU 수로 세계에서 7번째로 큰 슈퍼컴퓨터를 보유하고 있습니다. AI 리드

Leave a Reply