엔비디아가 엔비디아 이더넷 네트워킹 기술을 통해 엑스AI(xAI)가 구축한 세계 최대 AI 슈퍼컴퓨터 ‘콜로서스(Colossus)’를 가속화하고 있다고 30일 밝혔다.
미국 테네시주 멤피스에 위치한 엑스AI의 콜로서스 슈퍼컴퓨터 클러스터는 엔비디아 스펙트럼-X 이더넷 네트워킹 플랫폼을 사용해 10만개의 엔비디아 호퍼 그래픽처리장치(GPU)로 구성된 대규모 시스템을 구현했다. 스펙트럼-X 플랫폼은 표준 기반 이더넷을 사용해 멀티 테넌트, 하이퍼스케일 인공지능(AI) 팩토리에 뛰어난 성능을 제공하도록 설계됐으며 원격 직접 메모리 액세스(RDMA) 네트워크를 지원한다.
콜로서스는 세계에서 가장 큰 AI 슈퍼컴퓨터로, 엑스AI 그록 거대 언어 모델(LLM) 제품군을 훈련하는 데 사용된다. 이 모델은 엑스 프리미엄 구독자를 위한 챗봇 기능을 제공하는 데도 활용된다. 현재 엑스AI는 콜로서스 규모를 두 배로 늘려 총 20만개의 엔비디아 호퍼 GPU로 구성하는 작업을 진행 중이다.
엔비디아와 엑스AI는 지원 시설과 최첨단 슈퍼컴퓨터를 단 122일 만에 구축했다. 일반적으로 이 정도 규모의 시스템을 구축하는 데 수개월에서 수년이 걸리는 기간을 생각하면 매우 빠른 속도라는 것이 회사 측 설명이다. 첫 번째 랙이 바닥에 설치한 시점부터 훈련이 시작되기까지 단 19일이 걸렸다.
초대형 그록 모델을 훈련하는 동안 콜로서스는 전례 없는 네트워크 성능을 달성했다. 네트워크 패브릭의 세 계층 모두에서 이 시스템은 플로우 충돌로 인한 애플리케이션 지연 시간 저하나 패킷 손실이 전혀 발생하지 않았다. 또한 스펙트럼-X 혼잡 제어를 통해 95%의 데이터 처리량을 유지했다.
엔비디아 네트워킹 담당 수석 부사장인 길라드 샤이너는 “AI는 이제 필수적인 존재가 됐으며 향상된 성능, 보안, 확장성, 비용 효율성을 필요로 한다"며 "엔비디아 스펙트럼-X 이더넷 네트워킹 플랫폼은 엑스AI와 같은 혁신가들에게 AI 워크로드의 빠른 처리, 분석, 실행을 제공하고 결과적으로 AI 솔루션의 개발과 배포, 출시 시간을 단축할 수 있도록 설계됐다”고 말했다.
일론 머스크는 자신의 X 계정에서 “콜로서스는 세계에서 가장 강력한 훈련 시스템"이라며 "엑스AI 팀과 엔비디아, 그리고 많은 파트너, 공급업체들이 훌륭한 작업을 했다”고 밝혔다.
엑스AI 대변인은 “엑스AI는 세계에서 가장 크고 가장 강력한 슈퍼컴퓨터를 구축했다"며 "우리는 엔비디아의 호퍼 GPU와 스펙트럼-X를 통해 대규모 AI 모델 훈련의 한계를 뛰어넘었으며, 이더넷 표준을 기반으로 초고속화되고 최적화된 AI 팩토리를 구축할 수 있게 됐다”고 전했다.
스펙트럼-X 플랫폼의 핵심은 최대 800Gb/s의 포트 속도를 지원하는 스펙트럼 SN5600 이더넷 스위치로, 스펙트럼-4 스위치 ASIC을 기반으로 한다. 엑스AI는 전례 없는 성능을 위해 스펙트럼-X SN5600 스위치와 엔비디아 블루필드-3 슈퍼NIC를 함께 사용하기로 선택했다.
▷ 원문보기 : https://hpcforum.kr/release/page?id=241024115220181
제1조(목적)
본 약관은 한국초고성능컴퓨팅포럼(이하 "포럼"이라 한다)이 제공하는 서비스의 이용조건 및 절차, 이용자와 포럼의 권리, 의무, 책임사항과 기타 필요한 사항을 규정함을 목적으로 합니다.
제2조(약관의 효력과 변경)
1. 귀하가 본 약관 내용에 동의하는 경우, 포럼의 서비스 제공 행위 및 귀하의 서비스 사용 행위에 본 약관이 우선적으로 적용됩니다.
2. 포럼은 본 약관을 사전 고지 없이 변경할 수 있고, 변경된 약관은 포럼 내에 공지하거나 E-mail을 통해 회원에게 공지하며, 공지와 동시에 그 효력이 발생됩니다. 이용자가 변경된 약관에 동의하지 않는 경우, 이용자는 본인의 회원등록을 취소(회원탈퇴)할 수 있으며 계속 사용의 경우는 약관 변경에 대한 동의로 간주됩니다.
제3조(약관 외 준칙)
본 약관에 명시되지 않은 사항은 전기통신기본법, 전기통신사업법, 정보통신망 이용촉진 및 정보보호 등에 관한 법률 및 기타 관련 법령의 규정에 의합니다.
제4조(용어의 정의)
본 약관에서 사용하는 용어의 정의는 다음과 같습니다.
1. 이용자 : 본 약관에 따라 포럼이 제공하는 서비스를 받는 자.
2. 가입 : 포럼이 제공하는 신청서 양식에 해당 정보를 기입하고, 본 약관에 동의하여 서비스 이용계약을 완료시키는 행위.
3. 회원 : 포럼에 개인 정보를 제공하여 회원 등록을 한 자로서 포럼이 제공하는 서비스를 이용할 수 있는 자.
4. 비밀번호 : 이용자와 회원ID가 일치하는지를 확인하고 통신상의 자신의 비밀보호를 위하여 이용자 자신이 선정한 문자와 숫자의 조합.
5. 탈퇴 : 회원이 이용계약을 종료시키는 행위.
(... 이하 생략 ...)
1 개인정보의 처리 목적
① 한국초고성능컴퓨팅포럼은(는) 다음의 목적을 위하여 개인정보를 처리합니다. 처리하고 있는 개인정보는 다음의 목적 이외의 용도로는 이용되지 않으며 이용 목적이 변경되는 경우에는 「개인정보 보호법」 제18조에 따라 별도의 동의를 받는 등 필요한 조치를 이행할 예정입니다.
1. 홈페이지 회원가입 및 관리
회원 가입의사 확인, 회원제 서비스 제공에 따른 본인 식별·인증, 회원자격 유지·관리, 서비스 부정이용 방지, 만14세 미만 아동의 개인정보 처리 시 법정대리인의 동의여부 확인, 각종 고지·통지, 고충처리 목적으로 개인정보를 처리합니다.
2. 개인정보의 처리 및 보유 기간
① 한국초고성능컴퓨팅포럼은(는) 법령에 따른 개인정보 보유·이용기간 또는 정보주체로부터 개인정보를 수집 시에 동의받은 개인정보 보유·이용기간 내에서 개인정보를 처리·보유합니다.
② 각각의 개인정보 처리 및 보유 기간은 다음과 같습니다.
1. 홈페이지 회원가입 및 관리
홈페이지 회원가입 및 관리와 관련한 개인정보는 수집.이용에 관한 동의일로부터 준영구적으로 보유.이용됩니다.
(... 이하 생략 ...)
공고일자 : 2023년 07월 03일
시행일자 : 2023년 07월 03일