엔비디아와 소프트뱅크가 일본 내 인공지능(AI) 생태계에서 혁신을 지원할 일본 최대 규모의 ‘AI 슈퍼컴퓨터’ 구축에 나선다. 소프트뱅크는 이 시스템의 구축을 위해 세계 최초로 ‘엔비디아 DGX B200’ 시스템을 구축받을 계획이다.
엔비디아는 13일(현지시각) 일본 도쿄에서 열린 ‘엔비디아 AI 서밋 일본 2024’의 기조연설을 통해 소프트뱅크와 일본에서 가장 강력한 AI 슈퍼컴퓨터를 구축하고 있다고 발표했다. 이번에 구축되는 시스템은 AI에서 25엑사플롭스(EFlops) 연산 성능을 제공할 것으로 기대된다.
엔비디아와 소프트뱅크는 이 시스템 외에도 극도로 컴퓨팅 집약적인 워크로드를 위한 또 다른 ‘그레이스 블랙웰(GB:Grace Blackwell)’ 플랫폼 기반 가속 슈퍼컴퓨터를 구축할 계획이다. 또한 통신 네트워크에도 AI-RAN(Radio Access Network) 구현 등에서 협력하고 있으며 통신 사업자들의 기지국을 AI 수익 창출 자산으로 전환할 수 있는 기회를 제공한다고 밝혔다.
새로운 AI 슈퍼컴퓨터, 앞으로의 AI 혁신 지원할 ‘AI 팩토리’
젠슨 황 엔비디아 CEO는 이번 ‘엔비디아 AI 서밋 일본 2024’의 기조연설을 통해 “AI 시대의 혁신은 ‘인텔리전스’를 만드는 것이다. 컴퓨트에서 시작된 영향력은 이제 모든 산업군에 전해지고 있다”고 말했다. 소프트뱅크와 함께 구축하는 ‘AI 슈퍼컴퓨터’는 일본에서 가장 높은 성능을 갖춘 시스템이자 ‘일본에서 가장 큰 AI 팩토리’라고 소개했다.
이 시스템은 엔비디아의 DGX를 기반으로 한다. 소프트뱅크는 시스템 구축을 위해 세계 최초로 엔비디아의 DGX B200 시스템을 공급받을 예정이다. 이 시스템이 구축되면 일본에서 가장 뛰어난 성능을 발휘할 것으로 기대된다. 엔비디아의 퀀텀-2 인피니밴드 네트워킹과 AI 엔터프라이즈 소프트웨어 환경을 갖춰 거대언어모델(LLM) 개발에도 이상적이다.
젠슨 황 CEO는 “이 시스템은 AI에서 25엑사플롭스 성능을 제공할 것이다. 현재 세계 최대 슈퍼컴퓨터의 연산 성능이 1 엑사플롭스 급이다”라고 말했다. 물론 현실적으로는 데이터 유형이 다르기 때문에 양 쪽의 연산 성능 수치를 직접 비교할 수는 없다.
소프트뱅크는 자체 생성형 AI 개발과 AI 관련 사업뿐만 아니라 일본 전역의 대학, 연구 기관, 기업에서 ‘블랙웰’ 기반 DGX 슈퍼팟(SuperPOD)을 사용할 계획이다. 소프트뱅크는 이 외에도 극도로 컴퓨팅 집약적인 워크로드를 위한 다른 엔비디아 기반 가속 슈퍼컴퓨터를 구축할 계획으로 알려졌다. 이 시스템은 엔비디아의 ‘그레이스 블랙웰’ 플랫폼 설계를 기반으로 하고 있다.
AI 슈퍼컴퓨터가 AI를 만드는 ‘AI 팩토리’라면 이를 사용자에까지 전달하는 것은 ‘네트워크’다. 엔비디아와 소프트뱅크는 이러한 ‘AI 네트워크’에 대해서도 AI와 5G 워크로드를 동시에 실행할 수 있는 새로운 유형의 통신 네트워크를 개발하는 기술 구현에서 중요한 지점에 이르렀다고 발표했다.
엔비디아와 소프트뱅크가 발표한 ‘AI-RAN’은 기지국 수준의 인프라에서 AI와 5G 네트워크 워크로드를 동시에 처리해 기지국을 AI를 통한 수익 창출이 가능한 자산으로 전환할 수 있게 할 것으로 기대된다. 엔비디아와 소프트뱅크는 ‘AI-RAN’인프라의 투자 가치로, 1달러를 투자할 때마다 약 5달러의 AI 추론 수익을 얻을 수 있을 것으로 예상한다. 운영 비용과 자본 비용을 고려하면 인프라에 추가하는 AI-RAN 서버에 대해 최대 219% 수익을 기대했다.
소프트뱅크는 이 ‘AI-RAN’에서 자율주행차의 원격 지원, 로보틱스 제어, 엣지에서의 멀티모달 검색 자동 생성 등의 실제 AI 추론 애플리케이션을 구현했다. 모든 추론 워크로드가 소프트뱅크의 AI-RAN 네트워크에서 최적으로 실행될 수 있었다고 밝혔다. 한편 소프트뱅크의 AI-RAN 솔루션 실험에는 엔비디아와 소프트뱅크와 함께 후지쯔와 레드햇이 참여했다.
젠슨 황 CEO는 “AI 팩토리가 AI를 만들면 이를 전달하는 것은 ‘AI 그리드’다. AI가 결합된 무선 네트워크는 통신 네트워크의 AI 혁신을 이끌고 새로운 유형의 인텔리전스를 전달할 것이다. 이는 새로운 산업과 경제 구조의 구축 등 새로운 혁신이 만들어지는 기회가 될 것이다”라고 말했다.
같은 기술에서 파생되는 AI의 두 가지 ‘방향성’
젠슨 황 CEO는 이 자리에서 “우리가 제시하는 ‘가속 컴퓨팅’은 CPU를 대체하는 것이 아니라 각 구성 요소들에 적합한 연산을 적합한 형태로 처리하는 것”이라며 “이는 컴퓨팅 모델에 근본적인 변화를 불러오면서 새로운 시대를 열고 있다”고 말했다. 엔비디아는 다양한 산업군을 위한 라이브러리들을 선보이며 GPU의 활용도를 지속적으로 넓히고 있다고 덧붙였다.
오늘날 ‘멀티모달’은 AI의 가능성을 무한하게 넓히는 근간이 됐다. 젠슨 황 CEO는 “이제 멀티모달 모델을 통해 데이터의 의미를 파악하는 것을 넘어 이를 연결, 전환하고 생성하는 것까지 가능해졌다”고 말했다. 이어 “다양한 조합으로 새로운 사례가 만들어질 수 있으며 지금은 시작일 뿐이다”라고 말했다.
이러한 발전에 따라 컴퓨팅 성능 요구도 빠르게 늘고 있으며 이를 지원하기 위해 성능을 높이면서 에너지 소비와 비용은 낮추는 효율 개선의 발전 방향이 필요하다고 제시했다. 또한 “AI는 단지 칩의 문제가 아니라 ‘시스템’으로 접근해야 한다”며 “블랙웰은 GPU의 명칭이자 시스템 구성의 명칭이기도 하다”고 말했다.
엔비디아의 ‘블랙웰’ GPU는 두 개의 ‘블랙웰’ 다이와 8개의 HBM3e 메모리가 연결돼 구성된다. 모듈 단위로는 두 개의 블랙웰 GPU와 한 개의 그레이스 CPU가 결합돼 ‘그레이스 블랙웰’이 된다. 이 모듈 또한 다른 모듈과 NV링크(NVLink)로 연결돼 랙 단위로 확장될 수 있다. 이러한 구성이 ‘GB200 NVL72’다. 젠슨 황 CEO는 “블랙웰은 슈퍼컴퓨터부터 엣지까지 다양한 규모로 적용 가능한 유연성을 갖췄다”고 언급했다.
젠슨 황 CEO는 향후 AI의 유형에 대해 크게 ‘디지털’과 ‘물리적’의 두 가지로 분류했다. 이 중 ‘디지털’ AI는 주어진 일을 처리하는 현재의 ‘워커’에서 ‘에이전트’로 변화하고 다양한 에이전트들이 연결될 것이라 제시했다. 또한 “엔비디아는 이 AI 에이전트 시대를 위한 솔루션을 제공하지는 않지만 이를 가능하게 하는 생태계의 기반 기술을 제공한다”며 AI 에이전트의 라이프사이클 전반을 지원하는 네모(NeMo) 라이브러리를 언급했다.
또한 젠슨 황 CEO는 “어느 에이전트도 100%를 해 줄 수는 없다. 하지만 50% 정도만 해 줘도 우리에게는 크게 도움이 될 것이다”라며 “AI가 사람의 직업을 대체하지는 않을 것이다. 하지만 ‘AI를 잘 활용하는 사람’이 당신의 자리를 대체할 수는 있을 것이다” 라고 말했다.
‘물리적’ AI는 ‘디지털’과 기반 기술은 같지만 기계적인 시스템에 적용된다는 점이 다르며 흔히 ‘산업용 AI(Industrial AI)’로 표현된다. 모델의 훈련과 시뮬레이션, 실제 로봇에 적용으로 이어지는 물리적 AI의 라이프사이클에서는 시뮬레이션을 제공하는 엔비디아 ‘옴니버스 (Omniverse)’ 플랫폼의 중요성을 강조했다.
젠슨 황 CEO는 “물리적 AI에서도 명령에 대한 모션을 AI로 생성하는 것도 생성형 AI 콘셉트의 일부로 볼 수 있다. 이런 부분이 옴니버스와 생성형 AI가 로봇 기술로 연결될 수 있는 이유다”라고 말했다.
▷ 원문보기 : https://it.chosun.com/news/articleView.html?idxno=2023092127301
제1조(목적)
본 약관은 한국초고성능컴퓨팅포럼(이하 "포럼"이라 한다)이 제공하는 서비스의 이용조건 및 절차, 이용자와 포럼의 권리, 의무, 책임사항과 기타 필요한 사항을 규정함을 목적으로 합니다.
제2조(약관의 효력과 변경)
1. 귀하가 본 약관 내용에 동의하는 경우, 포럼의 서비스 제공 행위 및 귀하의 서비스 사용 행위에 본 약관이 우선적으로 적용됩니다.
2. 포럼은 본 약관을 사전 고지 없이 변경할 수 있고, 변경된 약관은 포럼 내에 공지하거나 E-mail을 통해 회원에게 공지하며, 공지와 동시에 그 효력이 발생됩니다. 이용자가 변경된 약관에 동의하지 않는 경우, 이용자는 본인의 회원등록을 취소(회원탈퇴)할 수 있으며 계속 사용의 경우는 약관 변경에 대한 동의로 간주됩니다.
제3조(약관 외 준칙)
본 약관에 명시되지 않은 사항은 전기통신기본법, 전기통신사업법, 정보통신망 이용촉진 및 정보보호 등에 관한 법률 및 기타 관련 법령의 규정에 의합니다.
제4조(용어의 정의)
본 약관에서 사용하는 용어의 정의는 다음과 같습니다.
1. 이용자 : 본 약관에 따라 포럼이 제공하는 서비스를 받는 자.
2. 가입 : 포럼이 제공하는 신청서 양식에 해당 정보를 기입하고, 본 약관에 동의하여 서비스 이용계약을 완료시키는 행위.
3. 회원 : 포럼에 개인 정보를 제공하여 회원 등록을 한 자로서 포럼이 제공하는 서비스를 이용할 수 있는 자.
4. 비밀번호 : 이용자와 회원ID가 일치하는지를 확인하고 통신상의 자신의 비밀보호를 위하여 이용자 자신이 선정한 문자와 숫자의 조합.
5. 탈퇴 : 회원이 이용계약을 종료시키는 행위.
(... 이하 생략 ...)
1 개인정보의 처리 목적
① 한국초고성능컴퓨팅포럼은(는) 다음의 목적을 위하여 개인정보를 처리합니다. 처리하고 있는 개인정보는 다음의 목적 이외의 용도로는 이용되지 않으며 이용 목적이 변경되는 경우에는 「개인정보 보호법」 제18조에 따라 별도의 동의를 받는 등 필요한 조치를 이행할 예정입니다.
1. 홈페이지 회원가입 및 관리
회원 가입의사 확인, 회원제 서비스 제공에 따른 본인 식별·인증, 회원자격 유지·관리, 서비스 부정이용 방지, 만14세 미만 아동의 개인정보 처리 시 법정대리인의 동의여부 확인, 각종 고지·통지, 고충처리 목적으로 개인정보를 처리합니다.
2. 개인정보의 처리 및 보유 기간
① 한국초고성능컴퓨팅포럼은(는) 법령에 따른 개인정보 보유·이용기간 또는 정보주체로부터 개인정보를 수집 시에 동의받은 개인정보 보유·이용기간 내에서 개인정보를 처리·보유합니다.
② 각각의 개인정보 처리 및 보유 기간은 다음과 같습니다.
1. 홈페이지 회원가입 및 관리
홈페이지 회원가입 및 관리와 관련한 개인정보는 수집.이용에 관한 동의일로부터 준영구적으로 보유.이용됩니다.
(... 이하 생략 ...)
공고일자 : 2023년 07월 03일
시행일자 : 2023년 07월 03일