구글클라우드(GCP)가 인공지능(AI) 추론 향상을 위한 7세대 텐서프로세스유닛(TPU) ‘아이언우드’를 정식 공개했다. 이와 함께 ARNM 기반 ‘액시온’ 가상머신(VM) 인스턴스의 프리뷰 버전도 선보인 GCP는 고객에게 인공지능(AI) 추론과 범용 컴퓨팅 워크로드 전반에서 더 향상된 성능과 효율성 혁신을 제공할 예정이다.
아이언우드는 대규모 모델 학습과 복잡한 강화학습(RL), 대용량·저지연 AI 추론 등 가장 까다로운 AI 워크로드를 처리하도록 설계된 컴퓨팅 솔루션으로 GCP의 통합 AI 슈퍼컴퓨팅 시스템 ‘AI 하이퍼컴퓨터’의 핵심 구성 요소다.
기존 5세대 TPU에 비해 최대 10배 향상된 성능을, 트릴리움(TPU v6e) 대비 칩당 최대 4배 향상된 학습·추론 작업 성능을 제공한다는 게 GCP의 설명이다.
컴퓨팅·네트워킹·스토리지·소프트웨어를 통합해 시스템 전반의 성능과 효율성을 향상시킨 아이언우드는 최대 9,216개의 칩으로 구성된 슈퍼포드로 확장할 수 있으며, 초고속 인터칩 인터커넥트(ICI) 네트워킹 기술로 연결돼 9.6Tb/s의 속도를 구현한다.
GCP는 "이를 통해 1.77PB의 공유 고대역폭 메모리(HBM)에 액세스해 복잡한 AI 모델에서 발생하는 데이터 병목 현상을 최소화할 수 있다"고 강조했다.
이외에도 아이언우드는 광회로 스위칭(Optical Circuit Switching, OCS) 기술을 적용해 네트워크 장애가 발생해도 실시간으로 경로를 재구성해 서비스 중단 없이 워크로드를 복구할 수 있고, 성능 향상이 필요한 경우에는 수십만 개의 TPU를 클러스터로 확장할 수 있있도록 설계됐다.
지난 4월 프리뷰 버전으로 공개된 아이언우드는 다수의 글로벌 AI 선도기업과 스타트업에서 활용되면서 모델 학습과 서비스 효율 극대화 역량을 검증받았다고 GCP는 설명했다.
아이언우드로 대규모 클로드 모델 학습부터 수백만 명의 사용자에게 서비스를 제공하기 위한 환경 구축을 가속화한 앤트로픽의 경우, 향후 최대 100만 개의 TPU 사용을 계획하고 있는 것으로 알려진다.
액시온은 아이언우드가 모델 서비스의 복잡한 작업을 처리하는 동안 고용량 데이터 준비, 수집, 지능형 애플리케이션 호스팅과 같은 운영 상의 백본 역할을 수행한다.
GCP는 "프리뷰 버전으로 공개된 N4A는 두 번째 범용 악시온 VM으로 동급 x86 기반 VM 대비 최대 2배 우수한 가격 대비 성능을 제공해 마이크로서비스, 컨테이너화된 애플리케이션, 오픈소스 데이터베이스, 데이터 분석, 웹 서비스 작업 등에 활용할 수 있다"고 설명했다.
GCO는 첫 번째 ARM 기반 베어메탈 인스턴스인 C4A 메탈을 조만간 프리뷰 버전으로 출시할 계획도 공유했다. C4A 메탈은 안드로이드 개발, 차량 내 시스템, 엄격한 라이선스가 필요한 소프트웨어, 복잡한 시뮬레이션 실행과 같은 전문화된 워크로드를 위한 전용 물리 서버를 제공한다.
GCP는 액시온 포트폴리오에 N4A, C4A, C4A 메탈 등 3개 옵션을 제공함으로써, 고객이 원하는 성능과 워크로드별 요구사항에 부응하면서도 비즈니스 운영의 총 비용을 낮출 수 있도록 지원할 계획이다.
마크 로메이어 GCP 부사장은 “에이전트 워크플로와 컴퓨팅 수요의 기하급수적인 증가는 오늘날 추론의 시대를 새로 정의하고 있다”며 “하드웨어부터 소프트웨어, 관리형 서비스까지 긴밀히 통합된 풀스택 AI 하이퍼컴퓨터를 바탕으로 GCP 고객은 아이언우드와 액시온을 비롯한 다양한 컴퓨팅 옵션을 조합해 가장 까다로운 워크로드에도 최적의 유연성과 성능을 확보할 수 있을 것”이라고 전했다.
출처 : ITBizNews(https://www.itbiznews.com)
원문보기:https://www.itbiznews.com/news/articleView.html?idxno=186422
제1조(목적)
본 약관은 한국초고성능컴퓨팅포럼(이하 "포럼"이라 한다)이 제공하는 서비스의 이용조건 및 절차, 이용자와 포럼의 권리, 의무, 책임사항과 기타 필요한 사항을 규정함을 목적으로 합니다.
제2조(약관의 효력과 변경)
1. 귀하가 본 약관 내용에 동의하는 경우, 포럼의 서비스 제공 행위 및 귀하의 서비스 사용 행위에 본 약관이 우선적으로 적용됩니다.
2. 포럼은 본 약관을 사전 고지 없이 변경할 수 있고, 변경된 약관은 포럼 내에 공지하거나 E-mail을 통해 회원에게 공지하며, 공지와 동시에 그 효력이 발생됩니다. 이용자가 변경된 약관에 동의하지 않는 경우, 이용자는 본인의 회원등록을 취소(회원탈퇴)할 수 있으며 계속 사용의 경우는 약관 변경에 대한 동의로 간주됩니다.
제3조(약관 외 준칙)
본 약관에 명시되지 않은 사항은 전기통신기본법, 전기통신사업법, 정보통신망 이용촉진 및 정보보호 등에 관한 법률 및 기타 관련 법령의 규정에 의합니다.
제4조(용어의 정의)
본 약관에서 사용하는 용어의 정의는 다음과 같습니다.
1. 이용자 : 본 약관에 따라 포럼이 제공하는 서비스를 받는 자.
2. 가입 : 포럼이 제공하는 신청서 양식에 해당 정보를 기입하고, 본 약관에 동의하여 서비스 이용계약을 완료시키는 행위.
3. 회원 : 포럼에 개인 정보를 제공하여 회원 등록을 한 자로서 포럼이 제공하는 서비스를 이용할 수 있는 자.
4. 비밀번호 : 이용자와 회원ID가 일치하는지를 확인하고 통신상의 자신의 비밀보호를 위하여 이용자 자신이 선정한 문자와 숫자의 조합.
5. 탈퇴 : 회원이 이용계약을 종료시키는 행위.
(... 이하 생략 ...)
1 개인정보의 처리 목적
① 한국초고성능컴퓨팅포럼은(는) 다음의 목적을 위하여 개인정보를 처리합니다. 처리하고 있는 개인정보는 다음의 목적 이외의 용도로는 이용되지 않으며 이용 목적이 변경되는 경우에는 「개인정보 보호법」 제18조에 따라 별도의 동의를 받는 등 필요한 조치를 이행할 예정입니다.
1. 홈페이지 회원가입 및 관리
회원 가입의사 확인, 회원제 서비스 제공에 따른 본인 식별·인증, 회원자격 유지·관리, 서비스 부정이용 방지, 만14세 미만 아동의 개인정보 처리 시 법정대리인의 동의여부 확인, 각종 고지·통지, 고충처리 목적으로 개인정보를 처리합니다.
2. 개인정보의 처리 및 보유 기간
① 한국초고성능컴퓨팅포럼은(는) 법령에 따른 개인정보 보유·이용기간 또는 정보주체로부터 개인정보를 수집 시에 동의받은 개인정보 보유·이용기간 내에서 개인정보를 처리·보유합니다.
② 각각의 개인정보 처리 및 보유 기간은 다음과 같습니다.
1. 홈페이지 회원가입 및 관리
홈페이지 회원가입 및 관리와 관련한 개인정보는 수집.이용에 관한 동의일로부터 준영구적으로 보유.이용됩니다.
(... 이하 생략 ...)
공고일자 : 2023년 07월 03일
시행일자 : 2023년 07월 03일