고성능 컴퓨팅(HPC)은 연구자들이 사용하기 어려울 수 있는 경우가 많습니다. 왜냐하면 대규모 데이터 세트를 다루고, 소프트웨어를 확장하고, 최상의 사용자 인터페이스를 선택하는 데 전문 지식이 필요하기 때문입니다.
일리노이 대학교 어바나-샴페인 캠퍼스의 국립 슈퍼컴퓨팅 응용 센터(NCSA)는 슈퍼컴퓨팅 시스템을 배치하고 운영할 뿐만 아니라, 연구자들에게 이러한 시스템을 간단하고 효율적으로 사용할 수 있는 방법을 제공 합니다 .
NCSA의 과학 및 공학 응용 프로그램 지원(SEAS)은 연구자들이 처분 가능한 하드웨어 및 소프트웨어 리소스의 효율성을 극대화하도록 돕습니다. SEAS 팀은 Python 패키지 설치, AI 모델 배포, 프로젝트에 가장 적합한 병렬 계산 엔진 선택을 포함한 다양한 측면에서 연구자들과 협력합니다.
최근 발간된 PNAS 논문 (미국 국립과학원 회보) 에 설명된 새로운 계산 프레임워크는 SEAS 팀이 AI 모델을 사용하여 3차원 단백질 구조를 이해하고 단백질의 구조적 다양성을 예측하는 프로세스를 단순화하고 가속화하는 데 큰 영향을 미쳤습니다.
이 논문은 SEAS 그룹의 수석 연구 프로그래머인 롤랜드 하스, 미국 에너지부(DOE) Argonne National Laboratory의 변환 AI 책임자이자 시카고 대학의 CASE 수석 과학자인 엘리우 후에르타, 일리노이 대학 생물물리학 박사과정생인 현 박, NCSA 대학원 연구 조수인 파스 파텔이 공동으로 작성했습니다.
이 프로젝트의 일환으로 연구팀은 보호 구조를 예측하는 AI 프로그램인 AlphaFold2의 성능을 향상시키도록 설계된 계산 도구인 APACE를 개발했습니다. APACE는 단백질 구조를 예측하기 위해 AlphaFold 2의 정확성과 견고성을 향상시키도록 설계되었습니다. 이 기술적 혁신은 생물의학 연구자들이 생명의 근본적인 메커니즘을 밝히고, 새로운 재료를 개발하고, 생명공학을 발전시키는 데 도움이 될 것입니다.
APACE의 효율성과 성능을 평가하기 위해 연구팀은 NCSA의 Delta 슈퍼컴퓨터에 도구를 배포하여 4개의 표본 단백질 구조를 예측했습니다. 300개의 NVIDIA A100 GPU에 분산된 최대 300개의 앙상블을 사용하여 APACE는 AlphaFold 구현에 비해 최대 100배 더 빠른 결과를 제공했습니다.
이 팀은 나중에 Argonne Leadership Computing Facility의 Polaris 슈퍼컴퓨터에서 작업을 재현하여 비슷한 결과를 얻었습니다. 이 프로젝트의 성공은 이러한 방법이 다양한 과학 분야에서 사용될 수 있는 잠재력을 강조하며, 연구자들이 과학적 발견을 자동화하고 가속화할 수도 있습니다.
"재단 AI 모델은 광범위한 과학 커뮤니티에서 찾을 수 있고, 접근 가능하며, 사용할 준비가 되어 있다면 과학 관행을 변화시킬 잠재력이 있습니다."라고 Huerta는 말했습니다. "이 프로젝트는 최첨단 AI를 진정으로 민주화하고 현대 컴퓨팅 환경을 활용하여 과학적 도달 범위를 극대화하는 데 필요한 과학 데이터 인프라를 만들고 공유하는 방법을 보여줍니다."
생물의학 연구자들은 단백질이 어떻게 형성되는지, 즉 단백질 접힘이라고 알려진 과정을 이해하기 위해 오랫동안 노력해 왔습니다. 단백질은 아미노산 사슬로 구성되어 있으며, 아미노산 사슬은 특정 기능을 수행하기 위해 구조화된 형태로 조립됩니다. 단백질 접힘을 이해하면 생물학적 과정이 어떻게 작동하는지, 단백질 접힘의 오류가 어떻게 질병으로 이어질 수 있는지 설명하는 데 도움이 될 수 있습니다.
지금까지 가장 큰 과제는 단백질 접힘을 예측하는 것이었습니다. 단백질 접힘은 복잡한 분자 상호작용이 있는 매우 계산 집약적인 프로세스일 수 있기 때문입니다. 복잡성에 더해, 단백질 구조는 많은 수의 가능한 형태로 접힐 수 있습니다.
X선 결정학이나 크라이오-EM과 같은 단백질 구조를 연구하는 전통적인 방법은 정적 스냅샷을 제공하는 데는 성공적이지만, 단백질의 동적 행동을 포착하는 데는 실패했습니다.
이제 APACE를 통해 연구자들은 AlphaFold2를 최적화하여 HPC 플랫폼에서 대규모로 실행하여 전례 없는 성능과 효율성을 제공하는 강력한 도구를 사용할 수 있습니다. 이 기술은 다중 단백질 복합체를 연구하고, 더 높은 해상도로 결과를 포착하고, 기존 방법에 비해 더 짧은 시간 내에 결과를 제공할 수 있습니다.
"APACE는 약물 연구자들이 잠재적 후보 화합물을 선별하는 데 필요한 시간을 크게 줄여 가장 유망한 물질에 집중할 수 있도록 해줍니다. 이런 방식으로 더 많은 화합물을 테스트할 수 있고, 예를 들어 특정 바이러스 균주에 맞춰진 신약을 개발하는 데 걸리는 시간을 줄일 수 있습니다."라고 하스는 말했습니다.
APACE는 데이터와 계산 능력에 대한 접근성을 용이하게 함으로써 AI 모델 계산을 가속화하여 과학 분야 전반에 걸쳐 유익한 상당한 속도 향상을 가져옵니다
.
Huerta에 따르면, 연구팀은 APACE 사용자 기반을 더 쉽게 접근할 수 있도록 하여 계속 확장할 것입니다. 또한 팀은 처리 속도를 제한하는 시스템의 나머지 병목 현상을 극복하는 데 집중할 계획입니다. 또한 팀은 AlphaFold2를 다른 기초적인 머신 러닝 모델에서 향상시키기 위해 개발된 방법을 사용하여 전 세계 연구자들이 과학적 발전을 위해 사용할 수 있기를 바랍니다.
▷ 원문보기 : https://www.hpcwire.com/2024/07/09/ncsas-seas-team-keeps-apace-of-alphafold2/
제1조(목적)
본 약관은 한국초고성능컴퓨팅포럼(이하 "포럼"이라 한다)이 제공하는 서비스의 이용조건 및 절차, 이용자와 포럼의 권리, 의무, 책임사항과 기타 필요한 사항을 규정함을 목적으로 합니다.
제2조(약관의 효력과 변경)
1. 귀하가 본 약관 내용에 동의하는 경우, 포럼의 서비스 제공 행위 및 귀하의 서비스 사용 행위에 본 약관이 우선적으로 적용됩니다.
2. 포럼은 본 약관을 사전 고지 없이 변경할 수 있고, 변경된 약관은 포럼 내에 공지하거나 E-mail을 통해 회원에게 공지하며, 공지와 동시에 그 효력이 발생됩니다. 이용자가 변경된 약관에 동의하지 않는 경우, 이용자는 본인의 회원등록을 취소(회원탈퇴)할 수 있으며 계속 사용의 경우는 약관 변경에 대한 동의로 간주됩니다.
제3조(약관 외 준칙)
본 약관에 명시되지 않은 사항은 전기통신기본법, 전기통신사업법, 정보통신망 이용촉진 및 정보보호 등에 관한 법률 및 기타 관련 법령의 규정에 의합니다.
제4조(용어의 정의)
본 약관에서 사용하는 용어의 정의는 다음과 같습니다.
1. 이용자 : 본 약관에 따라 포럼이 제공하는 서비스를 받는 자.
2. 가입 : 포럼이 제공하는 신청서 양식에 해당 정보를 기입하고, 본 약관에 동의하여 서비스 이용계약을 완료시키는 행위.
3. 회원 : 포럼에 개인 정보를 제공하여 회원 등록을 한 자로서 포럼이 제공하는 서비스를 이용할 수 있는 자.
4. 비밀번호 : 이용자와 회원ID가 일치하는지를 확인하고 통신상의 자신의 비밀보호를 위하여 이용자 자신이 선정한 문자와 숫자의 조합.
5. 탈퇴 : 회원이 이용계약을 종료시키는 행위.
(... 이하 생략 ...)
1 개인정보의 처리 목적
① 한국초고성능컴퓨팅포럼은(는) 다음의 목적을 위하여 개인정보를 처리합니다. 처리하고 있는 개인정보는 다음의 목적 이외의 용도로는 이용되지 않으며 이용 목적이 변경되는 경우에는 「개인정보 보호법」 제18조에 따라 별도의 동의를 받는 등 필요한 조치를 이행할 예정입니다.
1. 홈페이지 회원가입 및 관리
회원 가입의사 확인, 회원제 서비스 제공에 따른 본인 식별·인증, 회원자격 유지·관리, 서비스 부정이용 방지, 만14세 미만 아동의 개인정보 처리 시 법정대리인의 동의여부 확인, 각종 고지·통지, 고충처리 목적으로 개인정보를 처리합니다.
2. 개인정보의 처리 및 보유 기간
① 한국초고성능컴퓨팅포럼은(는) 법령에 따른 개인정보 보유·이용기간 또는 정보주체로부터 개인정보를 수집 시에 동의받은 개인정보 보유·이용기간 내에서 개인정보를 처리·보유합니다.
② 각각의 개인정보 처리 및 보유 기간은 다음과 같습니다.
1. 홈페이지 회원가입 및 관리
홈페이지 회원가입 및 관리와 관련한 개인정보는 수집.이용에 관한 동의일로부터 준영구적으로 보유.이용됩니다.
(... 이하 생략 ...)
공고일자 : 2023년 07월 03일
시행일자 : 2023년 07월 03일