지식/인사이트
NCSA의 SEAS 팀, AlphaFold2의 APACE 유지
등록일: 2024-07-22 15:42:35
작성자: 관리자

고성능 컴퓨팅(HPC)은 연구자들이 사용하기 어려울 수 있는 경우가 많습니다. 왜냐하면 대규모 데이터 세트를 다루고, 소프트웨어를 확장하고, 최상의 사용자 인터페이스를 선택하는 데 전문 지식이 필요하기 때문입니다.

일리노이 대학교 어바나-샴페인 캠퍼스의 국립 슈퍼컴퓨팅 응용 센터(NCSA)는 슈퍼컴퓨팅 시스템을 배치하고 운영할 뿐만 아니라, 연구자들에게 이러한 시스템을 간단하고 효율적으로 사용할 수 있는 방법을 제공 합니다 .

NCSA의 과학 및 공학 응용 프로그램 지원(SEAS)은 연구자들이 처분 가능한 하드웨어 및 소프트웨어 리소스의 효율성을 극대화하도록 돕습니다. SEAS 팀은 Python 패키지 설치, AI 모델 배포, 프로젝트에 가장 적합한 병렬 계산 엔진 선택을 포함한 다양한 측면에서 연구자들과 협력합니다.

최근 발간된 PNAS 논문 (미국 국립과학원 회보) 에 설명된 새로운 계산 프레임워크는 SEAS 팀이 AI 모델을 사용하여 3차원 단백질 구조를 이해하고 단백질의 구조적 다양성을 예측하는 프로세스를 단순화하고 가속화하는 데 큰 영향을 미쳤습니다.

이 논문은 SEAS 그룹의 수석 연구 프로그래머인 롤랜드 하스, 미국 에너지부(DOE) Argonne National Laboratory의 변환 AI 책임자이자 시카고 대학의 CASE 수석 과학자인 엘리우 후에르타, 일리노이 대학 생물물리학 박사과정생인 현 박, NCSA 대학원 연구 조수인 파스 파텔이 공동으로 작성했습니다.

이 프로젝트의 일환으로 연구팀은 보호 구조를 예측하는 AI 프로그램인 AlphaFold2의 성능을 향상시키도록 설계된 계산 도구인 APACE를 개발했습니다. APACE는 단백질 구조를 예측하기 위해 AlphaFold 2의 정확성과 견고성을 향상시키도록 설계되었습니다. 이 기술적 혁신은 생물의학 연구자들이 생명의 근본적인 메커니즘을 밝히고, 새로운 재료를 개발하고, 생명공학을 발전시키는 데 도움이 될 것입니다.

APACE의 효율성과 성능을 평가하기 위해 연구팀은 NCSA의 Delta 슈퍼컴퓨터에 도구를 배포하여 4개의 표본 단백질 구조를 예측했습니다. 300개의 NVIDIA A100 GPU에 분산된 최대 300개의 앙상블을 사용하여 APACE는 AlphaFold 구현에 비해 최대 100배 더 빠른 결과를 제공했습니다.

이 팀은 나중에 Argonne Leadership Computing Facility의 Polaris 슈퍼컴퓨터에서 작업을 재현하여 비슷한 결과를 얻었습니다. 이 프로젝트의 성공은 이러한 방법이 다양한 과학 분야에서 사용될 수 있는 잠재력을 강조하며, 연구자들이 과학적 발견을 자동화하고 가속화할 수도 있습니다.

"재단 AI 모델은 광범위한 과학 커뮤니티에서 찾을 수 있고, 접근 가능하며, 사용할 준비가 되어 있다면 과학 관행을 변화시킬 잠재력이 있습니다."라고 Huerta는 말했습니다. "이 프로젝트는 최첨단 AI를 진정으로 민주화하고 현대 컴퓨팅 환경을 활용하여 과학적 도달 범위를 극대화하는 데 필요한 과학 데이터 인프라를 만들고 공유하는 방법을 보여줍니다."

생물의학 연구자들은 단백질이 어떻게 형성되는지, 즉 단백질 접힘이라고 알려진 과정을 이해하기 위해 오랫동안 노력해 왔습니다. 단백질은 아미노산 사슬로 구성되어 있으며, 아미노산 사슬은 특정 기능을 수행하기 위해 구조화된 형태로 조립됩니다. 단백질 접힘을 이해하면 생물학적 과정이 어떻게 작동하는지, 단백질 접힘의 오류가 어떻게 질병으로 이어질 수 있는지 설명하는 데 도움이 될 수 있습니다.

지금까지 가장 큰 과제는 단백질 접힘을 예측하는 것이었습니다. 단백질 접힘은 복잡한 분자 상호작용이 있는 매우 계산 집약적인 프로세스일 수 있기 때문입니다. 복잡성에 더해, 단백질 구조는 많은 수의 가능한 형태로 접힐 수 있습니다.

X선 결정학이나 크라이오-EM과 같은 단백질 구조를 연구하는 전통적인 방법은 정적 스냅샷을 제공하는 데는 성공적이지만, 단백질의 동적 행동을 포착하는 데는 실패했습니다.

이제 APACE를 통해 연구자들은 AlphaFold2를 최적화하여 HPC 플랫폼에서 대규모로 실행하여 전례 없는 성능과 효율성을 제공하는 강력한 도구를 사용할 수 있습니다. 이 기술은 다중 단백질 복합체를 연구하고, 더 높은 해상도로 결과를 포착하고, 기존 방법에 비해 더 짧은 시간 내에 결과를 제공할 수 있습니다.

"APACE는 약물 연구자들이 잠재적 후보 화합물을 선별하는 데 필요한 시간을 크게 줄여 가장 유망한 물질에 집중할 수 있도록 해줍니다. 이런 방식으로 더 많은 화합물을 테스트할 수 있고, 예를 들어 특정 바이러스 균주에 맞춰진 신약을 개발하는 데 걸리는 시간을 줄일 수 있습니다."라고 하스는 말했습니다.

APACE는 데이터와 계산 능력에 대한 접근성을 용이하게 함으로써 AI 모델 계산을 가속화하여 과학 분야 전반에 걸쳐 유익한 상당한 속도 향상을 가져옵니다

.

Huerta에 따르면, 연구팀은 APACE 사용자 기반을 더 쉽게 접근할 수 있도록 하여 계속 확장할 것입니다. 또한 팀은 처리 속도를 제한하는 시스템의 나머지 병목 현상을 극복하는 데 집중할 계획입니다. 또한 팀은 AlphaFold2를 다른 기초적인 머신 러닝 모델에서 향상시키기 위해 개발된 방법을 사용하여 전 세계 연구자들이 과학적 발전을 위해 사용할 수 있기를 바랍니다.

▷ 원문보기 : https://www.hpcwire.com/2024/07/09/ncsas-seas-team-keeps-apace-of-alphafold2/


이전글 Nvidia, Intel, 새로운 Apple AI 및 HPC 개발 도구에서 환영받지 못함
다음글 Infleqtion Installs First Quantum Computer At NQCC