과학기술 특화 LLM '고니' 기반 모델
외국산 대신 국산으로 전환 작업 착수
국대 AI + 출연연 LLM = AI 연구동료
업무보고 부총리 지시 후 KISTI 속도

배경훈 부총리 겸 과학기술정보통신부 장관이 12일 '과학기술 분야 출연연구기관 업무보고'에서 한국과학기술정보연구원(KISTI)이 개발한 과학기술 특화 거대언어모델(LLM) '고니(KONI)'의 기반 모델을 국산화하라고 지시하고 있다. 유튜브 캡처
1차 선발을 통과한 정예팀들이 개발하는 국가대표 독자 인공지능(AI) 파운데이션(기반) 모델을 정부가 추진 중인 과학연구 전용 AI 에이전트(AI 연구동료)에 활용하는 방안이 검토되고 있다. AI 연구동료가 이르면 6월 말부터 시범 운영을 시작할 예정인 만큼 독자 AI 모델의 성능과 활용도를 평가하는 첫 시험대가 될지 관심이 모인다.
27일 과학기술계에 따르면, 한국과학기술정보연구원(KISTI)은 자체 개발 중인 과학기술 특화 거대언어모델(LLM) '고니(KONI)'를 학습시키는 기반 모델을 국산으로 바꾸는 작업을 추진 중이다. 당초 구글의 경량 AI 모델 '젬마'를 기반으로 데이터 1억5,000만 건을 학습했는데, 젬마 대신 현재 정예팀들이 개발 중인 기반 모델을 사용하려는 것이다. KISTI는 배경훈 부총리 겸 과학기술정보통신부 장관이 최근 업무보고에서 고니 국산화를 콕 집어 지시한 뒤 이 작업에 속도를 내고 있다.
과학계는 이를 국산 AI 연구동료 개발의 밑 작업으로 보고 있다. AI 연구동료는 과학연구 전 과정을 지원하는 AI 시스템으로, 고니처럼 연구개발(R&D) 보고서와 논문을 학습해 도표나 수식이 포함된 과학기술 데이터를 이해하고 분석하는 데 특화한 LLM이 두뇌 역할을 맡아 판단과 추론을 내놓는다.
해외에선 AI 연구동료 개발이 상당히 진척됐다. 구글은 가설을 세우고 실험을 설계하는 AI 에이전트 '코사이언티스트'를 이미 지난해 공개했고, 비영리 연구그룹 퓨처하우스도 수개월 걸리는 연구를 몇 시간 만에 해내는 '코스모스'를 내놨다. 미국은 사람 없이 연구하는 에이전트 개발에까지 나섰고, 중국도 사람 개입을 최소한으로 줄여 연구하는 시스템을 고도화하고 있다.
AI 연구동료는 첨단산업의 근간인 원천기술 개발의 중요한 도구라는 점에서 국산화 필요성이 제기된다. 해외 AI 모델 기반의 AI 연구동료를 쓰다 자칫 라이선스나 보안 문제가 생길 경우 기술 주권이 위협받을 수 있기 때문이다. 문제는 초기에 고니가 경량 AI 모델을 기반으로 만들어졌기에 이보다 규모가 큰 독자 AI 모델을 쓰려면 학습에 필요한 그래픽처리장치(GPU)가 적어도 200장은 더 필요하다는 점이다. KISTI가 현재 보유한 GPU나 슈퍼컴퓨터 인프라로는 국산 기반 모델로의 전환에 속도가 나기 어렵다.
정부와 공공 연구기관이 그간 많은 예산을 들여 AI 정책을 추진해온 만큼 고니와 독자 AI 모델로 AI 연구동료 시스템을 제대로 구축하느냐는 정책의 실질적 성과를 가늠할 잣대가 될 거란 시각이 과학계에서 나온다. 이경하 KISTI 초거대AI연구센터장은 "재학습에 필요한 GPU 확충을 위해 과기정통부와 협의 중"이라며 "독자 AI 모델로의 전환 작업을 연내에 완료하는 게 목표"라고 말했다.
김태연 기자 (tykim@hankookilbo.com)
원문보기 : https://n.news.naver.com/mnews/article/469/0000911274?sid=105
제1조(목적)
본 약관은 한국초고성능컴퓨팅포럼(이하 "포럼"이라 한다)이 제공하는 서비스의 이용조건 및 절차, 이용자와 포럼의 권리, 의무, 책임사항과 기타 필요한 사항을 규정함을 목적으로 합니다.
제2조(약관의 효력과 변경)
1. 귀하가 본 약관 내용에 동의하는 경우, 포럼의 서비스 제공 행위 및 귀하의 서비스 사용 행위에 본 약관이 우선적으로 적용됩니다.
2. 포럼은 본 약관을 사전 고지 없이 변경할 수 있고, 변경된 약관은 포럼 내에 공지하거나 E-mail을 통해 회원에게 공지하며, 공지와 동시에 그 효력이 발생됩니다. 이용자가 변경된 약관에 동의하지 않는 경우, 이용자는 본인의 회원등록을 취소(회원탈퇴)할 수 있으며 계속 사용의 경우는 약관 변경에 대한 동의로 간주됩니다.
제3조(약관 외 준칙)
본 약관에 명시되지 않은 사항은 전기통신기본법, 전기통신사업법, 정보통신망 이용촉진 및 정보보호 등에 관한 법률 및 기타 관련 법령의 규정에 의합니다.
제4조(용어의 정의)
본 약관에서 사용하는 용어의 정의는 다음과 같습니다.
1. 이용자 : 본 약관에 따라 포럼이 제공하는 서비스를 받는 자.
2. 가입 : 포럼이 제공하는 신청서 양식에 해당 정보를 기입하고, 본 약관에 동의하여 서비스 이용계약을 완료시키는 행위.
3. 회원 : 포럼에 개인 정보를 제공하여 회원 등록을 한 자로서 포럼이 제공하는 서비스를 이용할 수 있는 자.
4. 비밀번호 : 이용자와 회원ID가 일치하는지를 확인하고 통신상의 자신의 비밀보호를 위하여 이용자 자신이 선정한 문자와 숫자의 조합.
5. 탈퇴 : 회원이 이용계약을 종료시키는 행위.
(... 이하 생략 ...)
1 개인정보의 처리 목적
① 한국초고성능컴퓨팅포럼은(는) 다음의 목적을 위하여 개인정보를 처리합니다. 처리하고 있는 개인정보는 다음의 목적 이외의 용도로는 이용되지 않으며 이용 목적이 변경되는 경우에는 「개인정보 보호법」 제18조에 따라 별도의 동의를 받는 등 필요한 조치를 이행할 예정입니다.
1. 홈페이지 회원가입 및 관리
회원 가입의사 확인, 회원제 서비스 제공에 따른 본인 식별·인증, 회원자격 유지·관리, 서비스 부정이용 방지, 만14세 미만 아동의 개인정보 처리 시 법정대리인의 동의여부 확인, 각종 고지·통지, 고충처리 목적으로 개인정보를 처리합니다.
2. 개인정보의 처리 및 보유 기간
① 한국초고성능컴퓨팅포럼은(는) 법령에 따른 개인정보 보유·이용기간 또는 정보주체로부터 개인정보를 수집 시에 동의받은 개인정보 보유·이용기간 내에서 개인정보를 처리·보유합니다.
② 각각의 개인정보 처리 및 보유 기간은 다음과 같습니다.
1. 홈페이지 회원가입 및 관리
홈페이지 회원가입 및 관리와 관련한 개인정보는 수집.이용에 관한 동의일로부터 준영구적으로 보유.이용됩니다.
(... 이하 생략 ...)
공고일자 : 2023년 07월 03일
시행일자 : 2023년 07월 03일