

사진은 A.X 4.0의 대규모 학습(Continual Pre-Training, CPT)을 진행한 SK텔레콤 자체 구축 슈퍼컴퓨터 '타이탄' /SK텔레콤
[메트로신문] '글로벌 AI 강국' 실현을 위한 재명 정부의 핵심 프로젝트, '독자 AI 파운데이션 모델 개발' 사업에 총 15개 컨소시엄이 참여했다. 정부는 오는 2027년까지 총 2136억원을 투입해 '전 국민 AI'에 활용될 국산 대형언어모델(LLM)을 개발할 계획이다. 사업 참여 의사를 밝힌 기업들은 잇따라 자체 개발 추론 모델을 오픈소스로 개방하며 기술력을 과시하고 있다.
24일 <메트로경제 신문> 취재에 따르면 지난 21일 공모 마감한 '독자 AI 파운데이션 모델 개발 프로젝트'에 총 15개 컨소시엄이 신청했다. AI 파운데이션 모델은 대규모 데이터를 기반으로 학습돼 다양한 작업에 범용적으로 활용 가능한 인공지능 모델을 뜻한다. 대표적으로 GPT, PaLM, Claude 같은 LLM이 여기에 포함되며, 한 번 학습된 후 텍스트 생성, 번역, 요약, 질의응답 등 여러 분야에 파인튜닝 없이도 적용될 수 있는 것이 특징이다.
이번 공모에 참가 의사를 밝힌 팀은 ▲네이버클라우드 ▲루닛 ▲모티프테크놀로지스 ▲바이오넥서스 ▲사이오닉에이아이 ▲업스테이지 ▲SK텔레콤 ▲NC AI ▲LG AI연구원 ▲정션메드 ▲카카오 ▲KT ▲코난테크놀로지 ▲파이온코퍼레이션 ▲한국과학기술원 등이다.
이번 공모는 서면·PT 평가를 거쳐 최종 5개 팀이 선정되며, 이후 단계별로 4개→3개→2개 팀으로 추려진다. 평가 기준은 ▲기술력 및 개발 경험(40점) ▲개발목표 및 전략(30점) ▲파급효과(30점)이며, '프롬 스크래치(From Scratch)' 방식으로 모델을 처음부터 자체 구축한 경험이 핵심 기준으로 떠올랐다.
네이버클라우드, LG AI연구원, NC AI, KT 등은 외산 모델 의존 없이 자체 기술로 30B 이상 LLM을 개발한 이력이 있어 유력 후보로 거론된다.
특히 네이버클라우드와 LG AI연구원은 이 기준에서 강점을 가진 대표 주자로 꼽힌다. 네이버클라우드는 2021년부터 AI를 자사 서비스에 적용해 실사용자 피드백을 받아왔으며, 30B급 이상 모델을 프롬 스크래치 방식으로 자체 구축한 경험이 있다. LG AI연구원 역시 엑사원 시리즈를 장기간 독자 개발해왔으며, 이는 미국 에포크AI가 선정한 '주목할 만한 AI 모델'에 등재된 바 있다.
업계에서는 두 기업 외에도 기술력 면에서 업스테이지, 서비스 확장성과 생태계 구축 면에서 SK텔레콤, 공공 분야 확장성이 강한 KT 등을 주목하는 분위기다.
다만 일부 기업은 외국 오픈소스 아키텍처 기반의 재설계 모델을 활용해 기술력 논란이 불거지고 있다. 정부는 외산 모델의 아키텍처 재설계도 허용하되, 라이선스 문제와 데이터 유출 우려를 최소화하려는 입장이다. 일부 스타트업은 기술력 부족으로 기존 모델 고도화 방향에 집중하고 있다.
이번 사업의 주요 변수가 된 오픈소스 공개에서도 치열한 경쟁이 벌어지고 있다. 이날 SK텔레콤은 허깅페이스에 '에이닷 엑스(A.X) 3.1'을, 네이버는 '하이퍼클로바 X 시드 14B 씽크'를, NC는 '바르코 LLM'을 상업용까지 활용 가능한 오픈소스로 공개했다. LG AI연구원도 '엑사원' 시리즈 일부를 오픈했고, KT·코난테크놀로지·업스테이지도 추론 모델 공개를 통해 기술력을 입증 중이다.
정부는 오픈소스 공개 수준을 평가에 반영하고, 자부담 매칭 비율도 이를 기준으로 차등화할 계획이다. 업계는 심사위원단이 외부 압력에서 벗어나 기술력 중심의 공정한 평가를 할 수 있을지 주목하고 있다.
IT 업계 관계자 A씨는 "이번 사업은 단순히 기술 개발을 넘어, 대한민국이 독자적인 AI 생태계를 구축할 수 있는 분기점이 될 수 있다"며 "특히 프롬 스크래치 방식으로 모델을 개발할 수 있는 기업은 한정돼 있어, 결국 실질적인 추론 성능과 오픈소스 기여도가 최종 승패를 가를 것"이라고 전망했다.
또 다른 AI 스타트업 대표는 "정부가 외산 의존도를 줄이려는 방향성은 바람직하지만, 현실적으로는 기존 오픈소스 생태계와의 조화도 필요하다"며 "독자성만 강조하기보다는 실제 활용성과 지속 가능성도 평가에 균형 있게 반영되길 기대한다"고 말했다.
제1조(목적)
본 약관은 한국초고성능컴퓨팅포럼(이하 "포럼"이라 한다)이 제공하는 서비스의 이용조건 및 절차, 이용자와 포럼의 권리, 의무, 책임사항과 기타 필요한 사항을 규정함을 목적으로 합니다.
제2조(약관의 효력과 변경)
1. 귀하가 본 약관 내용에 동의하는 경우, 포럼의 서비스 제공 행위 및 귀하의 서비스 사용 행위에 본 약관이 우선적으로 적용됩니다.
2. 포럼은 본 약관을 사전 고지 없이 변경할 수 있고, 변경된 약관은 포럼 내에 공지하거나 E-mail을 통해 회원에게 공지하며, 공지와 동시에 그 효력이 발생됩니다. 이용자가 변경된 약관에 동의하지 않는 경우, 이용자는 본인의 회원등록을 취소(회원탈퇴)할 수 있으며 계속 사용의 경우는 약관 변경에 대한 동의로 간주됩니다.
제3조(약관 외 준칙)
본 약관에 명시되지 않은 사항은 전기통신기본법, 전기통신사업법, 정보통신망 이용촉진 및 정보보호 등에 관한 법률 및 기타 관련 법령의 규정에 의합니다.
제4조(용어의 정의)
본 약관에서 사용하는 용어의 정의는 다음과 같습니다.
1. 이용자 : 본 약관에 따라 포럼이 제공하는 서비스를 받는 자.
2. 가입 : 포럼이 제공하는 신청서 양식에 해당 정보를 기입하고, 본 약관에 동의하여 서비스 이용계약을 완료시키는 행위.
3. 회원 : 포럼에 개인 정보를 제공하여 회원 등록을 한 자로서 포럼이 제공하는 서비스를 이용할 수 있는 자.
4. 비밀번호 : 이용자와 회원ID가 일치하는지를 확인하고 통신상의 자신의 비밀보호를 위하여 이용자 자신이 선정한 문자와 숫자의 조합.
5. 탈퇴 : 회원이 이용계약을 종료시키는 행위.
(... 이하 생략 ...)
1 개인정보의 처리 목적
① 한국초고성능컴퓨팅포럼은(는) 다음의 목적을 위하여 개인정보를 처리합니다. 처리하고 있는 개인정보는 다음의 목적 이외의 용도로는 이용되지 않으며 이용 목적이 변경되는 경우에는 「개인정보 보호법」 제18조에 따라 별도의 동의를 받는 등 필요한 조치를 이행할 예정입니다.
1. 홈페이지 회원가입 및 관리
회원 가입의사 확인, 회원제 서비스 제공에 따른 본인 식별·인증, 회원자격 유지·관리, 서비스 부정이용 방지, 만14세 미만 아동의 개인정보 처리 시 법정대리인의 동의여부 확인, 각종 고지·통지, 고충처리 목적으로 개인정보를 처리합니다.
2. 개인정보의 처리 및 보유 기간
① 한국초고성능컴퓨팅포럼은(는) 법령에 따른 개인정보 보유·이용기간 또는 정보주체로부터 개인정보를 수집 시에 동의받은 개인정보 보유·이용기간 내에서 개인정보를 처리·보유합니다.
② 각각의 개인정보 처리 및 보유 기간은 다음과 같습니다.
1. 홈페이지 회원가입 및 관리
홈페이지 회원가입 및 관리와 관련한 개인정보는 수집.이용에 관한 동의일로부터 준영구적으로 보유.이용됩니다.
(... 이하 생략 ...)
공고일자 : 2023년 07월 03일
시행일자 : 2023년 07월 03일