[딜사이트 최령 기자] 정부가 추진 중인 '독자 AI 파운데이션 모델' 프로젝트 1차 단계평가에서 LG AI연구원이 종합 1위를 차지했다. 벤치마크·전문가·사용자 평가 전 부문에서 최고점을 기록하며 기술 성숙도와 독자성을 동시에 입증했다는 평가다. 다만 2차 단계에서는 성능을 넘어 실제 산업 현장 적용과 확산 가능성이 새로운 경쟁 기준으로 부상할 전망이다.
과학기술정보통신부에 따르면 LG AI연구원은 벤치마크 평가 40점, 전문가 평가 35점, 사용자 평가 25점을 합산해 총 90.2점을 획득했다. 벤치마크 33.6점, 전문가 31.6점, 사용자 25.0점으로 세 항목 모두 최고점이었다.
세부적으로 NIA 벤치마크(10점)에서는 SK텔레콤과 LG AI연구원이 각각 9.2점으로 공동 1위를 기록했다. 글로벌 공통 벤치마크(20점)는 LG AI연구원이 14.4점으로 단독 1위였고 글로벌 개별 벤치마크(10점)는 업스테이지와 LG AI연구원이 10.0점으로 공동 1위였다. 사용자 평가는 AI 스타트업 대표 등 49명의 AI 전문 사용자가 참여해 각 팀이 구축한 AI 사용 웹사이트를 기반으로 활용 가능성과 추론 비용 효율성을 평가했다.
이번 1차 평가의 핵심 쟁점은 '독자성'이었다. 과기정통부는 공모안내서에서 독자 AI 파운데이션 모델을 해외 모델의 미세조정으로 만든 파생형이 아니라 설계부터 사전학습 과정까지 수행한 국산 모델로 정의했다. 기술적 기준으로는 가중치를 초기화한 뒤 학습을 통해 가중치를 형성·최적화하는 과정을 독자성의 최소 조건으로 제시했다. 전문가 평가위원회는 테크니컬 리포트와 훈련 로그 파일 등을 분석했고 그 결과 네이버클라우드는 독자성 기준을 충족하지 못했다고 판단했다고 밝혔다.
LG AI연구원은 이러한 독자성 논란의 직접적 대상에서는 비켜서 있었다. 경쟁사 일부를 둘러싸고 외부 가중치 활용 여부나 모델 유사성 논란이 제기된 것과 달리 LG AI연구원은 평가 과정에서 문제 제기 사례가 상대적으로 적었다는 점이 주목된다.
기술 지표 측면에서는 K-엑사원이 글로벌 평가 기관 Artificial Analysis의 인텔리전스 지수에서 32점을 기록해 오픈 웨이트 모델 기준 세계 7위에 올랐다는 설명도 나왔다. LG AI연구원은 K-엑사원이 2360억개 매개변수 규모의 프런티어급 모델로 MoE와 하이브리드 어텐션 구조를 적용해 연산량을 약 70% 줄였다고 밝혔다. A100급 GPU 환경에서도 운용 가능하도록 설계해 추론 효율을 높였다는 점을 강조했다.
연구원 측은 파라미터 규모 경쟁보다는 실제 추론 효율과 산업 적용성을 중심으로 설계됐다는 점을 K-엑사원의 차별화 요소로 제시하고 있다. 공통 벤치마크 13종 가운데 10개 항목에서 1위를 기록했고 평균 점수 72점을 받아 글로벌 대형 모델과의 경쟁력도 입증했다는 설명이다. 모델 구조와 학습 방식 공개, API 개방을 통해 외부 개발자와 산업 생태계 확장을 유도하고 국가 AI 주권 강화에도 기여하겠다는 전략도 내세웠다.
K-엑사원은 이미 LG디스플레이, LG화학, LG생활건강 등 그룹 계열사의 제조·R&D·업무 자동화 영역에 적용되며 실사용 사례를 축적하고 있다. 단순 PoC를 넘어 실제 업무 프로세스에 투입되며 성능과 비용 효율을 검증받고 있다는 점에서 '현장형 AI'로서의 성격이 부각된다.
이러한 내부 적용 경험은 LG그룹 차원의 AX 전략과도 맞물린다. LG AI연구원은 LG CNS, LG유플러스 등과 컨소시엄을 구성해 프로젝트에 참여했으며 제조, 공공, 금융 등 외부 산업으로 적용 범위를 넓히겠다는 구상이다. 임우형 LG AI연구원 공동연구원장은 "K-엑사원이 지닌 기술력을 바탕으로 글로벌 시장 내 기술 주도권을 확보하겠다"고 밝혔다.
다만 2차 단계 경쟁은 1차와 평가 초점이 달라질 수 있다는 관측도 나온다. 정부는 1차 단계 이후 정예팀 1곳을 추가로 선정해 2026년 상반기 4개 팀 경쟁 체제를 구축하겠다고 밝혔다. 성능 지표 외에도 실제 산업 적용, 비용 효율, 운영 통제 가능성 등 '확산' 관련 요소가 중요해질 가능성이 크다. 1차에서 점수로 확인된 기술 우위가 2차에서 실사용 성과로 이어질지 독자성 기준을 충족한 모델이 시장에서 어떤 파급효과를 낼지가 다음 승부처가 될 전망이다.
업계 한 관계자는 "1차 평가는 기술 성숙도와 독자성을 가르는 시험이었다면 2차는 실제로 산업 현장에서 얼마나 쓰일 수 있느냐를 증명하는 단계가 될 것"이라며 "LG AI연구원이 확보한 점수 우위가 비용 구조와 확산 속도까지 이어질지는 별도의 검증 국면에 들어간 셈"이라고 말했다.
ⓒ새로운 눈으로 시장을 바라봅니다. 딜사이트 무단전재 배포금지
Home





