[딜사이트 최령 기자] 업스테이지가 정부 '독자 AI 파운데이션 모델' 프로젝트 1차 관문을 통과하며 2차 단계 진출팀 3곳(LG AI연구원·SK텔레콤·업스테이지) 가운데 유일한 스타트업으로 이름을 올렸다. 업스테이지는 오픈소스 LLM '솔라 오픈 100B'를 공개한 직후 스탠퍼드대 최예진 교수와 뉴욕대 조경현 교수 등 글로벌 연구진을 컨소시엄에 합류시키며 2차 평가를 겨냥한 모델 고도화와 산업 현장 AX 확산에 속도를 내고 있다.
업스테이지는 이번 1차 평가 중 '글로벌 개별 벤치마크 평가' 항목에서 만점을 기록하며 상위권에 올랐다. 회사가 제시한 방향은 초거대 모델 경쟁의 정면 돌파라기보다 효율을 기반으로 한 프런티어 고도화와 산업 확산을 동시에 가져가는 전략이다. 정부 프로젝트가 2차 단계에서 성능 경쟁을 넘어 확산과 적용까지 평가하겠다는 구도를 분명히 한 만큼 업스테이지 역시 기술 고도화와 서비스 확산의 두 축을 동시에 끌어올리겠다는 구상이다.
업스테이지는 2차 단계를 앞두고 컨소시엄을 대폭 확대했다. 학계에서는 스탠퍼드대학교 최예진 교수와 뉴욕대학교 조경현 교수가 합류해 공동 연구와 인재 교류를 확대한다. 산업 확산 측면에서는 ▲채널코퍼레이션 ▲핀다 ▲한국전자기술연구원(KETI) 등이 가세해 고객서비스 금융 추천 공공 영역 특화 에이전트와 AX 추진을 뒷받침한다. 업스테이지는 이번 확장에 대해 2차 단계 핵심 모델 연구 역량을 글로벌 수준으로 끌어올리는 동시에 산업 현장에 AX 서비스를 빠르게 확산하기 위한 전략이라고 설명했다.
기술 로드맵도 한 단계 끌어올린다. 업스테이지 컨소시엄은 2차 평가 준비 과정에서 파라미터 규모를 2000억개(200B)까지 확대하는 방안을 추진하고 있다. 1차 평가 시점에 공개한 '솔라 오픈'이 1000억개(100B) 수준이라는 점을 감안하면 모델 규모를 두 배로 키우는 셈이다. 다만 업스테이지는 단순한 크기 경쟁보다는 효율 중심 설계를 전면에 내세워 왔다.
'솔라 오픈 100B'는 MoE 구조를 통해 실제 연산에는 120억개 매개변수만 활성화하는 방식으로 효율을 높였고 GPU 최적화를 통해 초당 토큰 처리량(TPS)을 약 80% 향상시켰다. 자체 강화학습 프레임워크 '스냅PO(SnapPO)'를 개발해 학습 기간을 50% 단축했으며 이를 통해 120억원 규모의 GPU 인프라 비용 절감 효과를 거뒀다고 밝혔다.
업스테이지는 이번 프로젝트에서 글로벌 프런티어급 모델 '솔라 WBL' 개발을 최종적인 목표로 삼고 있다. 이를 바탕으로 향후 3년간 대국민 AI 서비스를 통해 1000만명 이상의 사용자를 확보한다는 계획이다. 확산 컨소시엄에는 ▲로앤컴퍼니(법률) ▲마키나락스(국방·제조) ▲뷰노(의료) ▲오케스트로(공공) ▲데이원컴퍼니(교육) 등이 참여해 산업별 AX(AI 전환) 가속화를 추진한다.
앞서 '솔라 오픈'은 오픈소스로 전면 공개됐다. 업스테이지는 데이터 구축부터 학습에 이르는 전 과정을 독자적으로 수행하는 프롬 스크래치 방식으로 개발했다고 설명했고 허깅페이스 공개와 함께 테크 리포트도 함께 발표했다. 사전학습 데이터는 약 20조 토큰 규모로 제시됐으며 한국어 저자원 문제를 보완하기 위해 합성 데이터와 금융 법률 의학 등 분야별 특화 데이터를 활용하고 데이터 학습과 필터링 방법론을 고도화했다고 밝혔다. 데이터셋 일부는 NIA 'AI 허브'를 통해 개방할 계획이다.
다만 업스테이지는 평가 기간 중 프롬 스크래치 논란에 휘말리기도 했다. 논란은 고석현 사이오닉AI 대표가 이달 1일 링크드인에 올린 게시글에서 시작됐다. 고 대표는 업스테이지의 '솔라 오픈 100B'가 중국 지푸(Zhipu)AI의 'GLM-4.5-에어'에서 파생된 모델이라고 주장하며 모델의 레이어놈(LayerNorm) 파라미터 일부 구간에서 96.8%의 유사도가 나타났다고 지적했다. 이는 독자 AI 파운데이션 프로젝트의 프롬 스크래치 기준에 어긋난다는 문제 제기였다.
업스테이지는 즉각 현장 검증회를 열어 학습 로그와 체크포인트 등 개발 관련 주요 데이터를 공개했다. 레이어놈 유사성에 대해서는 모델 전체의 0.0004%에 불과한 미세 영역이라고 반박했고 코사인 유사도 지표의 한계를 지적하며 피어슨 상관계수 기반 재분석 결과 패턴이 일치하지 않는다고 설명했다. 토크나이저 역시 어휘수와 공통 어휘 비중을 근거로 별도의 독자 토크나이저라고 밝혔다. 정부 역시 1차 평가 과정에서 정량 평가와 별도로 독자성 분석을 진행했다고 밝혔다.
결국 업스테이지가 내세우는 승부처는 한국어와 현장 적용이다. 업스테이지는 '솔라 오픈'이 딥시크 R1 대비 사이즈는 15%에 불과하지만 한국어 영어 일본어 주요 벤치마크에서 상회하는 성과를 거뒀다고 밝혔다. 나아가 한국 문화 이해도와 한국어 지식 벤치마크에서는 2배 이상의 성능 격차가 나타났다는 설명이다. 동시에 '아숙업(AskUp)' '솔라 오픈 서치' '솔라 딥 리서치' 등 서비스에 적용하며 금융 법률 의료 제조 공공 분야 사업실증(PoC)도 진행 중이다.
정부는 1차 단계평가 이후 정예팀을 1개 추가로 선정해 2026년 상반기 4개 정예팀 경쟁체제를 확보하겠다고 예고했다. 업스테이지는 2차 단계에서 '솔라 오픈'의 기술적 완성도와 성능을 한층 끌어올려 국가대표 프런티어급 모델을 선보이고 이를 기반으로 산업 현장과 국민 생활에서 체감할 수 있는 AX 효과를 빠르게 확산시키겠다는 방침이다. 김성훈 대표는 스탠퍼드 뉴욕대 등 글로벌 석학들과의 연구 협력과 산업 파트너 합류를 계기로 독자 AI 모델 개발과 AX 확산에 더욱 속도가 붙을 것이라고 밝혔다.
업계 한 관계자는 "1차 평가는 독자성과 기본 체력을 가르는 관문이었다면 2차 단계는 누가 실제로 쓰이는 AI를 만들어내느냐의 싸움"이라며 "업스테이지는 스타트업 특유의 속도와 개방 전략을 앞세워 프런티어 경쟁과 산업 확산을 동시에 노리는 드문 케이스"라고 말했다.
ⓒ새로운 눈으로 시장을 바라봅니다. 딜사이트 무단전재 배포금지
Home





