[乙巳年 인터뷰]
이진식 LG 랩장 "엑사원, 한국어·긴 문맥 '외산 압도'"
"3.0부터 오픈소스 공개…성능 개선·협업 기회 확장"
이 기사는 2025년 01월 29일 06시 00분 유료콘텐츠서비스 딜사이트 플러스에 표출된 기사입니다.
지난 23일 서울시 영등포구 여의도 LG트윈타워에서 이진식 LG AI연구원 엑사원랩(Lab) 랩장(상무)이 딜사이트와 인터뷰하고 있다. (사진=LG)


[딜사이트 신지하 기자] "LG 엑사원의 한국어 처리 성능은 다른 외산 인공지능(AI) 모델과 갭(Gap)이 큽니다. 한국어는 우리가 가장 잘 합니다. 긴 문맥(Long Context) 처리 능력도 타사의 AI 모델과 비교해 더 뛰어납니다."


서울시 영등포구 여의도 LG트윈타워에서 만난 이진식 LG AI연구원 엑사원랩(Lab) 랩장(상무)은 "한국어는 영어보다 학습 데이터가 훨씬 적지만 이를 극복할 노하우를 갖췄고, 최근 모델은 장문의 지문도 이해하고 답변할 수 있는 수준까지 발전했다"며 이같이 말했다.


LG AI연구원은 지난 2021년 12월 거대언어모델(LLM) '엑사원(1.0)'을 처음 공개했다. 이후 2023년 7월 2.0 버전을, 지난해 8월에는 3.0 버전을 선보이며 AI 모델 경량화와 성능 개선에 집중했다. 3.0 버전은 이전 모델보다 추론 처리 시간은 56%, 메모리 사용량은 35%, 구동 비용은 72% 낮추는 등 성능·경제성 모두 우수한 결과를 보였다. 모델 크기도 1.0 버전과 대비 100분의 3 규모로 축소됐다.


이어 4개월 만인 지난달, LG AI연구원은 3.5 버전의 새로운 모델도 발표했다. 이전 3.0 버전이 경량 모델만 오픈소스로 배포된 것과 달리, 3.5 버전은 ▲온디바이스용 초경량 모델(24억개 파라미터) ▲범용 목적의 경량 모델(78억개 파라미터) ▲특화 분야에 활용할 수 있는 고성능 모델(320억개 파라미터) 등 3종 모두를 오픈소스로 공개했다.


특히 3.5 버전에서는 3.0에서 시험적으로 선보였던 '챗엑사원'을 정식 서비스로 내놨다. 챗엑사원은 생성형 AI 서비스로, 임직원들이 사내 보안 환경 내에서 내부 데이터의 유출 걱정 없이 업무에 활용할 수 있는 기업용 AI 에이전트다. 현재 한국어 기준, 단어 2만개(영어 단어 2만3000개)를 동시에 처리할 수 있는 3만2000토큰을 지원하며, 올해 상반기 중 12만8000토큰까지 확장될 예정이다.


엑사원의 버전은 모델 구조의 변화(메이저 업데이트)와 기능 추가(마이너 업데이트)에 따라 번호를 매긴다. 1.0 버전은 3000억개 파라미터로 대규모 모델이었다. 이후 산업 현장에서의 적용을 위해 2.0에서 경량화를 진행했고, 3.0에서는 데이터 학습량을 대폭 확대하며 효율적인 학습 구조를 도입했다. 3.5 버전에서는 고품질 데이터를 활용해 긴 문맥 처리 기능을 강화하는 등 사용자 요구에 맞춰 성능을 고도화했다.


현재 LG AI연구원은 오픈소스 AI 모델 공유 플랫폼인 허깅페이스에서 엑사원을 공개하며, 연구 목적에 한해 무료로 제공하고 있다. 상업적 활용에는 별도의 라이선스 계약이 필요하다. 이를 통해 다양한 곳과 협력하며 사업화 검증(PoC)과 상업화 사례 발굴에 속도를 내고 있다.


이 랩장은 "3.0 버전부터 오픈소스를 도입하면서 실사용자의 피드백을 대거 수집할 수 있었다"며 "사용자들이 요청한 더 경량화 된 모델이나 긴 문맥 처리를 반영해 성능을 고도화하고 기능을 추가하는 데 주력하고 있다"고 말했다. 이어 "오픈소스 도입은 엑사원의 기술력을 외부에 알리는 것뿐 아니라 모델 개선과 사용자 요구를 깊이 이해하는 데 중요한 계기가 됐다"고 덧붙였다.


엑사원 라이선스 비용은 클라우드와 온프레미스(사내 구축형), 애플리케이션 프로그래밍 인터페이스(API) 호출 등 사용 방식과 요구 사항에 따라 달라진다. 미국의 오픈AI는 국내에서 시스템통합(SI) 업체를 통해 간접적으로 모델을 제공하지만, LG AI연구원은 엑사원을 집적 공급해 가격과 협업 측면에서 경쟁력이 있다는 게 이 랩장의 설명이다. 현재 LG AI연구원은 특허청과 한글과컴퓨터 등 국내 주요 기관 및 기업들과 AI 사업 협력을 진행 중이다.


엑사원 3.5 장문 처리 성능(글로벌 오픈소스 AI 모델 비교). (자료=LG)

엑사원 개발 과정에서 가장 큰 기술적 도전은 비용 절감과 성능 개선을 동시에 달성하는 것이었다. 이 랩장은 "제한된 인프라 환경에서 빅테크 기업보다 더 나은 AI 성능을 내는 것이 기술적으로 어려웠다"며 "적은 데이터로도 고품질 모델을 구현하기 위해 데이터 효율성과 기능 고도화에 집중했다"고 말했다.


이 랩장은 AI 개발에서 윤리적 기준의 중요성에 대해서는 100만번 강조해도 부족하다고 언급했다. 그는 "잘못된 데이터나 불법적인 데이터가 학습에 포함되면 모델 전체를 폐기하거나 법적 소송에 휘말릴 수 있다"며 "사내에서 철저한 윤리 교육과 데이터 검토 과정을 통해 이를 예방하고 있다"고 설명했다. LG AI연구원은 ▲인간 존중 ▲공정성 ▲안전성 ▲책임성 ▲투명성 등 5가지 핵심 가치를 담은 'AI 윤리 원칙'을 제정하고, 매달 'AI 윤리 세미나'를 열어 주요 연구와 트렌드를 논의하고 있다.


LG AI연구원은 LG그룹 내에서도 독특한 수평적 조직문화를 갖췄다. 모든 구성원이 직급·직책 대신 '님'으로 서로를 부르며 자유롭게 의견을 나눈다. 이 랩장은 "원장님에게도 '문제가 있습니다'라고 바로 말할 수 있는 분위기가 연구원의 수평적이고 개방적인 문화를 만든다"고 설명했다. 자유로운 재택근무 활용도 연구원의 유연한 환경을 보여주는 대표적 사례다.


마지막으로 이 랩장은 국내 AI 기업들의 투자 축소와 글로벌 경쟁 상황에 대한 우려를 표했다. 그는 "최근 경제 상황이 어려워지면서 많은 국내 AI 기업들이 투자 규모를 줄이고 있는 실정"이라며 "반면 미국과 중국은 AI 파운데이션 모델을 전략 자산으로 삼아 막대한 비용을 투입하며 전력을 다하고 있다"고 지적했다. 이어 "한국에서도 AI에 진정성 있는 접근과 적극적인 투자를 통해 자극과 경쟁을 불러일으킬 기업들이 더 많이 필요하다"고 강조했다.


한편 1983년생인 이 랩장은 2012~2016년 삼성전자 DMC연구소 책임연구원, 2016~2019년에는 SK텔레콤 종합기술원 매니저, 2020~2022년에는 SK텔레콤 AI 센터 팀장 등을 지냈다. 2022년부터는 LG AI연구원 엑사원 랩 랩장을 맡아 엑사원 개발을 이끌고 있다. 이어 지난해 말 LG그룹 정기 임원 인사에서 상무로 승진했다.

ⓒ새로운 눈으로 시장을 바라봅니다. 딜사이트 무단전재 배포금지

관련종목
관련기사
乙巳年 인터뷰 5건의 기사 전체보기