[乙巳年 인터뷰]
양세현 디노티시아 CTO, "모두를 위한 AI 만들 것"
데이터와 AI 융합, 장기 기억 가진 AI 개발
이 기사는 2025년 01월 27일 06시 00분 유료콘텐츠서비스 딜사이트 플러스에 표출된 기사입니다.
양세현 디노티시아 CTO. (제공=디노티시아)


[딜사이트 이다은 기자] "기술적 한계와 산업적 요구를 해결하기 위해 효율적이고 지속 가능한 AI 생태계를 구축하려고 노력하고 있습니다." (양세현 디노티시아 CTO)


최근 LG가 자체 개발한 초거대 언어모델(LLM) LG엑사원 3.5를 뛰어넘는 파운데이션 모델 '디엔에이(DNA: Dnotitia AI)'를 개발한 디노티시아가 주목 받고 있다. 최근 디엔에이는 KMMLU(한국판 AI 능력 평가 데이터셋)에서 평균 점수 53.26점을 기록하며 LG엑사원3.5 (45.30점) 등 주요 경쟁 모델을 능가하는 최고 성능을 달성하며 업계의 관심을 끌었다.


디노티시아는 2023년 설립된 AI 전문기업으로, AI와 데이터 융합 기술을 중심으로 한 솔루션을 개발한다. '디노티시아'는 'D'(Deep=깊은)와 라틴어로 '지식'을 의미하는 'Notitia'를 결합한 단어다. 방대한 데이터를 유의미한 정보로 전환해 기술과 인프라 경계를 허물고 개인 및 기업의 혁신을 촉진한다는 회사의 비전이 담겨있다. 


양세현 디노티시아 CTO는 딜사이트와의 인터뷰에서 "데이터의 폭발적인 증가와 AI 기술의 필요성이 급증하는 시대적 흐름 속에서, 현대 기술 환경은 단일 기술만으로는 해결할 수 없는 복잡한 과제를 제시한다"며 "인공지능의 발전은 고성능 컴퓨팅과 효율성 향상을 필수적이다"고 말했다. 


그는 "디노티시아는 데이터를 AI와 융합해 장기 기억을 가진 AI를 개발함으로써, 누구나 쉽게 이용할 수 있는 낮은 비용의 범용인공지능(AGI)를 구현하고자 한다"며 "이를 통해 AI의 혜택을 대중이 손쉽게 누릴 수 있는 세상을 만들어 나가는 것이 디노티시아의 궁극적인 목표"라고 덧붙였다. 


양 CTO는 한국과학기술원(카이스트)에서 전기 및 전자공학과 학사와 석사를, 미국 카네기 멜론대학교 (Carnegie Mellon University)에서 컴퓨터엔지니어링 박사학위를 취득했다. 이후 삼성전자 SAIT 전문연구원과 SLSI 수석연구원을 지내며 삼성 독자 모바일 GPU(그래픽처리장치)와 CPU(중앙처리장치) 개발 등 다수의 AI, HPC(고성능컴퓨팅) 및 그래픽 가속 프로세서 연구 과제에 참여했다. 디노티시아와는 2024년 인연을 맺었다.


양 CTO는 "디노티시아의 꿈은 '모두를 위한 AI'"라고 강조했다. 그는 "챗GPT를 비롯한 인공지능 기술이 일상 곳곳에 자리하고 있지만, 대중이 느끼는 이점은 한정적인 것도 사실"이라며 "높은 비용과 기술 접근성의 한계 때문"이라고 전했다. 이에 디노티시아는 기술과 인프라의 경계를 허물어 AI 기술을 특정 소수의 전유물이 아닌, 대중적인 기술로 활용할 수 있도록 기여하겠다는 방침이다. 


디노티시아는 지난 2023년 12월 140억원의 시드(Seed) 라운드 투자에 이어 2024년 9월 프리-A 라운드를 통한 180억원 투자금 유치에 성공했다. 그해 12월에는 30억원을 추가로 획득해 총 350억원의 투자금액을 확보했다. 디노티시아는 벡터DB 전용 칩 개발과 우수한 인재를 확보하는 데 힘쓰고 있다.


'인공지능과 데이터 융합'이라는 디노티시아의 목표는 핵심 기술인 '씨홀스(Seahorse)'와 '니모스(Mnemos)'로 대변된다. 양 CTO는 "씨홀스는 세계 최초 전용 하드웨어 연산 가속기 기반으로 설계된 벡터 데이터베이스"라며 "텍스트·이미지·동영상 등 다양한 데이터를 수학적으로 표현한 후, 이를 구조화해 의미와 맥락에 맞는 결과를 사용자에게 빠르게 제공할 수 있다"고 설명했다. 


반면 니모스는 작은 LLM(대형언어모델)으로도 높은 성능의 AI서비스를 제공하는 개인화된 AI 디바이스다. 최근 AI 업계는 LLM보다 SLM(소형언어모델)로 우회하는 추세다. AI 학습에 대규모 데이터 값이 필요하고, 그에 대한 비용이 만만치 않은 탓이다. 


이에 디노티시아는 LLM의 장점은 유지하면서 효율성을 극대화하기 위해 데이터 추출 기술과 벡터 데이터베이스를 통해 LLM의 크기를 줄이고, 온디바이스 환경에서도 고성능 AI를 구현할 수 있는 기술 개발에 집중하고 있다. 


양 CTO는 "'니모스'는 디노티시아 설립 초기부터 시작된 중요한 프로젝트로, 설립 1년 이내에 팀을 구성하여 빠르게 진행됐다"며 "데이터센터 없이도 고성능 LLM을 구동할 수 있는 저비용 엣지 디바이스로, 대규모 AI 모델의 높은 비용과 자원 소모 문제를 해결하는 실질적인 대안"이라고 말했다.


니모스 개발의 일환으로 탄생한 것이 바로 '디엔에이'다. '디엔에이'는 80억개의 파라미터 규모를 가진 라마(Llama) 아키텍처 기반의 이중언어(한·영) 모델로, 학습 파라미터의 규모와 효율성 측면에서 SLM이라고 할 수 있다. 디엔에이는 LG엑사원3.5을 능가하는 등 한국판 AI 능력 평가 데이터셋에서 1위를 기록하며 최고 성능을 달성하기도 했다. 


디엔에이 파운데이션 모델 성과 비교. (제공=디노티시아)

양 CTO는 디엔에이의 기술 경쟁력을 ▲지속적사전학습 ▲지도학습미세조정 ▲혁신기술적용이란 키워드로 풀어냈다. 그는 "대규모 한국어 및 영어 데이터를 지속적으로 학습시켜 언어 이해와 생성 능력을 극대화했다"며 "복잡한 지시를 효과적으로 이해하고 수행할 수 있도록 고품질 데이터셋을 사용해 정밀하게 조정했다"고 전했다. 특히 최신 연구 결과를 바탕으로 '지식 증류', '구형 선형보간', '직접 선호 최적화' 등 혁신적 기술을 구현해 성능을 대폭 향상시킨 점을 강조했다. 


그는 디엔에이 개발 과정에서 있었던 일화를 소개하기도 했다. 양 CTO는 "디엔에이 발표 예정일 바로 전날 다른 회사에서 새로운 모델을 공개하고 최고 성능이라고 발표해 개발팀은 물론 회사 전체가 긴장했었다"며 "해당 모델을 긴급히 분석하고 벤치마크한 결과, 다행히 디엔에이의 우수성이 높게 인정돼 예정대로 발표를 진행할 수 있었다"고 귀띔했다. 


디엔에이는 현재 인공지능 플랫폼 '허깅페이스'에 오픈소스로 공개돼 누구나 활용할 수 있다. 디노티시아는 디엔에이를 기반으로 '니모스 AI 어시스턴트' 베타 테스트 중에 있다. 사용자 피드백을 적극 반영하며 기술을 개선하고, 이를 향후 '니모스'에 활용할 계획이다. 


한편 양 CTO는 국내 AI 기술 발전의 한계로 '데이터 규제'를 꼽았다. 국내에서는 개인정보 보호와 데이터 보안에 대한 규제로 인해 대규모 데이터 활용과 AI 기술의 적용이 제한된다는 어려움이 있다. 그는 "모든 데이터에 획일적인 규제를 적용하기 보다 정도와 범위를 명확하게 구분한 체계를 구축한다면, 데이터 활용의 안전과 효율을 지키면서도 AI 기술 발전을 촉진하는 기반이 될 것"이라고 힘주어 말했다.


또 데이터는 검색되고 활용할 때 비로소 의미와 가치가 있기에 사용되지 않는 데이터는 잠재적 가치를 상실한 자원에 불과하다고 주장했다. 양 CTO는 "그렇기에 시맨틱서치에 기반한 직관적인 인터페이스와 손바닥 크기의 디바이스에서도 LLM을 구동할 수 있는 환경을 만들어 누구나 제약 없이 AI 기술의 혜택을 누리는 AI의 보편화를 실현하고자 하는 것"이라고 전했다. 


디노티시아는 다양한 자사 기술과 서비스를 통해 국내외 기업들과 협력 기회를 모색하는 중이다. 디노티시아의 AI 기술이 실제 산업 현장에서 어떤 가치를 제공할 수 있는 지를 입증하는 단계에 있으며, 현재 초기 파트너 기업들과의 협력을 확대해 나가고 있다. 

ⓒ새로운 눈으로 시장을 바라봅니다. 딜사이트 무단전재 배포금지

乙巳年 인터뷰 5건의 기사 전체보기