[미국 라스베이거스=신지하 기자] 딥엑스가 6일(현지시간) 미국 라스베이거스에서 열린 'CES 2026'에서 5W급 거대언어모델(LLM) 추론 칩 'DX-M2' 개발 로드맵을 공개했다.
이날 딥엑스는 미디어 간담회를 열고 5W 미만 초저전력으로 200억(20B) 파라미터부터 MOE 구조의 경우 1000억(100B) 파라미터까지 LLM 추론을 구동하는 2세대 AI 칩 'DX-M2' 개발 로드맵을 공개했다. 생성형 AI를 데이터센터 중심 기술에서 벗어나, 엣지 디바이스 내부로 확장하는 '생성형 피지컬 AI' 현실화를 목표로 했다.
조영호 딥엑스 부사장은 "5W로 100B LLM을 돌린다는 것은 고성능 연산 향상을 뛰어 넘어 AI 인프라의 전제 조건이 바뀌는 사건"이라며 생성형 AI가 데이터센터에 나와 어디에나 존재하는 기능으로 전환될 것이라는 취지로 설명했다.
딥엑스는 DX-M2를 통해 AI의 무게 중심이 데이터센터에서 물리적 세계로 이동하는 흐름을 가속화하고, 장기적으로 모든 기기에 생성형 지능이 탑재되는 새로운 AI 인프라 표준을 제시할 계획이다. 서비스 로봇, 현장 설비, 네트워크 없이도 판단·요약·대응이 가능한 엣지 디바이스 등 생성형 피지컬 AI 시장을 목표로 삼았다.
또 딥엑스는 추론 작업을 수십억대의 엣지 디바이스로 분산하면 데이터센터 트래픽을 80% 이상 줄일 수 있을 것으로 추산했다. 과도한 전력사용과 막대한 경제적 부담, 인프라 병목을 완화할 수 있다는 설명이다.
딥엑스는 과거 DX-M1에서 확보한 양산 경험을 통해 전력 관리, 발열 제어, 소프트웨어 스택 최적화 노하우를 DX-M2에 집약한다는 방침이다.
현재 딥엑스는 DX-M1을 통해 50개 이상의 양산 프로젝트를 확보했으며 로봇, 방산, 스마트 가전 등 산업 현장에서 상용화를 진행 중이다. 딥엑스는 칩 성능뿐 아니라 기술이 사실상 산업 표준으로 확산되기 위한 실행 전략으로 오픈소스, 유통, 개발자 경험의 핵심 시장 공략 전략도 제시했다.
우선 딥엑스는 울트라라이틱스(Ultralytics) 및 바이두(Baidu)와 협업해 개발자들이 익숙한 모델·툴·워크플로우를 엣지 환경에서 바로 구동할 수 있도록 '하드웨어 이식이 보장되는 실전 AI SW 스택'을 구축하고 있으며, 핵심은 누구나 재현 가능한 AI의 양산·배포 체계라고 강조했다.
또 딥엑스는 애브넷(Avnet), 디지키(DigiKey), WPG 등과 함께 글로벌 유통 채널을 구축했고, 양산 제품과 개발 키트 등 고객이 상용 제품에 적용하기 위해 필요한 부품·모듈·레퍼런스 구성이 시장에서 즉시 수급할 수 있도록 조달 접근성을 확충해왔다고 밝혔다.
ⓒ새로운 눈으로 시장을 바라봅니다. 딜사이트 무단전재 배포금지
Home





