안내
뉴스 랭킹 이슈 오피니언 포럼
산업 속보창
Site Map
기간 설정
퓨쳐위즈 더머니스탁론
카카오톡, '카나나' 입는다…일상형 AI 본격 시동
최령 기자
2025.09.23 17:36:01
④약속 제안부터 영상 생성까지…GPT-4 능가하는 카카오표 경량 AI, 10월 베타 출격
이 기사는 2025년 09월 23일 17시 36분 유료콘텐츠서비스 딜사이트 플러스에 표출된 기사입니다.
강지훈 카카오 AI디스커버리 성과리더가 23일 개최된 '이프 카카오(if(kakao)25)' 컨퍼런스에서 '카나나 인 카카오톡'을 주제로 오프닝 키노트를 발표하고 있다. (제공=카카오)

[딜사이트 최령 기자] 카카오가 자체 개발한 인공지능(AI) 모델 '카나나(Kanana)'를 앞세워 카카오톡의 대화 환경을 일상형 AI 플랫폼으로 전환한다. 온디바이스 기반의 프라이버시 보호형 AI와 멀티에이전트 기반의 실행형 AI를 동시에 적용해 대화 속 일정 추천부터 숏폼 생성까지 사용자 중심의 AI 경험을 본격화한다는 전략이다.


23일 열린 연례 개발자 행사 '이프 카카오 2025(if(kakao)25)'에서 강지훈 카카오 AI디스커버리 성과리더는 "카카오톡은 이제 AI가 먼저 말을 거는 플랫폼이 될 것"이라며 "'프라이버시 보호'와 '실행 중심 AI'라는 두 축을 동시에 실현하겠다"고 밝혔다.


카카오톡 대화창에는 온디바이스 AI 모델 '카나나 나노(Kanana Nano)'가 적용됐다. 해당 기능은 기기 내에서만 작동하며 서버 전송 없이 민감한 대화도 보호할 수 있다. 예를 들어 "이번 주말에 만나자"는 메시지가 오가면 AI가 약속 등록을 먼저 제안하는 식이다.


카카오 톡 내 카나나가 적용된 모습. (제공=카카오)

카나나 나노는 1.3B 파라미터 규모로 4B급 글로벌 모델에 준하는 성능을 70% 이상 경량화한 구조로 구현했다. 현재 카카오톡 사용자의 43%가 온디바이스 AI를 사용 중이며 연말까지 50% 이상 확대될 예정이다. 해당 기능은 내달 중순 베타 출시 예정이며 이날부터 공식 웹사이트를 통해 사전 신청이 가능하다.

관련기사 more
'국민앱' 카톡 실패 아닌 실험 되려면 15년 만의 카톡 개편 '역풍'…홍민택 CPO 책임론 확산 카카오톡 친구탭, '친구목록' 원상복구 15년만의 카카오톡 전면 개편…기회와 리스크의 양날

카카오톡 내 AI 검색도 '카나나 검색'으로 고도화된다. 대화 중 궁금한 내용을 즉시 검색해 공유할 수 있는 기능으로 별도 앱이나 브라우저 없이 채팅창 옆 버튼을 통해 실행된다. 강 리더는 "기존 검색이 혼자 하는 일이었다면 카나나 검색은 함께 보고 공유하는 검색"이라며 "카카오톡의 커뮤니케이션 흐름 안에서 자연스럽게 정보를 탐색할 수 있게 될 것"이라고 설명했다.


에이전트 오케스트레이션을 통해 카나나는 필요한 작업에 따라 최적의 AI 에이전트를 연동한다. 예컨대 약속 정리에는 일정 에이전트가, 위치 정보 검색에는 로컬 에이전트가 자동으로 연결된다. 이들 에이전트는 '에이전틱 AI 빌더'를 통해 빠르게 개발·개선된다. 실제로 카카오는 첫 쇼핑 에이전트를 6개월 만에 로컬 에이전트를 3개월 만에 완성했으며 향후 개발 주기를 더 단축할 예정이다.


이날 이어진 세션에서 김병학 카나나 성과리더는 카카오의 AI 모델군 '카나나 모델 패밀리'의 세부 구조와 서비스 적용 사례를 공개했다. 그는 "카카오는 무조건 큰 모델보다 성능과 효율의 균형이 중요하다"며 "한국어 이해도, 연산 효율, 프라이버시 대응력을 모두 갖춘 카카오표 AI가 필요한 이유"라고 설명했다.


카카오톡 카나나 대화 요약. (제공=카카오)

핵심 모델 중 하나인 '카나나-1.5-9.8B'는 대화 및 통화 내용을 6초 내 5문장으로 요약하며 통화 참여자의 익명성을 보장하는 구조를 채택했다. 이 모델은 GPT-4o 대비 101% 정확도를 기록하면서도 비용은 0.5% 수준에 불과한 것으로 알려졌다.


통합 멀티모달 언어 모델 '카나나-o'는 숏폼 추천 기능에 활용된다. 이 모델은 오디오와 비주얼 정보를 동시에 분석해 1.4초 만에 핵심 키워드와 요약 데이터를 추출하며 기존 대비 비용은 5% 수준이다. 특히 키워드 인식 정확도는 GPT-4o 대비 2.5%p 우수한 성능을 보인다.


숏폼 영상 생성 모델 '카나나-키네마'는 사용자가 이미지를 업로드하면 약 8초 내에 1초 분량의 영상을 자동 생성한다. 생성 비율, 카메라 움직임, 인물 위치 등을 제어할 수 있으며 구글의 영상 생성 모델 'Veo3 Fast' 대비 비용이 35% 수준으로 효율성이 뛰어나다.


음성 인식 모델 '카나나 카브(Kanana Karve)'는 통화 녹음 기능에 적용됐다. 최대 30분 분량의 통화를 10초 내에 텍스트로 변환하며 GPT-4 미니 대비 105%의 정확도와 2% 비용으로 구현된다. 이 기능은 이미 일부 서비스에 도입돼 있으며 통화 및 대화 기반 서비스 확장도 계획 중이다.


비즈니스용 AI 상담 매니저에도 카나나 모델이 적용됐다. 이 솔루션은 GPT-4급 성능을 6.6배 빠른 속도로 구현하며 단순한 응답을 넘어 비즈니스 도메인에 맞는 정교한 답변을 제공한다.


카카오는 지난 2월 '카나나 1.5'를 오픈소스로 공개한 데 이어 현재는 '카나나 2.0'을 개발 중이다. 새로운 모델은 MLA(Multi-Head Latent Attention), MoE(Mixture of Experts) 구조를 적용해 추론 효율성과 확장성을 높였으며 대규모 동시 접속 환경에서의 처리 성능을 끌어올렸다.


김 리더는 "카나나는 단순한 기술이 아니라 사용자와 서비스 간 인터페이스의 진화"라며 "카카오톡은 물론 페이, 모빌리티, 엔터테인먼트 등 전 계열 서비스에 확대 적용할 것"이라고 말했다.


김병학 카나나 성과리더가 23일 개최된 '이프 카카오(if(kakao)25)' 컨퍼런스에서 '카카오톡에서 만나는 '카나나 모델 패밀리''를 주제로 오프닝 키노트를 발표하고 있다. (사진=최령 기자)

ⓒ새로운 눈으로 시장을 바라봅니다. 딜사이트 무단전재 배포금지

딜사이트S VIP 3일 무료 체험
lock_clock곧 무료로 풀릴 기사
help 딜사이트 회원에게만 제공되는 특별한 콘텐트입니다.
무료 회원 가입 후 바로 이용하실 수 있습니다.
more
딜사이트 회원전용
help 딜사이트 회원에게만 제공되는 특별한 콘텐트입니다. 무료 회원 가입 후 바로 이용하실 수 있습니다.
회원가입
Show moreexpand_more
D+ B2C 서비스 구독
Infographic News
IPO 수요예측 vs 청약경쟁률
Issue Today more