
인더뉴스 이종현 기자ㅣ카카오[035720]가 23일 자체 개발 언어모델 '카나나' 라인업 가운데 8B와 2.1B 크기의 모델을 오픈소스로 허깅페이스에 공개했다고 23일 밝혔습니다. 아파치 2.0(Apache 2.0) 라이선스를 적용해 자유로운 수정과 상업적 활용이 가능합니다.
이번에 공개한 모델은 지난 2월 말 공개한 버전에서 성능이 향상된 것으로 ▲Kanana-1.5-8b-base ▲Kanana-1.5-8b-instruct ▲Kanana-1.5-2.1b-base ▲Kanana-1.5-2.1b-instruct의 총 4종입니다.
기존 모델에서 업그레이드를 거친 Kanana 1.5는 Agentic AI 구현을 위한 기능 강화에 중점을 뒀습니다. 글로벌 모델 대비 뛰어난 한국어 성능을 유지하며 코딩과 수학 문제 해결, 함수 호출 능력에서 이전 대비 평균 1.5배의 성능 향상을 기록해 오픈소스SOTA(State-of-the-Art) 모델 수준의 유의미한 성능을 달성했다는 것이 특징입니다.
이 밖에 긴 문맥에 대한 이해와, 간결한 답변을 통해 향상된 사용성을 제공합니다. 기존보다 더 긴 텍스트 입력에 대해 안정적인 처리가 가능하며 정확도와 응답 길이를 최적화한 답변을 통해 서비스 환경에서 사용자의 체감 성능을 향상했습니다.
카카오는 현재 향상된 버전의 카나나 2를 개발 중입니다. 더욱 긴 입력에 대한 처리, 보다 정교화된 추론, 구조적인 효율성 등 다수의 영역에서 진화된 모델 개발을 진행하고 있습니다.
이번 오픈소스 공개를 통해 카카오는 AI 연구자와 개발자는 물론 기업이 목적에 맞게 모델을 자유롭게 튜닝하고 활용할 수 있는 상업 라이선스를 적용하여 기술 경쟁력을 확보함과 동시에 협력 기반의 AI 생태계를 구축해 나간다는 방침입니다.
김병학 카카오 카나나 성과리더는 "이번 오픈소스 공개를 통해 AI 기술을 통한 성장과 경쟁을 함께하는 환경을 만들고 이러한 생태계 내에서 기술을 발전시킬 수 있는 계기를 꾸준히 마련해가고자 한다"라며 "인공지능 모델 성능의 고도화는 물론 오픈소스의 본질적인 가치를 함께 추구해 갈 것"이라고 말했습니다.
한편, 카카오는 지난해 자체 개발 AI 모델 카나나의 라인업을 공개했으며 공식 테크 블로그를 통해 언어모델, 멀티모달 언어모델, 비주얼 생성모델 등의 성능과 개발기를 공개해 왔습니다.
지난 2월에는 'Kanana Nano 2.1B' 모델을 오픈소스로 허깅페이스에 배포한 바 있으며 언어모델 카나나의 연구 성과를 담은 테크니컬 리포트를 아카이브(ArXiv)에 공개했습니다. 최근에는 국내 최초로 텍스트와 음성, 이미지까지 다양한 형태의 정보를 동시에 이해하고 처리할 수 있는 통합 멀티모달 언어모델 'Kanana-o'의 성능을 공개하기도 했습니다.