검색창 열기 인더뉴스 부·울·경

ICT 정보통신

네이버, 추론 능력 강화한 ‘하이퍼클로바X 씽크’ 개발…최상급 언어 능력 갖춰

URL복사

Monday, June 30, 2025, 13:06:20

한국어 통사론, 의미론, 화용론 등 전문가 레벨 평가에서 최고 수준 점수

 

인더뉴스 이종현 기자ㅣ네이버[035420]는 추론 능력을 강화한 생성형 AI '하이퍼클로바X 씽크' 개발을 완료하고 모델의 설계와 성능 등 세부 정보를 소개하는 테크니컬 리포트를 발표했다고 30일 밝혔습니다.

 

추론모델은 '생각하는 힘'이 강화된 AI로 사용자가 질의를 입력하면 모델이 혼잣말하듯이 길게 생각하며 답변 계획을 수립하는 것이 특징입니다. 이 과정에서 복잡한 문제를 작은 단위로 나누는 능력, 적절한 도구나 함수를 선택하는 능력, 실수를 반추하고 교정하는 능력이 발현됩니다. 생성 정보의 정확도와 유용성이 향상돼 AI 에이전트 서비스의 핵심적인 기술로 주목받고 있습니다.

 

네이버에 따르면 'KoBALT-700' 벤치마크로 주요 LLM(거대언어모델)의 언어 능력을 측정한 결과, 하이퍼클로바X 씽크는 유사 규모로 구축된 국내 주요 추론모델 및 글로벌 최고 수준 오픈소스 모델보다 더 높은 점수를 기록했습니다. 이번 벤치마크는 서울대학교 언어학과에서 LLM의 깊이 있는 한국어 이해도를 진단하기 위해 설계됐습니다. AI가 대화의 격률을 적절하게 파악하는지, 문장의 논항 구조를 정확히 분석하는지 등을 평가하는 전문가 수준의 문항들로 구성됐습니다.

 

또 다른 대표적인 한국어 성능 평가 지표인 'HAERAE-Bench'에서도 추론모델을 포함한 국내외 주요 오픈소스 모델보다 높은 점수를 기록했습니다.

 

나아가 네이버는 하이퍼클로바X 씽크를 통해 AI가 언어뿐만 아니라 시각 정보를 바탕으로도 추론할 수 있는 기술도 확보했습니다. 테크니컬 리포트에 따르면, 하이퍼클로바X 씽크는 'STEM(Science, Technology, Engineering, Mathematics)' 문제를 이미지 형식으로 입력했을 때 이를 인식하고 추론하는 과정을 통해 정답을 맞히는 모습을 보였습니다.

 

예를 들어, 한국 대학수학능력시험 생명과학 문제에서 그림으로 제시된 '생태계 천이 과정'과 '특정 식물 군집의 시간에 따른 총생산량 및 호흡량 그래프'를 인식·분석하고 이를 양수림, 혼합림, 지의류 등에 대한 지식과 결합해 선택지 중 올바른 서술을 골라냅니다.

 

하이퍼클로바X 씽크 성능 평가를 담당한 유강민 네이버클라우드 리더는 "이번 추론모델은 멀티모달 추론을 겨냥해 만든 것이 아님에도 시각 추론 영역에서 의미 있는 결과가 도출됐다"라며 "이미 하이퍼클로바X 기반의 이미지, 영상, 음성 멀티모달 기술을 확보하고 있으므로 향후 보다 강력한 멀티모달 추론 능력을 갖춘 모델로 고도화해 나갈 것"이라고 말했습니다.

 

네이버는 추론모델을 오픈소스로도 공개할 계획입니다. 네이버가 지난 4월 공개한 오픈소스 경량모델 '하이퍼클로바X 시드'는 한 달여 만에 50만 다운로드를 넘었습니다.

 

성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 "하이퍼클로바X를 '지능의 향상'과 '감각의 확장'의 두 가지 축으로 고도화하고 있으며 이번 하이퍼클로바X 씽크를 통해 지능 측면에서 상당한 발전이 이뤄졌다"라며 "급변하는 AI 흐름 속에서 글로벌 선두권 그룹의 기술을 지속적으로 갖춰가고 있으며 기술 패러다임에 발맞추는 것에 그치지 않고 사용자에게 실질적 가치를 제공할 수 있는 방법을 함께 찾아나갈 것"이라고 말했습니다.

English(中文·日本語) news is the result of applying Google Translate. <iN THE NEWS> is not responsible for the content of English(中文·日本語) news.

배너

이종현 기자 flopig2001@inthenews.co.kr

배너

KT, MS와 개발한 한국적 AI ‘SOTA K’ 출시

KT, MS와 개발한 한국적 AI ‘SOTA K’ 출시

2025.09.29 13:13:32

인더뉴스 이종현 기자ㅣKT[030200]가 마이크로소프트와의 전략적 협업을 통해 개발한 GPT-4o 기반 한국적 AI 모델 'SOTA K built on GPT-4o(이하 SOTA K)'를 출시했다고 29일 밝혔습니다. 기존 거대언어모델(LLM)은 영어권 중심 데이터로 학습돼 한국어와 한국의 독특한 사회·문화적 맥락 반영에 한계가 있었습니다. KT는 이를 해결하기 위해 고품질 한국 특화 데이터를 대규모로 확보하고 마이크로소프트와의 협력을 통해 GPT-4o를 한국 사회에 최적화된 모델로 발전시켰다고 설명했습니다. SOTA K는 한국적 AI의 4대 핵심 철학인 ▲데이터 주권 보호 ▲한국 문화 이해 ▲모델 선택권 보장 ▲안전하고 책임감 있는 AI를 구현합니다. 한국어 경어법·방언은 물론 법률·금융·역사 등 국내 특정 산업군 내에서 사용하는 전문 용어까지 자연스럽게 이해하고 생성할 수 있습니다고 회사 측은 설명했습니다. KT는 한국적 AI 지표를 새롭게 정의하고 이를 측정할 수 있는 자체 데이터셋을 구축해 정량 평가와 정성 평가를 진행했습니다. KT에 따르면 SOTA K는 한국어 이해·생성·추론·사회·문화·한국 전문지식 등 주요 지표에서 GPT-4o 대비 우위를 보였습니다. 특히 한국사·한국어·한국 법령 등 고난도 한국적 지식을 요구하는 대한민국 공무원 시험과 귀화 시험에서 GPT-4o 모델을 능가하는 성과를 거뒀습니다. 실제 고객 사례의 경우, 메리츠화재에서는 보험 업계에 특화된 약관의 자동 요약 리포트 생성과 상담원 스크립트 생성에서 SOTA K가 우수한 결과물을 보여줬습니다. EBS와의 협력에서는 초중고 난이도별 교과 문항을 생성하여 맞춤형 학습을 제공하는 측면에서 SOTA K의 활용 가능성이 확인됐습니다. 또 연세의료원에서는 영어와 한국어가 혼합된 의료 데이터를 환자가 쉽게 이해할 수 있도록 한국적인 표현으로 자연스럽게 안내했으며 날짜 표기법 등의 영역까지 한국인의 생활 방식과 문화를 이해하고 있음을 확인할 수 있었다고 KT는 평가했습니다. 또 한국전력공사에서는 질의에 대해 간결하면서도 명확한 답변을 신속하게 받을 수 있었다고 긍정적으로 평가하며 내부 시스템과의 연동이 가능하다면 활용 범위가 더 넓어질 수 있을 것이라는 기대를 나타내기도 했습니다. SOTA K는 한국적 AI 평가의 Responsible AI 항목에서 높은 평가를 받아 AI 응답 및 법률과 권리 준수, 사회 및 경제 영향도의 안전성, AI 모델의 강건성의 우수성을 입증했습니다. 또 악의적 사용자에 의한 AI 모델 탈옥 공격에 대해서도 강력한 방어 능력을 보유한 모델임을 확인했습니다. KT는 SOTA K를 물리적으로 대한민국 내 존재하는 클라우드 리전에서 운영하며 자체 개발한 벡터 모델 기반 한국적 검색증강생성(RAG) 기술과 결합해 기업별 맞춤형 지식 기반을 구축할 수 있는 서비스 환경도 제공합니다. 이에 고객사는 고유 데이터를 활용해 더 정확하고 특화된 AI 서비스를 경험할 수 있습니다. KT는 우선 자사 B2C 사업에 SOTA K를 적용해 자체 및 협업 모델 라인업을 검증한 뒤 파트너사에 서비스를 확대 제공할 방침입니다. 윤경아 KT Agentic AI Lab장(상무)은 "SOTA K는 글로벌 수준의 기술력과 한국적 AI 특화를 동시에 실현한 혁신적 모델로 마이크로소프트와의 협업을 통해 축적한 기술적 노하우는 향후 KT의 다양한 AI 모델 개발에 확산 적용될 것"이라며 "국내 AI 생태계 활성화는 물론 공공과 민간 전반에서 AI를 활용한 혁신을 주도하며 국가 AI 경쟁력 제고에 기여할 것"이라고 말했습니다.




배너