검색창 열기 인더뉴스 부·울·경

Major Company 대기업

네이버, AI 데이터 공개...비금융사 최초 금융데이터거래소 등록

URL복사

Friday, September 18, 2020, 10:09:04

스타트업·대학 연구진·공공기관 대상 데이터 샌드박스 공개
보안성·활용성 모두 담보한 데이터 공개 모델 제시

 

인더뉴스 권지영 기자ㅣ네이버㈜(대표이사 한성숙)가 디지털 뉴딜의 핵심인 데이터를 적극 공개해 데이터 생태계 활성화에 나섭니다.

 

네이버는 지난 17일 자사가 보유한 쇼핑 및 지역 비즈니스 관련 데이터를 금융데이터거래소에 등록을 마쳤습니다. 이번에 등록한 데이터는 분야별 온라인 쇼핑 트렌드를 파악할 수 있는 데이터와 각 지역에 특화된 데이터로 구성됐습니다.

 

이는 은행, 카드사 등 금융권 데이터와의 시너지로 새로운 상품 및 서비스 개발 등에 다양하게 활용될 것으로 보입니다.

 

가령, 특정 지역 내 네이버 사용자들이 많이 검색한 비즈니스 키워드와 성별 및 연령대 데이터를 기반으로 새로운 비즈니스를 발굴하거나, 기존 사업을 한층 더 발전시킬 수도 있습니다.

 

네이버 측은 “그 동안 네이버의 쇼핑 통계 기술을 활용해 매출 증대 등 성과를 이뤄낸 기업들이 많아진 만큼 데이터의 가치가 커 활발하게 이용될 것으로 기대된다”고 말했습니다.

 

◇ 네이버, 데이터 공개 모델·클라우드 데이터 샌드박스 연내 오픈

 

네이버는 국내 AI 연구 및 혁신기술 개발을 위해 스타트업과 대학 연구진, 공공기관을 대상으로 ‘네이버 클라우드 데이터 샌드박스’를 연내 공개할 예정입니다.

 

네이버 클라우드 데이터 샌드박스란 네이버가 보유한 자사 데이터와 공공데이터, 제휴를 통해 확보한 외부 기업의 데이터를 한 데 모아 보안성 높은 클라우드를 통해 활용하는 데이터 플랫폼입니다.

 

네이버는 데이터 샌드박스를 통해 ▲텍스트, 이미지 등 AI 학습용 데이터 ▲쇼핑, 지역, 검색 등 사용자 행동 데이터 ▲신사업 개발과 공익 연구를 위한 공공성 데이터 등 다양한 분야의 방대한 데이터를 제공합니다. 풍부한 데이터를 기반으로 AI 혁신 기술 개발, 상권 분석, 로보어드바이저 개발, 공공정책 및 행정시스템 개선 등 다양한 연구개발이 가능해질 전망입니다.

 

 

또한, 클라우드 기반 컴퓨팅 환경에 대한 보안도 지키면서 데이터 분석 도구, 고성능 인프라, 클라우드 스토리지 등 최첨단 분석 환경도 함께 지원할 예정입니다.

 

현재 네이버는 샌드박스에 제공할 데이터에 대한 법률적 검토를 진행하고 있으며, 10월 중 CBT를 실시해 관련 분야 교수진과 함께 데이터 유용성 등을 점검할 예정입니다.

 

네이버 클라우드 데이터 샌드박스는 연내 정식 오픈을 목표로 하고 있으며, 이를 활용한 경진대회 및 산학연계 프로젝트도 진행할 계획입니다. 정식 오픈 이후에는 협력사와 국가기관의 제휴를 확대해 샌드박스 내 데이터 종류를 다양화할 예정입니다.

 

한성숙 네이버 대표는 “이번 금융데이터거래소와 네이버 클라우드 데이터 샌드박스를 통해 공개되는 네이버의 방대한 데이터가 SME의 성장과 관련 산업계 및 연구에 기여해 디지털 뉴딜의 마중물이 될 것”이라며 “앞으로도 가치 있는 데이터 공개를 통해 우리 사회 발전과 데이터 생태계 활성화에 앞장설 것”이라고 말했습니다.

 

English(中文·日本語) news is the result of applying Google Translate. <iN THE NEWS> is not responsible for the content of English(中文·日本語) news.

배너

권지영 기자 eileenkwon@inthenews.co.kr

배너

KT, MS와 개발한 한국적 AI ‘SOTA K’ 출시

KT, MS와 개발한 한국적 AI ‘SOTA K’ 출시

2025.09.29 13:13:32

인더뉴스 이종현 기자ㅣKT[030200]가 마이크로소프트와의 전략적 협업을 통해 개발한 GPT-4o 기반 한국적 AI 모델 'SOTA K built on GPT-4o(이하 SOTA K)'를 출시했다고 29일 밝혔습니다. 기존 거대언어모델(LLM)은 영어권 중심 데이터로 학습돼 한국어와 한국의 독특한 사회·문화적 맥락 반영에 한계가 있었습니다. KT는 이를 해결하기 위해 고품질 한국 특화 데이터를 대규모로 확보하고 마이크로소프트와의 협력을 통해 GPT-4o를 한국 사회에 최적화된 모델로 발전시켰다고 설명했습니다. SOTA K는 한국적 AI의 4대 핵심 철학인 ▲데이터 주권 보호 ▲한국 문화 이해 ▲모델 선택권 보장 ▲안전하고 책임감 있는 AI를 구현합니다. 한국어 경어법·방언은 물론 법률·금융·역사 등 국내 특정 산업군 내에서 사용하는 전문 용어까지 자연스럽게 이해하고 생성할 수 있습니다고 회사 측은 설명했습니다. KT는 한국적 AI 지표를 새롭게 정의하고 이를 측정할 수 있는 자체 데이터셋을 구축해 정량 평가와 정성 평가를 진행했습니다. KT에 따르면 SOTA K는 한국어 이해·생성·추론·사회·문화·한국 전문지식 등 주요 지표에서 GPT-4o 대비 우위를 보였습니다. 특히 한국사·한국어·한국 법령 등 고난도 한국적 지식을 요구하는 대한민국 공무원 시험과 귀화 시험에서 GPT-4o 모델을 능가하는 성과를 거뒀습니다. 실제 고객 사례의 경우, 메리츠화재에서는 보험 업계에 특화된 약관의 자동 요약 리포트 생성과 상담원 스크립트 생성에서 SOTA K가 우수한 결과물을 보여줬습니다. EBS와의 협력에서는 초중고 난이도별 교과 문항을 생성하여 맞춤형 학습을 제공하는 측면에서 SOTA K의 활용 가능성이 확인됐습니다. 또 연세의료원에서는 영어와 한국어가 혼합된 의료 데이터를 환자가 쉽게 이해할 수 있도록 한국적인 표현으로 자연스럽게 안내했으며 날짜 표기법 등의 영역까지 한국인의 생활 방식과 문화를 이해하고 있음을 확인할 수 있었다고 KT는 평가했습니다. 또 한국전력공사에서는 질의에 대해 간결하면서도 명확한 답변을 신속하게 받을 수 있었다고 긍정적으로 평가하며 내부 시스템과의 연동이 가능하다면 활용 범위가 더 넓어질 수 있을 것이라는 기대를 나타내기도 했습니다. SOTA K는 한국적 AI 평가의 Responsible AI 항목에서 높은 평가를 받아 AI 응답 및 법률과 권리 준수, 사회 및 경제 영향도의 안전성, AI 모델의 강건성의 우수성을 입증했습니다. 또 악의적 사용자에 의한 AI 모델 탈옥 공격에 대해서도 강력한 방어 능력을 보유한 모델임을 확인했습니다. KT는 SOTA K를 물리적으로 대한민국 내 존재하는 클라우드 리전에서 운영하며 자체 개발한 벡터 모델 기반 한국적 검색증강생성(RAG) 기술과 결합해 기업별 맞춤형 지식 기반을 구축할 수 있는 서비스 환경도 제공합니다. 이에 고객사는 고유 데이터를 활용해 더 정확하고 특화된 AI 서비스를 경험할 수 있습니다. KT는 우선 자사 B2C 사업에 SOTA K를 적용해 자체 및 협업 모델 라인업을 검증한 뒤 파트너사에 서비스를 확대 제공할 방침입니다. 윤경아 KT Agentic AI Lab장(상무)은 "SOTA K는 글로벌 수준의 기술력과 한국적 AI 특화를 동시에 실현한 혁신적 모델로 마이크로소프트와의 협업을 통해 축적한 기술적 노하우는 향후 KT의 다양한 AI 모델 개발에 확산 적용될 것"이라며 "국내 AI 생태계 활성화는 물론 공공과 민간 전반에서 AI를 활용한 혁신을 주도하며 국가 AI 경쟁력 제고에 기여할 것"이라고 말했습니다.




배너