검색창 열기 인더뉴스 부·울·경

Society 사회

미디어모니터링협회, 언론 긍정표현지수 개발

URL복사

Thursday, July 06, 2023, 13:07:33

텍스트 마이닝’ 기법과 사전 학습 언어모형(BERT)등을 활용
윤석열 대통령 및 15개 광역자치단체장 기사 분석
윤 대통령 긍정표현지수 49.4

 

인더뉴스 김용운 기자ㅣ미디어모니터링협회가 언론 뉴스 빅데이터와 언어모형 등을 활용해 뉴스 내용의 평균적인 긍정 표현 정도를 측정할 수 있는 '긍정표현지수(Positive Expression Index, PEI)'를 개발했다고 6일 밝혔습니다. 

 

미디어모니터링협회는 한국언론재단의 빅카인즈에서 제공하는 전국 54개 언론사 뉴스 자료를 이용, 윤석열 대통령과 15 개 광역자치단체장에 대한 취임 이후 1년 동안의 약 20만개 뉴스 내용의 긍정표현 수준을 추정하고 데이터를 추출했습니다. 

 

윤석열 대통령 취임 후 1년 동안 보도된 기사 분석 결과, 언론의 긍정표현지수는 49.4로 15개 광역자치단체장(세종시와 제주도 제외)의 평균 지수 58.5보다 9.1포인트 낮은 것으로 추정되며, 후반기 6개월 의 평균 긍정표현지수가 50.4로 전반기(48.6) 보다 높아진 것으로 나타났습니다. 주요 매체별로는 중앙일간지의 긍정표현지수가 47.8로 상대적으로 낮게 나왔습니다. 

 

15개 광역자치단체장의 취임 후 1년 동안의 언론사 전체 평균 긍정표현지수는 58.5이며, 개별 단체장별로는 김영록 전남도지사와 이철우 경북도지사에 대한 긍정표현지수가 62.9로 가장 높은 반면에, 홍준표 대구시장의 긍정표현지수가 49.2로 가장 낮은 것으로 나타났습니다. 

 

미디어모니터링협회는 지난 5월 미디어 콘텐츠에 대한 객관적인 모니터 링 정보 생산을 주요 활동 목표로 설정하고 출범한 단체입니다. 

 

문철수 미디어모니터링협회 회장(전 한국언론학회장)은 "향후에도 보다 광범위한 미디어 뉴스 빅데이터 자료를 수집하는 동시에, 더욱 고도화된 분석 기법 등을 활용하여 객관적인 모니터링 정보를 합리적으로 생산하고 공유함으로써 미디어 콘텐츠의 공공성을 제고하 기 위한 노력을 지속하겠다"고 말했습니다. 

English(中文·日本語) news is the result of applying Google Translate. <iN THE NEWS> is not responsible for the content of English(中文·日本語) news.

배너

김용운 기자 lucky@inthenews.co.kr

배너

SKT, ‘한국어 특화’ A.X 4.0 오픈소스 공개… “최고 수준 한국어 처리”

SKT, ‘한국어 특화’ A.X 4.0 오픈소스 공개… “최고 수준 한국어 처리”

2025.07.03 11:37:16

인더뉴스 이종현 기자ㅣSK텔레콤[017670]은 한국어 특화 LLM인 A.X(에이닷 엑스) 4.0을 오픈소스로 공개했다고 3일 밝혔습니다. SKT는 이날 오전 글로벌 오픈소스 커뮤니티 허깅페이스(Hugging Face)를 통해 A.X 4.0의 표준 모델과 경량 모델 2종을 공개했습니다. 이번에 공개한 A.X 4.0은 현존 대규모 언어 모델(LLM) 중에서도 최상급의 한국어 처리 효율성은 물론 데이터 보안을 고려한 설계, 그리고 로컬 환경에서의 운영 가능성 등이 강점이라고 SKT는 설명했습니다. 오픈소스 모델인 Qwen2.5에 방대한 한국어 데이터를 추가로 학습시켜 국내 비즈니스 환경에 맞는 성능을 발휘합니다. SKT는 A.X 4.0의 토크나이저를 자체 설계·적용해 높은 수준의 한국어 처리 역량을 구현했습니다. 자체 테스트 결과 같은 한국어 문장을 입력했을 때 GPT-4o보다 A.X 4.0이 약 33%가량 높은 토큰 효율을 기록하며 다른 LLM 대비 높은 정보 처리용량에 비용 절감까지 가능합니다. 토크나이저(Tokenizer)는 문장의 구조를 분석해 토큰으로 분할하는 작업 도구를 의미합니다. A.X 4.0은 대표적인 한국어 능력 평가 벤치마크인 KMMLU2)에서 78.3점을 기록하여 GPT-4o(72.5점)보다 우수한 성능을 보였으며 한국어 및 한국 문화 벤치마크인 CLIcK에서도 83.5점을 획득해 GPT-4o(80.2점)보다 더 높은 한국 문화 이해도를 보였습니다. SKT는 A.X 4.0를 기업 내부 서버에 직접 설치해 사용할 수 있는 온프레미스 방식으로 제공해 기업들이 데이터 보안에 대한 걱정을 덜 수 있도록 서비스할 계획입니다. A.X 4.0 개발 과정에서도 대규모 학습(CPT)의 전 과정을 외부와 연동 없이 자체 데이터로 학습해 데이터의 주권도 확보한 바 있습니다. 표준 모델은 720억개(72B), 경량 모델은 70억개(7B)의 매개변수를 갖추고 있어 이용자들이 목적에 맞춰 선택적으로 이용할 수 있도록 했습니다. SKT는 이미 A.X 4.0을 지난 5월 에이닷 통화 요약에 적용 및 활용하고 있으며 추후 자사는 물론 SK그룹 내 다양한 서비스에 적용할 계획입니다. SKT가 이번에 선보인 모델로 기업들은 파생형 모델을 개발할 수 있고 연구 분야에서도 활용할 수 있습니다. SKT는 이번 A.X 4.0 지식형 모델의 오픈소스 공개와 동시에 추론형 모델의 발표도 앞두고 있습니다. SKT는 이달 중으로 수학 문제 해결과 코드 개발 능력이 강화된 추론형 모델을 공개하고 이미지와 텍스트를 동시에 이해하고 처리할 수 있는 수준까지 모델을 업데이트할 계획입니다. 또한, 소버린 AI 관점에서 A.X 3.0에 적용한 프롬 스크래치(모델의 맨 처음 단계부터 모두 직접 구축) 방식도 병행하여 개발을 진행하고 있으며 후속 모델도 순차적으로 공개할 예정입니다. 김지원 SKT AI Model Lab장은 "SK텔레콤의 다양한 서비스를 고도화하고 기업 시장에서 한국어 특화 LLM으로 국내 비즈니스 환경에 최적화된 모델이 될 수 있도록 지속적인 기술 개발을 추진할 계획"이라고 말했습니다.


배너


배너