ICT 정보통신

LG AI연구원, CVPR 2023서 ‘캡셔닝 AI’ 공개

Monday, June 19, 2023, 14:06:53 크게보기

이미지 검색시 문장, 키워드 등 메타 데이터 생성
처음 보는 이미지까지 자연어로 설명
이미지 플랫폼 셔터스톡과 협력

 

인더뉴스 권용희 기자ㅣLG AI연구원은 캐나다 벤쿠버에서 열린 '컴퓨터 비전 학회(CVPR) 2023'서 '캡셔닝 AI'를 처음 공개했다고 19일 밝혔습니다.

 

캡셔닝 AI는 이미지 검색에 활용할 수 있는 정보인 문장이나 키워드 등 메타 데이터를 생성하는 생성형 AI 상용화 서비스입니다. 처음 보는 이미지까지 자연어로 설명할 수 있다는 특징을 갖고 있습니다.

 

LG AI연구원은 기존 학습 이미지와 텍스트 데이터를 기반으로 배경, 인물, 행동 등 이미지 상의 다양한 요소와 특징을 인식하고 그 관계를 이해하고 설명하는 '제로샷 이미지 캡셔닝' 기술을 활용했습니다.

 

'캡셔닝 AI'는 평균적으로 5개 문장과 10개의 키워드를 10초내에 생성할 수 있다는 특징을 갖고 있습니다. LG AI연구원은 이미지, 영상 등 시각 콘텐츠 플랫폼 기업 '셔터스톡'과의 협력을 진행한 것으로 나타났습니다.

 

LG AI연구원은 셔터스톡과 함께 학습 데이터의 편향성·선정성 등 AI 윤리 검증을 진행하고, 저작권 투명성도 확보했다고 밝혔습니다.

 

세잘 아민 셔터스톡 CTO는 "현재 글로벌 고객사 10곳을 대상으로 '얼리 액세스 프로그램'을 진행하며 캡셔닝 AI 기술을 발전시켜 나가고 있다"면서 "캡셔닝 AI는 고객들이 반복적인 작업보다 좀 더 본질적이고 창의적인 일에 집중할 수 있도록 돕는 AI가 될 것"이라고 강조했습니다.

 

김승환 LG AI연구원 비전랩장은 "이미지 캡셔닝 분야의 글로벌 연구 리더십을 확보하기 위해 다양한 파트너들과 유기적인 협력체계를 구축해 새로운 평가 지표 개발과 신기술 연구를 계속 추진할 계획"이라고 말했습니다.

English(中文·日本語) news is the result of applying Google Translate. <iN THE NEWS> is not responsible for the content of English(中文·日本語) news.

권용희 기자 brightman@inthenews.co.kr

Copyright @2013~2025 iN THE NEWS Corp. All rights reserved.



인더뉴스(주)/ 인터넷신문 등록번호: 서울 아 02788/ 등록일 2013년 8월 26일/ 제호: 인더뉴스(iN THE NEWS)/ 발행인 문정태·편집인 박호식, 주소: 서울시 종로구 새문안로92, 광화문오피시아빌딩 1803호 발행일자: 2013년 9월 2일/ 전화번호: 02) 6406-2552/ 청소년보호 책임자: 박호식 Copyright © 2013~2025 인더뉴스(iN THE NEWS) All rights reserved. / 인더뉴스(주)의 모든 콘텐츠는 저작권법의 보호를 받으므로 무단 전재·복사·배포 등을 금합니다. (단, 기사내용을 일부 발췌한 뒤 출처표기를 해서 ‘링크’를 걸어 두는 것은 허용합니다.)