메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
산업>전기/전자

LG AI 연구원, 처음 보는 이미지도 설명 달아주는 '캡셔닝 AI' 공개…이미지 1만장 2일만에

이홍락 LG AI연구원 CSAI가 캡셔닝 AI에 적용한 제로샷 이미지 캡셔닝 기술에 대해 설명하고 있다 /LG

LG AI 연구원이 이미지를 더 빠르고 정확하게 검색할 수 있는 기술을 개발했다.

 

LG AI연구원은 18일(현지시간) 캐나다 밴쿠버에서 열린 컴퓨터 비전 학회 'CVPR 2023'에서 '캡셔닝 AI'를 처음 공개했다고 19일 밝혔다.

 

캡셔닝 AI는 처음 보는 이미지까지 자연어로 설명할 수 있는 AI다. 이미지 검색에 활용하는 문장이나 키워드 등 메타 데이터를 생성할 수 있다.

 

캡셔닝 AI는 LG AI연구원이 처음으로 공개한 생성형 AI 상용화 서비스다. 처음 보는 물체나 장면도 이해하고 설명할 수 있는 '제로샷 이미지 캡셔닝' 기술을 적용했다.

 

LG는 캡셔닝 AI가 대량의 이미지를 관리하는 기업에서 업무 효율성과 생산성을 높일 것으로 기대했다. 평균적으로 5개 문장과 10개 키워드를 10초 내에 생성, 이미지 범위를 1만장으로 확장하면 2일 이내에 작업을 끝낼 수 있어 빠른 시간에 맞춤형 이미지 검색 및 관리 시스템 구축이 가능할 전망이다.

 

LG AI연구원은 이미지 플랫폼 '셔터스톡'과 긴밀한 협업을 통해 캡셔닝 AI를 고도화했다. 데이터 학습부터 서비스 개발까지 함께하며 데이터 편향성 등 AI 윤리 검증을 진행하고 저작권 투명성도 확보했다.

 

LG AI 연구원은 학회 기간 LG 부스에서 캡셔닝 AI 서비스를 시연한다. 서울대 AI 대학원과 함께 제로샷 이미지 캡셔닝을 주제로 워크숍을 진행하며 미래 전망과 영향 등 논의도 진행했다.

 

세잘 아민 셔터스톡 CTO는 "현재 글로벌 고객사 10곳을 대상으로 '얼리 액세스(앞서 해보기) 프로그램'을 진행하며 캡셔닝 AI 기술을 발전시켜 나가고 있다"며, "캡셔닝 AI는 고객들이 반복적인 작업보다 좀 더 본질적이고 창의적인 일에 집중할 수 있도록 돕는 AI가 될 것"이라고 강조했다.

 

LG는 워크숍에서 LG 글로벌 AI 챌린지 시상식도 함께 열었다. AI 모델 이미지 이해 능력을 평가해 142개 연구팀 중 난징과기대와 카이스트를 1위와 2위에 선정했으며, 이날 연구 성과를 발표하는 시간도 제공했다.

 

김승환 LG AI연구원 비전랩장은 "이번 워크숍은 첫 번째 상용화 서비스인 '캡셔닝 AI' 발표와 연계되어 있어 더욱 의미가 깊다"며, "이미지 캡셔닝 분야의 글로벌 연구 리더십을 확보하기 위해 다양한 파트너들과 유기적인 협력체계를 구축해 새로운 평가 지표 개발과 신기술 연구를 계속 추진할 계획"이라고 말했다.

 

LG AI 연구원은 22일까지 열리는 학회 기간을 이용해 글로벌 AI 우수 인재 확보에도 나선다. LG전자와 LG이노텍 등 주요 계열사도 함께 한다. 석박사 학생을 대상으로 네트워킹 행사 LG AI 데이를 진행하고, 20일부터 3일간 연구인력과 채용 담당자가 최신 AI 기술 시연과 채용 상담도 진행한다.

 

한편 LG는 통합 부스에서 LG전자의 운전자 모니터링 시스템과 냉장고에 보관한 식품 신선도 변화 등을 구현하는 AI, LG이노텍의 디지털 트윈 등 주요 계열사 AI 기술도 함께 소개한다.

 

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr