메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>IT/인터넷

[구기자의 뜯구쓰구/24]네이버 클로바노트 "90분짜리 음성을 AI가 8분 만에 글로 바꿔주네"

클로바노트에서 음성파일을 텍스트로 변환하는 과정. /구서윤 기자

녹음기를 켜둔 상태에서 인터뷰를 하고, 이후에 녹음 파일을 들으며 말했던 내용을 받아 적는 과정에서 인터뷰를 했던 것만큼의 시간이 소요될 때가 있다. 인터뷰를 하는 동시에 노트북으로 받아 적기도 하지만 그렇지 못한 상황이거나 중간에 말을 놓쳤을 때는 녹음 파일에서 특정 부분을 찾아서 다시 들어야 하기 때문이다.

 

이럴 때마다 음성만 있으면 텍스트(글)로 기록되는 기술이 절실했다. 기존에도 여러 서비스가 있지만 저장된 녹음파일을 바로 활용할 수 없어 실시간으로 녹음을 해야 하거나 유료인 경우가 많았다.

 

이런 고민을 해결하기 위해 네이버가 지난달 출시한 음성기록 서비스 '클로바노트'를 사용해봤다. 클로바노트는 AI기술을 통해 음성을 텍스트로 변환해주는 무료 서비스다.

 

사용 방법은 간단하다. 스마트폰에 클로바노트 앱을 설치한 후 업로드할 녹음 파일을 선택하고 대화 유형, 참석자 수를 선택하면 업로드가 시작된다. 1회당 변환 가능한 파일의 길이는 최대 90분이다. 90분가량의 인터뷰 녹음 파일로 먼저 시도해봤다. 8분 만에 음성이 텍스트로 변환된 결과물이 나타났다.

 

클로바노트가 음성 파일을 텍스트로 변환해준 결과. 빨간줄은 틀리게 변환한 부분. /구서윤 기자

발화자와 발화 시간을 표시해 주고 일정 구간으로 나눠져 있어 원하는 부분을 누르면 그 부분부터 다시 들을 수 있다는 점이 가장 편리했다. 클로바노트 없이 녹음 파일을 직접 확인할 때는 원하는 부분을 찾기 위해 여러번 눌러봐야 했기 때문이다.

 

클로바노트 앱과 PC는 자동으로 동기화되어 앱에서 녹음을 마치면 PC에서 바로 텍스트로 변환된 음성 기록을 확인할 수 있다. 다만 텍스트 수정과 발화자 이름 변경이 PC에서만 가능한 부분은 아쉬웠다.

 

중요한 대화 순간을 표시하는 북마크 기능과 필요한 내용을 빠르게 찾을 수 있는 검색 기능도 탑재했다. 향후에는 사용자의 메모에서 주요 단어를 추출해 더 정확한 음성인식 결과를 제공하고, 내 노트를 다른 사람에게 공유할 수 있는 기능도 추가할 예정이다.

 

90분가량의 음성 파일을 짧은 시간에 텍스트로 바꿔주는 기능은 놀라웠지만 엉뚱한 단어로 바꿔준 경우도 많아서 클로바노트에 변환된 텍스트를 그대로 복사해서 사용하기에는 어려워 보였다. 녹음하는 현장에 있었기 때문에 문맥을 파악하는 데는 어렵지 않지만 오타와 함께 문장부호와 띄어쓰기 점검도 직접 해야 한다. AI가 질문의 상황에서 물음표(?)까지는 담아내지 못했고, 문장이 끝나지 않은 상황에서도 온점(.)을 찍는 경우가 많았기 때문이다.

 

조용한 공간에서 이기주 작가의 '언어의 온도' 책 내용을 녹음해 변환해본 결과. /구서윤 기자

틀린 부분을 살펴본 결과 AI가 전혀 다른 단어로 듣긴 했지만 비슷한 발음으로 대체해놔서 올바른 단어로 고치는 데는 어렵지 않았다. '구글(정확한 텍스트)-국을(틀리게 바꾼 텍스트)', '외산 제품-외상 제품', '저가의 제품을 원하는 시장-젓갈 제품을 원하는 시장', '테스트베드-테스트배치', '대부분 다 그래요-대본 다 그래요', '다운로드하고 업로드 하고-당황하다가 엄마도 하고', '우리나라는 이런식으로 시장이 만들어져요. 중국도 가고 일본도 갔지만 다 망했습니다-우리나라 1인실로 시장이 만들어져요. 중국도 가고 일본도 같이 사망했습니다' 등이 그 사례다.

 

발화자 구분도 대체적으로 잘 이뤄졌지만 가끔씩 틀릴 때가 있었다. 2명이 말했지만 1명이 말한 것으로 인식한 경우다.

 

클로바노트를 사용해본 결과, 정확성에 대한 측면은 아직 부족하지만 녹음 파일 들으며 일일이 받아 적는 수고로움 사라졌다는 측면에서 만족스러운 제품으로 자주 이용할 것 같다.

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr