녹음기를 켜둔 상태에서 인터뷰를 하고, 이후에 녹음 파일을 들으며 말했던 내용을 받아 적는 과정에서 인터뷰를 했던 것만큼의 시간이 소요될 때가 있다. 인터뷰를 하는 동시에 노트북으로 받아 적기도 하지만 그렇지 못한 상황이거나 중간에 말을 놓쳤을 때는 녹음 파일에서 특정 부분을 찾아서 다시 들어야 하기 때문이다.
이럴 때마다 음성만 있으면 텍스트(글)로 기록되는 기술이 절실했다. 기존에도 여러 서비스가 있지만 저장된 녹음파일을 바로 활용할 수 없어 실시간으로 녹음을 해야 하거나 유료인 경우가 많았다.
이런 고민을 해결하기 위해 네이버가 지난달 출시한 음성기록 서비스 '클로바노트'를 사용해봤다. 클로바노트는 AI기술을 통해 음성을 텍스트로 변환해주는 무료 서비스다.
사용 방법은 간단하다. 스마트폰에 클로바노트 앱을 설치한 후 업로드할 녹음 파일을 선택하고 대화 유형, 참석자 수를 선택하면 업로드가 시작된다. 1회당 변환 가능한 파일의 길이는 최대 90분이다. 90분가량의 인터뷰 녹음 파일로 먼저 시도해봤다. 8분 만에 음성이 텍스트로 변환된 결과물이 나타났다.
발화자와 발화 시간을 표시해 주고 일정 구간으로 나눠져 있어 원하는 부분을 누르면 그 부분부터 다시 들을 수 있다는 점이 가장 편리했다. 클로바노트 없이 녹음 파일을 직접 확인할 때는 원하는 부분을 찾기 위해 여러번 눌러봐야 했기 때문이다.
클로바노트 앱과 PC는 자동으로 동기화되어 앱에서 녹음을 마치면 PC에서 바로 텍스트로 변환된 음성 기록을 확인할 수 있다. 다만 텍스트 수정과 발화자 이름 변경이 PC에서만 가능한 부분은 아쉬웠다.
중요한 대화 순간을 표시하는 북마크 기능과 필요한 내용을 빠르게 찾을 수 있는 검색 기능도 탑재했다. 향후에는 사용자의 메모에서 주요 단어를 추출해 더 정확한 음성인식 결과를 제공하고, 내 노트를 다른 사람에게 공유할 수 있는 기능도 추가할 예정이다.
90분가량의 음성 파일을 짧은 시간에 텍스트로 바꿔주는 기능은 놀라웠지만 엉뚱한 단어로 바꿔준 경우도 많아서 클로바노트에 변환된 텍스트를 그대로 복사해서 사용하기에는 어려워 보였다. 녹음하는 현장에 있었기 때문에 문맥을 파악하는 데는 어렵지 않지만 오타와 함께 문장부호와 띄어쓰기 점검도 직접 해야 한다. AI가 질문의 상황에서 물음표(?)까지는 담아내지 못했고, 문장이 끝나지 않은 상황에서도 온점(.)을 찍는 경우가 많았기 때문이다.
틀린 부분을 살펴본 결과 AI가 전혀 다른 단어로 듣긴 했지만 비슷한 발음으로 대체해놔서 올바른 단어로 고치는 데는 어렵지 않았다. '구글(정확한 텍스트)-국을(틀리게 바꾼 텍스트)', '외산 제품-외상 제품', '저가의 제품을 원하는 시장-젓갈 제품을 원하는 시장', '테스트베드-테스트배치', '대부분 다 그래요-대본 다 그래요', '다운로드하고 업로드 하고-당황하다가 엄마도 하고', '우리나라는 이런식으로 시장이 만들어져요. 중국도 가고 일본도 갔지만 다 망했습니다-우리나라 1인실로 시장이 만들어져요. 중국도 가고 일본도 같이 사망했습니다' 등이 그 사례다.
발화자 구분도 대체적으로 잘 이뤄졌지만 가끔씩 틀릴 때가 있었다. 2명이 말했지만 1명이 말한 것으로 인식한 경우다.
클로바노트를 사용해본 결과, 정확성에 대한 측면은 아직 부족하지만 녹음 파일 들으며 일일이 받아 적는 수고로움 사라졌다는 측면에서 만족스러운 제품으로 자주 이용할 것 같다.
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성