메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>IT/인터넷

'쓰는대로 소리난다' 다음 음성 합성 API 최초 공개



글자로 쓰면 바로 음성화되는 서비스가 공짜로 풀린다.

포털 다음은 26일 국내 최초로 음성 합성 API(애플리케이션 프로그래밍 인터페이스)를 공개했다.

이는 다음이 자체 개발한 음성 합성 엔진 '뉴톤 톡'(Newtone Talk)의 API로, 입력된 글자를 사람처럼 자연스럽게 읽어주는 것이 특징이다.

다음은 지난 2월 공개한 음성 인식 엔진 '뉴톤'의 API에 음성 합성 기능을 더해 입출력이 자유로운 음성 API를 이날부터 무료로 제공한다.

음성 합성이란 입력한 글자를 음성으로 변환해 들려주는 것을 의미한다. 운율, 높낮이 등 사람의 발성을 그대로 재현해내는 것이 이 기술의 완성도를 결정한다.

기존의 음성 합성 기술은 대부분 사람이 직접 들어보고 표기한 운율과 발성상태를 기반으로 수작업하는 형태였다. 하지만 다음은 한국어 운율 모델을 자체 개발해 이 모든 과정을 자동으로 처리, 다양한 운율을 예측할 수 있게 했다.

이를테면 가수 '2NE1'을 [투애니원], 'ㅋㅋㅋ'는 [크크크], 'You&I'를 [유앤아이]로 자동으로 읽어준다.

뉴톤과 뉴톤 톡은 안드로이드와 iOS 버전 모두 지원한다. 다음 개발자 네트워크(http://dna.daum.net)에서 제휴 신청하면 발급받을 수 있으며 일 1만 회까지 자유롭게 사용할 수 있다.
트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr