NCE 자격증 이론정리 100편- AI 분야 -CLOVA Speech 핵심요약
작성자 정보
- 관리자 작성
- 작성일
컨텐츠 정보
- 1,380 조회
- 0 추천
- 목록
본문
CLOVA Speech 핵심요약
-정형화되지 않은 말소리를 인식하여
텍스트로 바꿔주는 음성인식 서비스
-음성인식 기술을 통한 미디어내
음성 인식 서비스
.음성메모, 영상자막생성, 통화 녹취록관리등의 서비스를 만들 때 활용할 수 있는
음성인식서비스
.인식결과 수정을 위한 Speech 빌더 제공
(아래. Audio 파일포맷, Video 파일포맷 지원가능 포맷 외워둘 것. 특히 audio포맷)
-결과파일 포맷 : json, smi, csv, xls, srt
-화자분리 기능제공, 인식결과 신뢰도 학습을 통한 학습 알고리즘 개선
-문장자동 분리 및 타임스템프 지원
타임스템프 기능을 제공하여 음성을 텍스트로 변환하는 과정에서 적절한
길이로 문장을 분리하고 시간을 표시한다. 또한 문장의 시작과 끝을 시각적으로 표시해주어 자막을 생성하는
등 다양한 방식으로 활용할 수 있다.
-키워드 부스팅
키워드부스팅기능을 사용하여 인식 확률을 높이고 싶은 단어를 미리 설정할
수 있다. 등록할 수 있는 문자 및 언어는 한글, 영어, 일본어, 숫자이다.
-인식결과 수정 에디터 제공
. CLOVA Speech를 통해 인식된 데이터를 손쉽게
수정, 편집하여 재가공 할 수 있다. 편집하려는 파일이 재생되고
있는 과정에서 인식된 데이터를 바로바로 수정할 수 있다. 인식결과는 자막은 물론 다양한 파일형식으로
추출 할 수 있다.
-API기반 인식 제공
CLOVA Speech 빌더 뿐만 아니라, API를 기반을오 한 활용이 가능하다.
최대 2시간 인식이 가능하며 인식 파일크기는 최대 2GB까지 지원한다.
-사용예1 : 고객센터에서 상담원과 고객이 나누었던 내용을 텍스트화하여 보관하고 싶을 때
-사용예2 : 오디오와 비디오 데이터의 음성을 텍스트화하여 아카이빙하고 분석가능
-사용예3 : 문장 자동분리와 타임스템프 기능을 통해 자동으로 손쉽게 자막생성 가능
-사용예4 : 현재 네이버 방송뉴스에 적용되어 자동자막생성 기능을 제공중
관련자료
-
이전
-
다음