강좌
클라우드/리눅스에 관한 강좌입니다.
자격증 분류

NCE 자격증 이론정리 100편- AI 분야 -CLOVA Speech 핵심요약

작성자 정보

  • 관리자 작성
  • 작성일

컨텐츠 정보

본문

 

CLOVA Speech 핵심요약



cb2897aa7928ddcdb5688afaee5aab2e_1694584314_628.png
 

 

 

 

-정형화되지 않은 말소리를 인식하여 텍스트로 바꿔주는 음성인식 서비스


-음성인식 기술을 통한 미디어내 음성 인식 서비스

.음성메모, 영상자막생성, 통화 녹취록관리등의 서비스를 만들 때 활용할 수 있는 음성인식서비스

  .인식결과 수정을 위한 Speech 빌더 제공



 cb2897aa7928ddcdb5688afaee5aab2e_1694584337_5619.png



 

(아래. Audio 파일포맷, Video 파일포맷 지원가능 포맷 외워둘 것. 특히 audio포맷)

-결과파일 포맷 : json, smi, csv, xls, srt


-
화자분리 기능제공, 인식결과 신뢰도 학습을 통한 학습 알고리즘 개선


-
문장자동 분리 및 타임스템프 지원

 타임스템프 기능을 제공하여 음성을 텍스트로 변환하는 과정에서 적절한 길이로 문장을 분리하고 시간을 표시한다. 또한 문장의 시작과 끝을 시각적으로 표시해주어 자막을 생성하는 등 다양한 방식으로 활용할 수 있다.


-
키워드 부스팅

 키워드부스팅기능을 사용하여 인식 확률을 높이고 싶은 단어를 미리 설정할 수 있다. 등록할 수 있는 문자 및 언어는 한글, 영어, 일본어, 숫자이다.


-인식결과 수정 에디터 제공

 . CLOVA Speech를 통해 인식된 데이터를 손쉽게 수정, 편집하여 재가공 할 수 있다. 편집하려는 파일이 재생되고 있는 과정에서 인식된 데이터를 바로바로 수정할 수 있다. 인식결과는 자막은 물론 다양한 파일형식으로 추출 할 수 있다.


-API
기반 인식 제공

 CLOVA Speech 빌더 뿐만 아니라, API를 기반을오 한 활용이 가능하다.

 
 
최대 2시간 인식이 가능하며 인식 파일크기는 최대 2GB까지 지원한다.

 

 

cb2897aa7928ddcdb5688afaee5aab2e_1694584393_0244.png
 


 

 

 

-사용예1 : 고객센터에서 상담원과 고객이 나누었던 내용을 텍스트화하여 보관하고 싶을 때

-사용예2 : 오디오와 비디오 데이터의 음성을 텍스트화하여 아카이빙하고 분석가능

-사용예3 : 문장 자동분리와 타임스템프 기능을 통해 자동으로 손쉽게 자막생성 가능

-사용예4 : 현재 네이버 방송뉴스에 적용되어 자동자막생성 기능을 제공중

 

 






관련자료

댓글 0
등록된 댓글이 없습니다.

공지사항


뉴스광장


  • 현재 회원수 :  60,153 명
  • 현재 강좌수 :  36,484 개
  • 현재 접속자 :  255 명