JavaScript로 Speech Recognition API 시작하기

등록일시: 2018-02-13 08:00, 수정일시: 2018-05-02 04:27

이 문서는 Cognitive Services 기술을 널리 알리고자 하는 개인적인 취지로 제공되는 번역문서입니다. 이 문서에 대한 모든 저작권은 마이크로소프트에 있으며 요청이 있을 경우 언제라도 게시가 중단될 수 있습니다. 번역 내용에 오역이 존재할 수 있고 주석은 번역자 개인의 의견일 뿐이며 마이크로소프트는 이에 관한 어떠한 보장도 하지 않습니다. 번역이 완료된 이후에도 대상 제품 및 기술이 개선되거나 변경됨에 따라 원문의 내용도 변경되거나 보완되었을 수 있으므로 주의하시기 바랍니다.

본 번역문서의 원문은 Get started with the Speech Recognition API in JavaScript _{docs.microsoft.com} 입니다.

Speech Recognition API를 사용하면 음성 오디오를 텍스트로 변환하는 응용 프로그램을 개발할 수 있습니다. JavaScript 클라이언트 라이브러리는 말을 하면서 동시에 전사된 텍스트를 수신할 수 있는 Speech Service WebSocket 프로토콜을 사용합니다. 본문에서는 JavaScript로 Speech Recognition API를 시작하는 방법을 살펴봅니다.

요구 사항

Speech API는 Microsoft Cognitive Services의 (구 프로젝트 Oxford) 일부분입니다. 무료 평가판 구독 키는 Cognitive Services 체험하기 페이지에서 발급받을 수 있습니다. 음성 탭에서 Bing Speech API를 선택한 다음, API 키 가져오기(Get API Key) 버튼을 클릭합니다. 그러면 기본 키와 보조 키가 발급됩니다. 두 키 모두 동일한 할당량에 연결되어 있으므로 두 키 중 아무 키나 사용해도 무방합니다.

중요

구독 키 발급받기. Speech 클라이언트 라이브러리를 사용하려면 반드시 구독 키가 필요합니다.

시작하기

이번 절에서는 예제 HTML 페이지를 로드하기 위한 과정을 살펴봅니다. 예제는 GitHub 저장소에 위치해 있습니다. 저장소에서 직접 예제를 열거나, 저장소의 로컬 복사본에서 예제를 열 수 있습니다.

노트

일부 브라우저는 안전하지 않은 원본의 마이크 접근을 차단합니다. 따라서 https 상에서 예제를 호스트해서 지원되는 모든 브라우저에서 동작할 수 있도록 구성하는 것을 권장합니다.

직접 예제 열기

앞에서 설명한 방법으로 구독 키를 발급받습니다. 그럼 다음, 예제 링크를 엽니다. 그러면 기본 브라우저에 페이지가 로드됩니다 (htmlPreview를 이용해서 렌더됩니다).

역주

이 방식으로 예제를 직접 열 경우, 기본 언어에 한국어가 포함되어 있지 않기 때문에 한국어 테스트가 불가능합니다. 한국어를 테스트하려면 다음 로컬 복사본에서 예제 열기 절을 참고하시기 바랍니다.

로컬 복사본에서 예제 열기

로컬에서 예제를 테스트해보려면, 먼저 다음 저장소를 복제합니다:

git clone https://github.com/Azure-Samples/SpeechToText-WebSockets-Javascript

그리고 TypeScript 소스를 컴파일하고 단일 JavaScript 파일로 번들 및 Browserfy 합니다 (컴퓨터에 npm을 설치해야 합니다). 복제된 저장소의 루트로 이동한 다음, 다음 명령을 실행하십시오:

cd SpeechToText-WebSockets-Javascript && npm run bundle

선호하는 브라우저로 samples\browser\Sample.html 파일을 엽니다.

다음 단계

자신의 웹 페이지에 SDK를 포함시키는 방법에 대한 자세한 정보는 여기를 참고하시기 바랍니다.

비고

Speech Recognition API는 세 가지 인식 모드를 지원합니다. 그리고 Sample.html 파일에 위치한 Setup() 함수를 수정해서 모드를 변경할 수 있습니다. 기본적으로 본문의 예제는 Interactive 모드로 설정되어 있습니다. 모드를 변경하려면, SR.RecognitionMode.Interactive 매개 변수를 다른 모드로 변경하십시오. 예를 들어서, SR.RecognitionMode.Conversation으로 매개 변수를 변경할 수 있습니다.

역주

2018년 2월 현재, 예제 페이지에서 인식 모드를 선택할 수 있습니다.
지원되는 언어의 전체 목록을 보려면 Supported Languages를 참고하시기 바랍니다.

INDEX: Speech: Bing Speech Service 기술문서 번역

Microsoft Speech API 개요 2018-01-30 08:00
REST API를 이용한 음성 인식 시작하기 (PowerShell, cUrl, C#) 2018-02-01 08:00
Windows에서 .NET C#으로 Speech Recognition API 시작하기 2018-02-06 08:00
Windows에서 .NET C#으로 음성 인식 서비스 라이브러리 시작하기 2018-02-08 08:00
JavaScript로 Speech Recognition API 시작하기 2018-02-13 08:00
Android에서 Java로 음성 인식 시작하기 2018-02-15 08:00