[swift] RxSwift를 사용한 음성인식 처리 방법

20 Nov 2023

swift

음성인식은 모바일 애플리케이션에서 많이 사용되는 기능 중 하나입니다. 이 기능을 RxSwift를 사용해 구현하는 방법에 대해 알아보겠습니다.

음성인식 API 설정

일단, 음성인식을 위해서는 Apple의 Speech Framework를 사용해야합니다. Speech Framework는 iOS 10 이상에서 사용할 수 있습니다. 프로젝트 설정에서 Speech Framework를 추가해줍니다.

import Speech

권한 요청

사용자의 음성을 인식하기 위해서는 먼저 권한을 요청해야합니다.

private func requestSpeechAuthorization() {
    SFSpeechRecognizer.requestAuthorization { authStatus in
        // 권한이 획득되었는지 확인
        if authStatus == .authorized {
            // 권한이 허용되었으므로 음성인식을 시작할 수 있음
        } else {
            // 권한이 거부되었으므로 사용자에게 알림을 보여줌
        }
    }
}

음성인식 시작

권한이 획득되었다면, 음성인식을 시작할 수 있습니다.

private func startSpeechRecognition() {
    // 음성인식 인스턴스 생성
    let speechRecognizer = SFSpeechRecognizer(locale: Locale(identifier: "ko-KR"))
    
    // 음성인식 요청 생성
    let recognitionRequest = SFSpeechAudioBufferRecognitionRequest()
    
    // 입력 오디오 녹음을 위한 오디오 엔진 생성
    let audioEngine = AVAudioEngine()
    
    // 오디오 스트림을 인식 요청에 연결
    let inputNode = audioEngine.inputNode
    recognitionRequest.shouldReportPartialResults = true
    
    // 음성인식 결과 처리
    let recognitionTask = speechRecognizer?.recognitionTask(with: recognitionRequest) { result, error in
        guard let result = result else {
            // 오류 처리
            return
        }
        
        // 인식 결과 사용
        let recognizedText = result.bestTranscription.formattedString
        print("인식된 텍스트: \(recognizedText)")
        
        // 실시간 인식 결과 사용
        let partialText = result.bestTranscription.formattedString
        print("실시간 텍스트: \(partialText)")
    }
    
    // 오디오 엔진 시작
    audioEngine.prepare()
    try? audioEngine.start()
    
    // 음성인식 시작
    recognitionTask?.cancel()
    recognitionTask?.finish()
    recognitionTask = speechRecognizer?.recognitionTask(with: recognitionRequest) { result, error in
        // 음성인식 처리
    }
}

음성인식 종료

음성인식이 완료되었을 때, 반드시 음성인식을 종료하고 리소스를 해제해야합니다.

private func stopSpeechRecognition() {
    recognitionTask?.finish()
    recognitionTask = nil
}

결론

이렇게 RxSwift를 사용해서 음성인식을 처리하는 방법에 대해 알아보았습니다. Speech Framework를 사용하여 권한 요청과 음성인식을 조작할 수 있습니다. 음성인식은 애플리케이션에서 사용자가 편리하게 입력할 수 있는 기능으로 활용될 수 있습니다.

참고 자료: