Speech Recognition란?

음성 인식(Speech Recognition, ASR)은 음성 신호를 텍스트로 자동 변환하는 기술입니다. 가상 비서(Siri, Alexa), 음성 검색, 자동 자막, 콜센터 분석, 받아쓰기 도구에 활용되며, 최근 Whisper 같은 트랜스포머 기반 다국어 모델이 성능을 혁신적으로 향상시켰습니다. 잡음·억양·전문 용어에 대한 강건성이 주요 연구 과제이며, 실시간 저지연 처리가 중요합니다.