본 제안서는 외국인 한국어 학습자를 위한 발음 교정 웹 애플리케이션 개발 프로젝트를 제안합니다. 이 시스템은 두 개의 특화된 음성인식 모델을 활용하여 외국인 화자의 한국어 발음을 정확히 인식하고, 발음 오류를 진단하여 맞춤형 피드백을 제공합니다.
주요 기능으로는 1) 외국인의 불안정한 한국어 발화를 정확한 텍스트로 변환 2) 발음 오류 감지 및 피드백 제공 3) 다중 화자 환경에서 개별 화자 식별 4) 상황에 맞는 단어 및 표현 추천이 포함됩니다.
본 프로젝트는 10주 기간 동안 워터폴 방식으로 개발될 예정이며, 프론트엔드는 React, 백엔드는 Django, AI 모델 개발은 PyTorch를 사용합니다. 주요 성과물로는 웹 애플리케이션, AI 모델, 그리고 모델 추론 API가 있습니다.
최근 음성 인식 및 자연어 처리(NLP) 기술의 발전으로 인해, 음성 데이터를 활용한 발화 분석 및 교정 시스템의 개발이 현실적으로 가능해졌다. 본 연구에서는 이러한 기술을 활용하여 한국어 학습자의 발음을 분석하고 교정하는 시스템을 개발하고자 한다. 이를 통해 학습자가 보다 명확하고 자연스럽게 발화할 수 있도록 지원하는 것을 목표로 한다.
본 연구에서는 딥러닝 기반의 음성 인식 모델을 활용하여 발음 오류 감지, 학습자의 발화 특성 분석, 그리고 문맥에 맞는 단어 추천 기능을 포함한 통합 시스템을 구축할 계획이다.
본 프로젝트의 목표는 발표 및 회의 상황에서 사용자들의 발화를 실시간으로 평가하고 다양한 화자를 효과적으로 구별하여, 사용자의 커뮤니케이션 능력을 향상시키는 서비스를 개발하는 것이다. 이를 위해 다음 두 가지 핵심 기능을 중심으로 프로젝트를 수행한다. 첫째, 사용자의 부정확한 발음을 효과적으로 감지하여 즉각적인 교정 피드백을 제공하는 기능을 개발한다. 둘째, 음성 신호에서 추출한 음색, 톤, 발화 습관과 같은 특징을 기반으로 다양한 화자를 실시간으로 구별하는 기능을 개발한다.
외국인 화자들이 발표나 회의 상황에서 정확한 발음을 유지하기 어려운 경우가 많아 지원 시스템이 필요하다. 이를 해결하기 위해 두 가지 모델을 제안한다. 첫 번째 모델은 외국인의 불안정한 한국어 발화를 정확한 한국어 텍스트로 변환하는 음성 인식 모델이며 이는 외국인-한국어 발음 데이터셋을 활용하여 학습을 진행한다. 두 번째 모델은 외국인의 불안정한 한국어 발화를 한국인의 입장에서 들리는 그대로 텍스트로 변환해주는 음성 인식 모델로 한국인-한국어 발음 데이터셋을 활용하여 학습을 진행한다.