소프트웨어 개발 연구 제안서
표지
- Title:
- 외국인 학습자를 위한 한국어 발음 교정 시스템 개발(Korean Transcriber+ for Foreign Learners)
- Date:
- Division of Computer Science, Hanyang University ERICA
- Team: 스피꼬 ( Speak Kor )
요약
- 목표:
- 본 프로젝트는 외국인 화자의 한국어 발음을 정확히 인식하고 교정하는 인공지능 기반 웹 애플리케이션 시스템을 개발하는 것을 목표로 합니다.
- 두 개의 특화된 모델을 사용하여 부정확한 발음을 정확한 텍스트로 변환하고, 발음 오류를 진단하여 맞춤형 피드백을 제공합니다.
- 또한 다중 화자 환경에서 개별 화자를 식별하고 각 화자의 발음 패턴을 분석함으로써, 외국인 학습자들의 한국어 의사소통 능력 향상을 지원합니다.
- 내용:
- 본 연구에서는 두 가지 주요 모델을 개발합니다:
- 외국인의 불안정한 한국어 발화를 정확한 텍스트로 변환하는 교정 모델과
- 발음 오류를 감지하고 분석하는 진단 모델입니다.
- AI Hub의 외국인 한국어 발화 음성 데이터와 한국인 한국어 발화 음성 데이터를 활용하여 모델을 학습시킵니다.
- 시스템은 사용자 발화를 녹음하고, 화자 구분(Speaker Diarization)을 통해 각 화자의 발언을 분리한 후, 두 모델을 통해 텍스트 변환과 오류 분석을 수행합니다.
- 분석 결과를 바탕으로 발음 오류 부분을 하이라이트하고 맞춤형 피드백을 제공합니다.
- 본 프로젝트는 10주 기간 동안 워터폴 방식으로 개발될 예정이며, 프론트엔드는 React, 백엔드는 Django, AI 모델 개발은 PyTorch를 사용합니다.
- 예상 성과:
- 외국인 화자 특화 음성 인식 모델 구축:
- 기존 ASR 시스템보다 외국인 한국어 발화에 대해 향상된 인식률 달성
- 화자 식별 및 발음 피드백 웹 애플리케이션 구현:
- 학습자 진행 상황 추적 및 맞춤형 학습 경로 제공
- 주요어: 음성 인식, 화자 식별, 발음 교정, 외국인 한국어 학습, 다중 모델 접근법, 맞춤형 피드백
본문
1. 목표 및 중요성
A. 연구 분야 조사
- 최근 한국어를 배우는 외국인 학습자 수가 증가하면서 효과적인 한국어 발음 교육에 대한 수요가 늘고 있습니다.
- 한국어를 배우는 외국인 학습자들은 다음과 같은 어려움을 겪고 있습니다:
- 발음 정확도 파악의 어려움: 자신의 발음이 정확한지 스스로 평가하기 어려움
- 맞춤형 피드백 부재: 기존 STT 서비스는 외국인 발음에 최적화되어 있지 않아 정확한 인식률이 낮음
- 다중 화자 환경에서의 학습 제한: 그룹 학습 상황에서 개별 학습자의 발음 분석이 어려움
- 상황별 적절한 표현 학습 한계: 맥락에 맞는 단어 및 표현 추천 기능 부족
- 현재 음성 인식 기술 현황: