본문 바로가기
TIL _Today I Learned/2024.11

[DAY 77] 중간 프로젝트_ 영어 발음 채점 서비스 구현

by gamdong2 2024. 11. 7.
[천재교육] 프로젝트 기반 빅데이터 서비스 개발자 양성 과정 9기
학습일 : 2024.11.07

📕 프로젝트 작업 내역

  • 학습 레벨 선정 기준 확정
  • TTS 모델 신뢰성 검토
  • 서비스 차별화 전략 고민

 

📗 회의록

  • 회의 일자: 2024년 11월 7일
  • 회의 주제: 학습 레벨 선정 기준 확정 , TTS 모델 신뢰성 검토, 서비스 차별화 전략 고민
  • 참석자: OOO, OOO, OOO

 

1. 주요 논의 사항

  • 영어 학습 스크립트 생성 계획
    • OpenAI를 통해 수준별 학습 스크립트를 생성하기로 함
    • 천재교과서 학년별 영어 학습 문장을 기준으로 학습 단계를 나눔
      1. 소설/비소설: 초등(level 1~4; 초등 3~6학년 천재교과서 영어 문장 참조) + 심화(level 5~7, 중등 1~3학년 천재교과서 영어 문장 참조)
      2. 파닉스(level 1~2; 초등 1~2학년 수준 ebs 파닉스 교재 참조)
    • 레벨별 차이점 분석 결과(같은 내용의 소설을 각 레벨별로 스크립트 생성하여 특징 비교)
      1. 문장 연결성: 3학년은 단순한 사건 나열, 4학년부터 "Then," "But" 등을 활용한 논리적 연결성 강화. 5~6학년은 "Meanwhile," "As soon as" 등 다양한 접속어로 사건 흐름 매끄럽게 연결
      2. 어휘 수준: 3학년은 기본 단어, 4학년은 감정과 상황을 묘사하는 단어, 5~6학년은 감정과 태도를 깊이 있게 표현하는 어휘 사용
      3. 상황과 감정 묘사: 학년이 올라갈수록 복잡한 감정과 교훈을 구체적으로 전달
      4. 형용사와 부사의 활용: 3학년은 직관적인 형용사 사용, 4학년은 구체적인 표현 추가, 5~6학년은 주제의 깊이를 더하는 다채로운 표현 활용
  • TTS 모델 신뢰성 검토 및 선정
    • NaturalSpeech 논문(https://arxiv.org/pdf/2205.04421)을 참고하여 TTS 평가 기준인 MOS 점수가 5점에 가깝고 표준편차가 적은 5가지 모델(FastSpeech 2 + HiFiGAN, Glow-TTS + HiFiGAN, Grad-TTS + HiFiGAN, VITS, gTTS)을 선정
    • 동일한 텍스트 파일에 대해 음성 파일을 생성한 후, 팀원들이 비교 청취하여 만장일치로 gTTS 모델이 가장 자연어 발음에 유사하다는 의견을 모음
    • 최종 음성 파일 생성 모델로 gTTS를 결정
  • 서비스 차별화 전략
    • 다양한 억양(미국, 영국 등)을 학습할 수 있는 서비스 아이디어 논의

 

2. 다음 과제

  • OpenAI를 활용한 영어 학습 스크립트 생성 및 수준별 검토 진행
  • gTTS 모델을 통해 다양한 억양의 영어 학습 음성 파일 생성
  • 기획안 검토 및 수정하여 제출

 
 

 

📙 내일 일정

  • 중간 프로젝트 기획