본문 바로가기
반응형

melo2

MeloTTS 재학습 전에 먼저 정리한 것들 MeloTTS 재학습 전에 먼저 정리한 것들MeloTTS를 Windows에서 일단 로컬로 돌리는 데까지는 성공했다.한국어 음성도 나왔고, 설치는 귀찮았지만 최소한 “이 프로젝트로 더 가볼 수는 있겠다”는 판단은 섰다. 문제는 그다음이었다. 그냥 제공되는 모델을 실행해보는 것과, 내 데이터를 넣어서 다시 학습시키는 건 완전히 다른 문제였다. 여기서부터는 설치 삽질과는 다른 종류의 귀찮음이 시작됐다. 처음에는 단순하게 생각했다.데이터를 넣고 학습 스크립트를 돌리면 되겠지 싶었다. 그런데 실제로 해보니 그렇게 간단하지 않았다. 데이터를 조금만 수정해도 이전 캐시가 남아서 에러가 나고, wav 파일 하나를 지웠는데 metadata 쪽에 흔적이 남아 있으면 바로 꼬였다. 학습 로그를 보면 손실값보다 먼저 봐야 할.. 2026. 3. 26.
로컬 MeloTTS, Windows 환경에서 진행 로컬 MeloTTS, Windows 환경에서 진행 sherpa-onnx로 한국어 TTS를 먼저 테스트해봤지만, 결과는 만족스럽지 않았다. 실행 자체는 됐는데 한국어가 아닌 외계어 수준으로 나타났다, 이걸 바로 프로젝트에 넣는 건 무리라고 판단했다. 그래서 조금 더 음성 품질이 괜찮아 보이는 쪽으로 다시 찾아보다가 MeloTTS를 보게 됐다. 문제는 처음부터 보였다.MeloTTS는 한국어 기대치는 더 높아 보였지만, Windows 설치가 만만하지 않았다. 공식 문서도 로컬 설치는 Linux/macOS 기준으로 설명하고 있었고, Windows 쪽은 Docker 설치를 권장하는 흐름이었다. 즉, 이 프로젝트는 Windows에서 바로 로컬로 쓰라고 만든 느낌은 아니었다. 그럼에도 불구하고 이번에는 일단 밀어붙여.. 2026. 3. 26.
반응형