본문 바로가기
반응형

epochs2

데이터를 따로 구해서 다시 시도 데이터를 따로 구해서 다시 시도한 기록직접 모은 데이터로 학습을 계속 돌려보면서 느낀 건 명확했다.생각보다 시간이 많이 들고, 결과는 쉽게 좋아지지 않았고, 데이터 수집 자체도 꽤 손이 많이 갔다. 한 번 잘라서 넣고 끝나는 게 아니라, 음성을 정리하고, 텍스트를 맞추고, metadata를 다시 만들고, 전처리를 돌리고, 학습을 돌린 뒤에 결과를 들어보는 과정이 계속 반복됐다. 그래서 어느 시점부터는 “이걸 계속 직접 모으는 게 맞나?”라는 생각이 들기 시작했다. 자연스럽게 다음 선택지는 공개 데이터셋이었다.처음에는 남자 목소리냐 여자 목소리냐가 중요한 게 아니라고 생각했다.지금 단계에서 가장 필요한 건 특정 화자의 완벽한 복제가 아니라, 학습이 되는 구조 자체를 확인하는 것에 더 가까웠기 때문이다. 그.. 2026. 3. 26.
MeloTTS 학습을 돌리면서 겪은 문제들 MeloTTS 학습을 돌리면서 겪은 문제들설치만 끝나면 금방 될 줄 알았다.재학습 전에 필요한 것들도 나름대로 정리해뒀고, metadata나 캐시, 전처리 같은 것도 한 번씩 점검했다. 그래서 이제부터는 진짜 학습만 잘 돌리면 되는 줄 알았다. 그런데 실제로 들어가 보니, 여기서부터가 더 오래 걸렸다. 설치는 한 번 뚫으면 끝이지만, 학습은 한 번 돌린다고 끝나지 않았다. 오히려 같은 걸 계속 반복해서 돌려보고, 결과를 듣고, 설정을 바꾸고, 다시 돌리는 과정이 계속 이어졌다. 처음에는 “학습만 시키면 점점 좋아지겠지” 정도로 생각했다.그런데 딥러닝 쪽은 늘 그렇듯, 결국 하이퍼파라미터 문제가 바로 앞에 있었다. epoch를 얼마나 줘야 하는지, batch size를 얼마나 올릴 수 있는지, learni.. 2026. 3. 26.
반응형