반응형 kaggle1 데이터를 따로 구해서 다시 시도 데이터를 따로 구해서 다시 시도한 기록직접 모은 데이터로 학습을 계속 돌려보면서 느낀 건 명확했다.생각보다 시간이 많이 들고, 결과는 쉽게 좋아지지 않았고, 데이터 수집 자체도 꽤 손이 많이 갔다. 한 번 잘라서 넣고 끝나는 게 아니라, 음성을 정리하고, 텍스트를 맞추고, metadata를 다시 만들고, 전처리를 돌리고, 학습을 돌린 뒤에 결과를 들어보는 과정이 계속 반복됐다. 그래서 어느 시점부터는 “이걸 계속 직접 모으는 게 맞나?”라는 생각이 들기 시작했다. 자연스럽게 다음 선택지는 공개 데이터셋이었다.처음에는 남자 목소리냐 여자 목소리냐가 중요한 게 아니라고 생각했다.지금 단계에서 가장 필요한 건 특정 화자의 완벽한 복제가 아니라, 학습이 되는 구조 자체를 확인하는 것에 더 가까웠기 때문이다. 그.. 2026. 3. 26. 이전 1 다음 반응형