반응형 RTX40802 Qwen3-TTS 최종 선택은 무엇이었나 Qwen3-TTS 최종 선택은 무엇이었나faster-qwen3-tts까지 비교한 뒤, 결국 1.7B를 남겼다여기까지 테스트를 진행하면서 흐름은 꽤 분명해졌다.처음에는 Qwen3-TTS 1.7B CustomVoice를 Windows 로컬에 설치하고, Web UI를 띄우고, 한국어 음성을 생성하는 것까지 확인했다. 그 과정만 놓고 보면 “실행은 된다”는 결론은 이미 나와 있었다. 문제는 그 다음이었다. 품질은 나쁘지 않았지만 속도가 걸렸다. Web UI 기준으로는 약 15초 정도가 걸렸고, Python 직접 호출 기준으로 다시 재도 1.7B가 약 10초, 0.6B는 오히려 약 13초 수준이었다. 즉 병목은 Web UI가 아니라 원본 qwen3 경로 자체였다. 그래서 마지막 질문은 결국 하나로 좁혀졌다. 이 .. 2026. 4. 2. Qwen3-TTS는 실시간으로 붙일 수 있을까 Qwen3-TTS는 실시간으로 붙일 수 있을까1.7B와 0.6B를 직접 돌려보고 속도를 다시 봤다3편까지 오면 Qwen3-TTS가 최소한 Windows 로컬에서 실행되고, 한국어 음성도 실제로 생성된다는 건 확인된다.문제는 그다음이다. 설치가 되고, UI가 뜨고, 소리가 나온다고 해서 바로 실사용 가능한 건 아니다. 특히 내가 이걸 본 이유가 단순 데모 감상이 아니라 연동 가능성, 그중에서도 Unity 같은 쪽과의 연결 가능성을 보려는 데 있었다면, 결국 제일 먼저 걸리는 건 속도다. 실제로 문서 흐름도 여기서 완전히 바뀐다. 3편까지는 “된다”를 확인하는 과정이었다면, 4편부터는 “이 속도로는 괜찮은가”를 따져보기 시작한다. 처음 Web UI에서 한국어를 생성했을 때 체감 시간은 약 15초였다.그 정도.. 2026. 4. 2. 이전 1 다음 반응형