반응형 windows8 Qwen3-TTS 최종 선택은 무엇이었나 Qwen3-TTS 최종 선택은 무엇이었나faster-qwen3-tts까지 비교한 뒤, 결국 1.7B를 남겼다여기까지 테스트를 진행하면서 흐름은 꽤 분명해졌다.처음에는 Qwen3-TTS 1.7B CustomVoice를 Windows 로컬에 설치하고, Web UI를 띄우고, 한국어 음성을 생성하는 것까지 확인했다. 그 과정만 놓고 보면 “실행은 된다”는 결론은 이미 나와 있었다. 문제는 그 다음이었다. 품질은 나쁘지 않았지만 속도가 걸렸다. Web UI 기준으로는 약 15초 정도가 걸렸고, Python 직접 호출 기준으로 다시 재도 1.7B가 약 10초, 0.6B는 오히려 약 13초 수준이었다. 즉 병목은 Web UI가 아니라 원본 qwen3 경로 자체였다. 그래서 마지막 질문은 결국 하나로 좁혀졌다. 이 .. 2026. 4. 2. Qwen3-TTS는 실시간으로 붙일 수 있을까 Qwen3-TTS는 실시간으로 붙일 수 있을까1.7B와 0.6B를 직접 돌려보고 속도를 다시 봤다3편까지 오면 Qwen3-TTS가 최소한 Windows 로컬에서 실행되고, 한국어 음성도 실제로 생성된다는 건 확인된다.문제는 그다음이다. 설치가 되고, UI가 뜨고, 소리가 나온다고 해서 바로 실사용 가능한 건 아니다. 특히 내가 이걸 본 이유가 단순 데모 감상이 아니라 연동 가능성, 그중에서도 Unity 같은 쪽과의 연결 가능성을 보려는 데 있었다면, 결국 제일 먼저 걸리는 건 속도다. 실제로 문서 흐름도 여기서 완전히 바뀐다. 3편까지는 “된다”를 확인하는 과정이었다면, 4편부터는 “이 속도로는 괜찮은가”를 따져보기 시작한다. 처음 Web UI에서 한국어를 생성했을 때 체감 시간은 약 15초였다.그 정도.. 2026. 4. 2. Qwen3-TTS 한국어 음성은 실제로 어땠나 Qwen3-TTS 한국어 음성은 실제로 어땠나Web UI에서 직접 돌려본 첫 테스트 기록2편에서 flash_attention_2 문제를 우회하고 나서야 Qwen3-TTS Web UI를 정상적으로 띄울 수 있었다.거기까지 갔으면 다음은 당연히 하나다. 그래서 실제로 소리가 어떻게 나오느냐. 설치가 되는 것과 실행이 되는 것은 다르고, 실행이 되는 것과 “쓸 만하다”는 또 다르다. 그래서 이번에는 브라우저에 뜬 Web UI에서 직접 한국어 문장을 넣고, 화자를 바꿔 보고, 실제 생성 결과를 확인해봤다. 문서 흐름상 이 단계부터 비로소 “설치 성공”이 아니라 로컬 테스트 성공이라고 말할 수 있는 구간으로 들어간다. 이번 글은 그 첫 테스트 기록이다.Web UI가 어떻게 보였는지, 어떤 문장으로 시험했는지, 한.. 2026. 4. 2. Qwen3-TTS Web UI가 바로 안 뜬 이유 Qwen3-TTS Web UI가 바로 안 뜬 이유 Windows에서 flash_attention_2 문제를 직접 잡아본 기록1편에서 설치 자체는 생각보다 깔끔하게 끝났다.conda 환경을 만들고, PyTorch CUDA를 잡고, qwen-tts도 설치했고, Hugging Face 로그인 준비까지 끝냈다. 여기까지만 보면 이제 qwen-tts-demo만 실행하면 바로 브라우저가 뜰 것 같았다. 실제로 나도 그렇게 생각했다. 그런데 문제는 그 다음부터였다. 설치는 끝났는데 실행이 안 됐다. 정확히 말하면, Web UI를 띄우는 단계에서 로그는 나오는데 정상적으로 이어지지 않았고, 처음 봤을 때는 원인이 딱 보이지 않았다. 이번 글은 그 과정을 정리한 기록이다.어떤 명령으로 실행했고, 어떤 경고가 떴고, 왜 .. 2026. 4. 2. Windows에서 Qwen3-TTS 로컬 설치 시작 Windows에서 Qwen3-TTS 로컬 설치 시작RTX 4080 환경에서 Qwen3-TTS를 직접 올려봤다이번에 Qwen3-TTS를 로컬에서 직접 올려본 이유는 단순했다.이제는 모델 소개만 보는 단계가 아니라, 실제로 내 환경에서 돌아가는지, 설치부터 실행까지 어느 정도 손이 가는지, 나중에 Unity 같은 쪽에 붙일 수 있을 정도로 관리 가능한지를 봐야 했다. 그래서 제일 먼저 한 일은 성능 비교가 아니라, 아주 기본적인 것부터 밟는 거였다. Windows에서 설치가 되느냐, CUDA가 제대로 잡히느냐, 모델 다운로드까지 무리 없이 이어지느냐. 이걸 먼저 확인하고 싶었다.이번 테스트 환경은 아래와 같다.OS: Windows셸: Anaconda PromptGPU: NVIDIA GeForce RTX 40.. 2026. 4. 2. whisper.cpp Wrapper DLL을 만들고 Unity에서 로컬 STT로 동작 가능하도록 whisper.cpp Wrapper DLL을 만들고 Unity에서 로컬 STT로 동작 가능하도록앞선 단계에서 whisper.cpp를 Windows 환경에서 빌드했고, CPU 기준 동작도 확인했고, CUDA를 붙였을 때 GPU 성능이 크게 올라가는 것도 확인했다. 그런데 여기까지는 어디까지나 whisper-cli를 직접 실행하는 단계였다. 실제 프로젝트, 특히 Unity 같은 엔진 환경에서 쓰려면 커맨드라인 실행만으로는 부족했다. 결국 필요한 건 외부에서 단순한 함수 호출만으로 STT를 실행할 수 있는 구조였고, 그래서 이번에는 whisper.cpp를 감싼 Wrapper DLL을 만들어 Unity에서 붙이는 방향으로 진행했다. 이번 글은 “Whisper가 돌아간다”보다 한 단계 더 나간 기록이다. 모델 로.. 2026. 3. 26. whisper.cpp에 CUDA를 적용하고 CPU/GPU 성능을 비교 whisper.cpp에 CUDA를 적용하고 CPU/GPU 성능을 비교앞선 글에서는 whisper.cpp를 Windows 환경에서 빌드하고, CPU 기준으로 샘플 음성 파일이 정상적으로 전사되는지 먼저 확인했다. 거기까지는 “일단 돌아간다”를 보는 단계였다면, 이번에는 그 다음 단계로 넘어가서 CUDA를 붙였을 때 실제로 얼마나 빨라지는지를 확인해봤다. 결론부터 말하면 체감 차이는 꽤 컸고, 특히 인코더 구간에서 큰 변화가 있었다. 기록 기준으로 CPU에서 8초 넘게 걸리던 작업이 GPU에서는 0.4초 수준으로 줄었다.이번 글의 목적은 CUDA 설치 방법 자체를 길게 설명하는 것이 아니라, whisper.cpp가 GPU 경로로 정상 실행되도록 설정하고, CPU와 비교했을 때 어디가 얼마나 개선되는지를 확인.. 2026. 3. 26. Windows 가상 메모리 설정 방법 [Windows] 가상 메모리 설정 방법 시스템 설정에서 가상 메모리 크기를 늘려준다. 설정 -> 시스템 -> 정보 -> 고급 시스템 설정 ->(시스템속성)고급 -> (성능)설정 ->(성능 옵션) 고급 -> (가상 메모리) 변경 ->(가상 메모리) 드라이브 선택 -> 사용자 지정 크기 -> 처음 크기와 최대 크기 설정 -> 확인 처음 크기 추천 : 설치된 RAM 크기(32GB) * 1024(1GB = 1024MB)최대 크기 추천 : 설치된 RAM 크기(32GB) * 1024(1GB = 1024MB) * (1.5 ~ 3) 설치된 RAM 1GB = 1024MB2GB = 2048MB4GB = 4096MB8GB = 8192MB16GB = 16384MB32GB = 32768MB64GB = 65536MB 일반적으로.. 2024. 2. 7. 이전 1 다음 반응형