
- Published on
OpenBMB의 VoxCPM2는 단순한 오픈소스 TTS 모델이 아니다. tokenizer-free 연속 잠재표현, 2B 파라미터, 200만 시간 이상 다국어 음성 데이터, 자연어 기반 voice design과 cloning을 하나의 백본으로 묶으면서 음성 합성을 제품 인프라 계층으로 밀어 올린다.

OpenBMB의 VoxCPM2는 단순한 오픈소스 TTS 모델이 아니다. tokenizer-free 연속 잠재표현, 2B 파라미터, 200만 시간 이상 다국어 음성 데이터, 자연어 기반 voice design과 cloning을 하나의 백본으로 묶으면서 음성 합성을 제품 인프라 계층으로 밀어 올린다.

Supertone의 Supertonic 3는 단순한 오픈소스 TTS 데모가 아니다. 99M 파라미터, 31개 언어, ONNX Runtime, WebGPU와 모바일 SDK를 한꺼번에 묶으면서 음성 합성의 경쟁축을 클라우드 API 품질에서 로컬 배포 가능성으로 옮기고 있다.