
- Published on
Supertone의 Supertonic 3는 단순한 오픈소스 TTS 데모가 아니다. 99M 파라미터, 31개 언어, ONNX Runtime, WebGPU와 모바일 SDK를 한꺼번에 묶으면서 음성 합성의 경쟁축을 클라우드 API 품질에서 로컬 배포 가능성으로 옮기고 있다.
What I learned, What I did, What I thought

Supertone의 Supertonic 3는 단순한 오픈소스 TTS 데모가 아니다. 99M 파라미터, 31개 언어, ONNX Runtime, WebGPU와 모바일 SDK를 한꺼번에 묶으면서 음성 합성의 경쟁축을 클라우드 API 품질에서 로컬 배포 가능성으로 옮기고 있다.

Anthropic의 Agent Skills 공개 저장소와 표준화 흐름은 에이전트 경쟁이 모델 호출을 넘어 반복 가능한 절차 지식, 조직 컨텍스트, 배포 가능한 워크플로 패키지 경쟁으로 이동하고 있음을 보여준다.

NVIDIA의 Video Search and Summarization(VSS) Blueprint는 단순한 영상 요약 데모가 아니다. 실시간 영상 인텔리전스, 다운스트림 분석, 에이전트형 검색·요약 계층을 묶어 CCTV와 산업 영상을 질의 가능한 운영 데이터베이스로 바꾸려는 레퍼런스 아키텍처다.

GitHub Spec Kit은 또 하나의 코딩 에이전트가 아니다. 스펙, 계획, 작업 목록, 헌법을 Markdown 산출물로 고정해 AI 코딩을 즉흥 프롬프트가 아니라 검증 가능한 개발 프로세스로 되돌리려는 도구다.

OpenAI의 Deployment Company 출범은 새 모델 발표보다 더 실무적인 신호다. 이제 기업 AI 경쟁의 핵심은 모델 접근권이 아니라 신뢰, 거버넌스, 워크플로 재설계, 평가, 현장 배포 역량으로 이동하고 있다.

GitHub Trending에 오른 agentmemory는 또 하나의 메모리 라이브러리라기보다, 코딩 에이전트가 매 세션마다 같은 설명을 다시 듣는 문제를 운영 계층에서 풀려는 신호다. 핵심은 장기 기억, 검색 품질, 자동 캡처, 그리고 여러 에이전트가 공유하는 기억 서버다.