
- Published on
Alibaba가 공개한 Zvec는 “가벼운 벡터 데이터베이스”라는 설명보다 더 흥미롭다. 인프로세스 벡터 DB, 하이브리드 검색, DiskANN, 로컬 배포 모델이 결합되면서 RAG와 에이전트 메모리 아키텍처의 기본 선택지가 바뀌고 있다.
What I learned, What I did, What I thought

Alibaba가 공개한 Zvec는 “가벼운 벡터 데이터베이스”라는 설명보다 더 흥미롭다. 인프로세스 벡터 DB, 하이브리드 검색, DiskANN, 로컬 배포 모델이 결합되면서 RAG와 에이전트 메모리 아키텍처의 기본 선택지가 바뀌고 있다.

GitHub Trending에 오른 trycua/cua는 컴퓨터 유즈 에이전트를 채팅 데모가 아니라 격리된 데스크톱 실행 환경, 드라이버, SDK, 벤치마크, VM 계층으로 다뤄야 한다는 흐름을 보여준다. 한국 개발자와 빌더가 지금 읽어야 할 포인트는 모델 성능보다 운영 가능한 실행면이다.

Kronos는 가격 캔들 데이터를 전용 토크나이저와 오토리그레시브 Transformer로 다루는 금융 시계열 파운데이션 모델이다. 중요한 포인트는 트레이딩 마법이 아니라, 퀀트 리서치 파이프라인이 범용 예측 스크립트에서 사전학습 모델과 검증 가능한 운영 루프로 이동하고 있다는 점이다.

AgentsView는 Claude Code와 Codex 같은 코딩 에이전트의 세션, 비용, 검색, 사용 패턴을 로컬에서 모아 보는 도구다. 중요한 점은 대시보드 자체가 아니라, 에이전트 도입이 개인 생산성 실험에서 팀 운영 문제로 넘어가고 있다는 신호다.

GitHub Trending에 오른 LMCache는 또 하나의 LLM 서빙 라이브러리가 아니다. 긴 컨텍스트, RAG, 멀티턴 에이전트가 늘어날수록 병목은 모델 호출보다 prefill 재사용과 KV 캐시 운영으로 이동한다.

NVIDIA SkillSpector는 AI 에이전트 스킬을 설치 전 검사하는 보안 스캐너다. 중요한 점은 도구 하나의 등장이 아니라, 에이전트 스킬·플러그인·MCP 번들이 코드 공급망과 같은 검증 대상으로 올라왔다는 신호다.