
- Published on
GitHub Trending에 오른 whichllm은 로컬 LLM 선택 문제를 모델 순위표가 아니라 현재 하드웨어, VRAM, 양자화, 토큰 속도, 최신 벤치마크 증거를 합친 운영 문제로 다시 정의한다. 한국 개발팀이 로컬 모델을 도입할 때 봐야 할 기준을 정리했다.

GitHub Trending에 오른 whichllm은 로컬 LLM 선택 문제를 모델 순위표가 아니라 현재 하드웨어, VRAM, 양자화, 토큰 속도, 최신 벤치마크 증거를 합친 운영 문제로 다시 정의한다. 한국 개발팀이 로컬 모델을 도입할 때 봐야 할 기준을 정리했다.

H Company의 Holo3.1은 단순히 OSWorld 점수를 갱신하는 모델 발표가 아니다. 웹·데스크톱·모바일 GUI를 넘나드는 computer-use agent를 로컬·엣지·클라우드 어디서든 실행하려는 방향 전환이며, 실무자에게는 성능표보다 배포 위치와 프라이버시, 지연시간 설계가 더 중요해졌다는 신호다.

Hugging Face가 AI 평가 비용을 새로운 compute bottleneck으로 지목했고, AWS는 MCP proxy를 AgentCore Runtime 위에 올렸으며, OpenAI는 Intelligence Age의 사이버 보안 실행 계획을 내놨다. 세 신호를 합치면 에이전트 경쟁의 핵심은 더 똑똑한 모델이 아니라 평가·보안·도구 경계를 운영 가능한 형태로 묶는 능력으로 이동하고 있다.