Blog Tags Projects About

Benchmark

Benchmark

Published on
June 10, 2026
whichllm이 보여준 로컬 LLM 선택의 새 기준: 파라미터 수보다 하드웨어 적합성
Local-LLM whichllm GGUF Hugging-Face AI-Infrastructure Benchmark
GitHub Trending에 오른 whichllm은 로컬 LLM 선택 문제를 모델 순위표가 아니라 현재 하드웨어, VRAM, 양자화, 토큰 속도, 최신 벤치마크 증거를 합친 운영 문제로 다시 정의한다. 한국 개발팀이 로컬 모델을 도입할 때 봐야 할 기준을 정리했다.
Read more →
Published on
May 28, 2026
ITBench-AA: AI 에이전트가 엔터프라이즈 SRE를 아직 자동화하지 못하는 이유
ITBench-AA AI-Agents SRE Kubernetes Benchmark IBM Artificial-Analysis
Artificial Analysis와 IBM이 공개한 ITBench-AA는 frontier 모델도 Kubernetes 장애 원인 진단에서 50%를 넘기지 못한다는 불편한 현실을 보여준다. 에이전트 자동화의 다음 병목은 더 긴 추론이 아니라, 관측·원인 식별·비용을 함께 통제하는 운영 설계다.
Read more →