Ai-infrastructure

Published on
July 8, 2026
TencentCloud CubeSandbox: AI 에이전트 시대의 샌드박스는 왜 MicroVM 런타임이 되는가
CubeSandbox AI-Agents Sandbox MicroVM Developer-Tools AI-Infrastructure
GitHub Trending에 오른 TencentCloud/CubeSandbox는 단순한 컨테이너 실행기가 아니다. AI 에이전트가 코드를 실행하고, 브라우저를 띄우고, 외부 API를 호출하는 시대에는 샌드박스가 모델 주변의 보안·상태·네트워크·비용 제어 계층이 된다.
Read more →
Published on
June 17, 2026
Alibaba Zvec: RAG 벡터 DB가 서버에서 앱 안으로 들어올 때 생기는 변화
Alibaba Zvec Vector-Database RAG AI-Infrastructure Agent-Memory
Alibaba가 공개한 Zvec는 “가벼운 벡터 데이터베이스”라는 설명보다 더 흥미롭다. 인프로세스 벡터 DB, 하이브리드 검색, DiskANN, 로컬 배포 모델이 결합되면서 RAG와 에이전트 메모리 아키텍처의 기본 선택지가 바뀌고 있다.
Read more →
Published on
June 10, 2026
whichllm이 보여준 로컬 LLM 선택의 새 기준: 파라미터 수보다 하드웨어 적합성
Local-LLM whichllm GGUF Hugging-Face AI-Infrastructure Benchmark
GitHub Trending에 오른 whichllm은 로컬 LLM 선택 문제를 모델 순위표가 아니라 현재 하드웨어, VRAM, 양자화, 토큰 속도, 최신 벤치마크 증거를 합친 운영 문제로 다시 정의한다. 한국 개발팀이 로컬 모델을 도입할 때 봐야 할 기준을 정리했다.
Read more →
Published on
June 8, 2026
Microsoft pg_durable: AI 워크플로를 Postgres 안으로 당기는 durable execution의 의미
Microsoft PostgreSQL pg_durable AI-Workflow Durable-Execution AI-Infrastructure Database
Microsoft pg_durable은 Postgres 안에서 장기 실행 SQL 워크플로를 정의하고 체크포인트·재시작·재시도·병렬 실행을 다루려는 확장이다. AI embedding, 문서 ingest, 외부 API 호출, 운영 runbook처럼 상태가 데이터베이스에 붙어 있는 작업에서 왜 이 접근이 중요한지 정리한다.
Read more →
Published on
May 2, 2026
AWS AgentCore Gateway와 Memory: 에이전트 운영은 이제 VPC와 네임스페이스 설계 문제다
AWS Amazon-Bedrock AgentCore AI-Agents MCP AI-Infrastructure Enterprise-AI
AWS가 AgentCore Gateway, AgentCore Memory, MCP proxy, model agility 프레임워크를 연달아 공개한 흐름은 단순한 기능 추가가 아니다. 에이전트가 프로덕션 시스템이 되려면 모델보다 먼저 private resource 접근, 메모리 격리, 감사 가능한 tool call, 모델 교체 절차를 설계해야 한다는 신호다.
Read more →
Published on
April 26, 2026
소버린 AI가 필요한 이유: 모델보다 중요한 것은 통제 가능한 AI 생산 체계다
Sovereign-AI AI-Infrastructure AI-Governance AI-Factory Data-Sovereignty Korea-AI
소버린 AI는 국산 LLM 하나를 만드는 구호가 아니다. 데이터, 컴퓨트, 인재, 모델 운영, 감사 체계를 국내 산업과 규제 환경 안에서 통제할 수 있느냐의 문제다. 왜 지금 소버린 AI가 필요한지, 그리고 개발자와 기업은 어디부터 설계해야 하는지 정리한다.
Read more →
Published on
April 25, 2026
Decoupled DiLoCo: Google DeepMind가 "거대한 단일 클러스터" 대신 고장에 강한 학습 섬으로 가는 이유
Google-DeepMind Decoupled-DiLoCo Distributed-Training LLM-Training Gemma-4 AI-Infrastructure
Google DeepMind의 Decoupled DiLoCo는 LLM 학습을 더 빠르게 만드는 논문이기보다, 프론티어 학습이 더 이상 하나의 완벽히 동기화된 거대 클러스터에만 기대기 어렵다는 선언에 가깝다. 핵심은 대역폭 절감보다 고장 격리와 학습 지속성이다.
Read more →

Ai-infrastructure

Ai-infrastructure

TencentCloud CubeSandbox: AI 에이전트 시대의 샌드박스는 왜 MicroVM 런타임이 되는가

Alibaba Zvec: RAG 벡터 DB가 서버에서 앱 안으로 들어올 때 생기는 변화

whichllm이 보여준 로컬 LLM 선택의 새 기준: 파라미터 수보다 하드웨어 적합성

Microsoft pg_durable: AI 워크플로를 Postgres 안으로 당기는 durable execution의 의미

AWS AgentCore Gateway와 Memory: 에이전트 운영은 이제 VPC와 네임스페이스 설계 문제다

소버린 AI가 필요한 이유: 모델보다 중요한 것은 통제 가능한 AI 생산 체계다

Decoupled DiLoCo: Google DeepMind가 "거대한 단일 클러스터" 대신 고장에 강한 학습 섬으로 가는 이유