
- Published on
Alibaba의 Page Agent는 또 하나의 브라우저 자동화 도구가 아니다. 핵심은 에이전트를 브라우저 밖에서 페이지를 조작하는 로봇으로 두는 대신, 웹앱 안에 들어온 자연어 운영자 계층으로 설계한다는 점이다.

Alibaba의 Page Agent는 또 하나의 브라우저 자동화 도구가 아니다. 핵심은 에이전트를 브라우저 밖에서 페이지를 조작하는 로봇으로 두는 대신, 웹앱 안에 들어온 자연어 운영자 계층으로 설계한다는 점이다.

Langflow는 단순한 노코드 플로우 빌더가 아니다. 2026년 현재의 Langflow는 시각적 프로토타이핑, API 배포, MCP 서버, 에이전트 도구화, 관측성과 보안 통제를 한데 묶는 에이전트 워크플로 컨트롤 플레인에 가깝다.

Google의 agents-cli는 단순한 CLI가 아니라 코딩 에이전트에게 스펙 작성, 스캐폴딩, 평가, 배포, 관측, Gemini Enterprise 등록까지 맡기기 위한 운영 계층이다. 핵심은 더 똑똑한 에이전트가 아니라 반복 가능한 에이전트 생산 라인을 만드는 데 있다.

GitHub Trending에 오른 browser-use/video-use는 “AI가 영상을 본다”가 아니라 “AI가 영상을 읽고, 잘라내고, 렌더링하고, 스스로 검수한다”는 쪽에 가깝다. 한국 개발자와 운영자가 봐야 할 포인트는 자동 편집 데모보다, 영상 제작을 재현 가능한 에이전트 워크플로로 바꾸는 구조다.

OpenCode는 또 하나의 코딩 챗봇이 아니라 터미널, 데스크톱, IDE, ACP, 권한 정책, 커스텀 도구를 하나로 묶는 오픈소스 코딩 에이전트 운영 표면이다. 한국 개발팀이 봐야 할 포인트는 모델 성능보다 배포·권한·도구 연결 방식이다.

Google Labs의 DESIGN.md는 에이전트에게 디자인을 맡길 때 생기는 “예쁘지만 매번 다른 UI” 문제를 정면으로 다룬다. 핵심은 토큰만 넘기는 것이 아니라, 디자인 의도와 제약을 Markdown 계약으로 만들어 에이전트가 반복해서 읽게 하는 것이다.

mukul975/Anthropic-Cybersecurity-Skills가 다시 주목받는 이유는 단순히 보안 스킬이 많아서가 아니다. 700개가 넘는 보안 플레이북을 MITRE ATT&CK, NIST CSF, ATLAS, D3FEND, AI RMF, F3 같은 운영 프레임워크에 연결하면서, 보안 AI 에이전트의 경쟁 축이 프롬프트 재치에서 검증 가능한 절차와 거버넌스로 이동하고 있음을 보여준다.

GitHub Trending에 오른 DeusData/codebase-memory-mcp는 코딩 에이전트가 파일을 반복해서 읽고 grep하는 방식을 구조화된 코드 지식 그래프로 바꾸려는 시도다. 핵심은 더 큰 컨텍스트 창이 아니라, 함수·클래스·호출 관계를 로컬 그래프로 인덱싱하고 MCP 도구로 질의하게 만드는 운영 계층이다.

GitHub Trending에 오른 trycua/cua는 컴퓨터 유즈 에이전트를 채팅 데모가 아니라 격리된 데스크톱 실행 환경, 드라이버, SDK, 벤치마크, VM 계층으로 다뤄야 한다는 흐름을 보여준다. 한국 개발자와 빌더가 지금 읽어야 할 포인트는 모델 성능보다 운영 가능한 실행면이다.

AgentsView는 Claude Code와 Codex 같은 코딩 에이전트의 세션, 비용, 검색, 사용 패턴을 로컬에서 모아 보는 도구다. 중요한 점은 대시보드 자체가 아니라, 에이전트 도입이 개인 생산성 실험에서 팀 운영 문제로 넘어가고 있다는 신호다.

NVIDIA SkillSpector는 AI 에이전트 스킬을 설치 전 검사하는 보안 스캐너다. 중요한 점은 도구 하나의 등장이 아니라, 에이전트 스킬·플러그인·MCP 번들이 코드 공급망과 같은 검증 대상으로 올라왔다는 신호다.

OpenAI의 openai/plugins 저장소는 단순 예제 모음이 아니다. .codex-plugin/plugin.json, skills, MCP, app manifest, marketplace 정책을 한 번에 묶으면서 에이전트 기능을 설치·인증·버전 관리 가능한 공급망으로 바꾸려는 신호다.

GitHub Copilot SDK는 Copilot을 IDE 기능이 아니라 앱과 서비스에 삽입 가능한 에이전트 런타임으로 바꾼다. TypeScript, Python, Go, .NET, Java, Rust SDK가 의미하는 것은 더 많은 언어 지원이 아니라 제품 안에서 planning, tool invocation, file edit, session control을 운영 계층으로 다뤄야 한다는 신호다.

GitHub Trending에 오른 Headroom은 단순 토큰 절약 도구가 아니라, 툴 출력·로그·RAG·파일 읽기를 LLM 앞에서 정리하는 에이전트 운영 계층에 가깝다. 60~95% 토큰 감소, 콘텐츠별 압축 라우팅, CCR 기반 원문 회수, MCP 도구화가 왜 중요한지 실무 관점에서 정리했다.

Stop Slop과 Taste Skill이 GitHub Trending에 함께 오른 신호는 작지 않다. AI 산출물의 다음 병목은 모델 성능이 아니라 반복되는 문체, 뻔한 UI, 팀 표준 부재를 잡아내는 품질 관리 계층이다.

Anthropic의 knowledge-work-plugins 공개는 단순한 플러그인 모음이 아니다. 업무용 AI 에이전트가 개인 프롬프트를 넘어 역할별 스킬, 커넥터, 서브에이전트, 회사 절차를 묶은 팀 운영 패키지로 이동하고 있다는 신호다.

Anthropic의 공식 Claude Code Plugins 마켓플레이스는 단순한 플러그인 모음이 아니다. skills, subagents, hooks, MCP, LSP를 배포 단위로 묶으면서 코딩 에이전트를 개인 CLI에서 팀 단위 운영 플랫폼으로 끌어올리는 변화다.

Microsoft .NET 팀의 dotnet/skills 저장소는 코딩 에이전트의 다음 경쟁축이 모델 크기가 아니라 팀별 개발 절차, 빌드 지식, 진단 루틴, 평가 가능한 스킬 패키지로 이동하고 있음을 보여준다.

Google I/O 2026의 Gemini 3.5 발표는 단순한 모델 업데이트가 아니다. Google은 Gemini를 Search, Chrome, 개발자 도구, 클라우드 인프라에 묶어 실행 가능한 에이전트 런타임으로 재배치하고 있다.

Anthropic의 Claude Code 공식 플러그인 마켓플레이스는 단순한 확장 기능 모음이 아니다. 코딩 에이전트의 개인 설정, 스킬, MCP 서버, LSP 연동, 보안 정책이 이제 공유·버전관리·검증 가능한 공급망으로 이동하고 있다는 신호다.

Anthropic의 Agent Skills 공개 저장소와 표준화 흐름은 에이전트 경쟁이 모델 호출을 넘어 반복 가능한 절차 지식, 조직 컨텍스트, 배포 가능한 워크플로 패키지 경쟁으로 이동하고 있음을 보여준다.

GitHub Trending에 오른 agentmemory는 또 하나의 메모리 라이브러리라기보다, 코딩 에이전트가 매 세션마다 같은 설명을 다시 듣는 문제를 운영 계층에서 풀려는 신호다. 핵심은 장기 기억, 검색 품질, 자동 캡처, 그리고 여러 에이전트가 공유하는 기억 서버다.

ByteDance의 UI-TARS Desktop과 Agent TARS는 단순한 데스크톱 자동화 앱이 아니다. 화면을 보고, 브라우저와 컴퓨터를 조작하며, MCP 도구까지 연결하는 멀티모달 에이전트 스택이 왜 다시 개발자 관심의 중심으로 올라왔는지 정리한다.

Vercel Labs의 Open Agents는 또 하나의 코딩 에이전트 데모가 아니다. 웹 UI, durable workflow, 격리 sandbox VM을 분리해 클라우드에서 오래 실행되는 코딩 에이전트를 제품 런타임으로 만드는 참조 구현에 가깝다.

OpenAI Codex CLI와 Codex App은 같은 코딩 에이전트를 다른 방식으로 노출한다. 터미널의 로컬 제어와 데스크톱 앱의 병렬 작업·워크트리·자동화·클라우드 위임을 비교한다.

Anthropic의 금융 서비스 에이전트 발표와 anthropics/financial-services 저장소는 금융권 AI의 초점이 범용 챗봇에서 검토 가능한 워크플로, 데이터 커넥터, 관리형 에이전트 런타임으로 이동하고 있음을 보여준다.

ByteDance의 DeerFlow 2.0은 또 하나의 Deep Research 클론으로 보기 어렵다. sub-agent, memory, sandbox, skills, MCP, 메시징 채널을 한데 묶으면서 연구 보고서 생성기를 장시간 실행 가능한 에이전트 워크벤치로 확장하려는 시도에 가깝다.

GitHub Trending에 오른 CocoIndex는 단순한 RAG 프레임워크보다 더 중요한 신호를 준다. 장기 실행 에이전트의 병목은 모델 호출이 아니라 코드·문서·Slack·트레이스가 계속 바뀌는 상황에서 컨텍스트를 신선하게 유지하는 증분 동기화 계층이다.

Browserbase Skills가 GitHub Trending에 오른 것은 단순한 플러그인 인기보다 더 큰 신호다. 브라우저 에이전트가 이제 프롬프트 요령이 아니라 세션, 관측성, 인증, CLI, 스킬 라이브러리, 비용 관리가 붙은 운영 런타임으로 재정의되고 있다.

Writer가 Writer Agent에 이벤트 기반 트리거를 붙이면서 엔터프라이즈 AI 에이전트의 출발점이 채팅창 프롬프트에서 업무 시스템의 신호로 이동하고 있다. 중요한 변화는 자동화 범위가 커졌다는 점보다, 실행 권한·감사 로그·커넥터 거버넌스·평가 재현성이 제품의 중심 기능이 됐다는 점이다.

Hugging Face가 AI 평가 비용을 새로운 compute bottleneck으로 지목했고, AWS는 MCP proxy를 AgentCore Runtime 위에 올렸으며, OpenAI는 Intelligence Age의 사이버 보안 실행 계획을 내놨다. 세 신호를 합치면 에이전트 경쟁의 핵심은 더 똑똑한 모델이 아니라 평가·보안·도구 경계를 운영 가능한 형태로 묶는 능력으로 이동하고 있다.
Hermes Agent와 OpenClaw의 차이점을 비교합니다. 메모리, 멀티채널, 자동화, 설치 방식, 운영 철학까지 실제 문서 기준으로 정리했습니다.