
- Published on
Alibaba의 Page Agent는 또 하나의 브라우저 자동화 도구가 아니다. 핵심은 에이전트를 브라우저 밖에서 페이지를 조작하는 로봇으로 두는 대신, 웹앱 안에 들어온 자연어 운영자 계층으로 설계한다는 점이다.
What I learned, What I did, What I thought

Alibaba의 Page Agent는 또 하나의 브라우저 자동화 도구가 아니다. 핵심은 에이전트를 브라우저 밖에서 페이지를 조작하는 로봇으로 두는 대신, 웹앱 안에 들어온 자연어 운영자 계층으로 설계한다는 점이다.

Agent Skills는 또 하나의 프롬프트 포맷이 아니다. SKILL.md, scripts, references, assets를 묶어 에이전트가 필요한 순간에만 읽는 능력 패키지로 만들면서, AI 에이전트 운영의 경쟁축을 모델 호출에서 재사용 가능한 절차 지식과 거버넌스로 옮기고 있다.

Langflow는 단순한 노코드 플로우 빌더가 아니다. 2026년 현재의 Langflow는 시각적 프로토타이핑, API 배포, MCP 서버, 에이전트 도구화, 관측성과 보안 통제를 한데 묶는 에이전트 워크플로 컨트롤 플레인에 가깝다.

AllenAI의 olmOCR는 PDF를 텍스트로 바꾸는 또 하나의 OCR 도구처럼 보이지만, 실제 신호는 더 크다. 문서 AI의 병목이 추출 모델에서 자연스러운 읽기 순서, 구조 보존, 단위 테스트형 평가, GPU 배치 처리, 데이터 거버넌스로 이동하고 있다.

Google의 agents-cli는 단순한 CLI가 아니라 코딩 에이전트에게 스펙 작성, 스캐폴딩, 평가, 배포, 관측, Gemini Enterprise 등록까지 맡기기 위한 운영 계층이다. 핵심은 더 똑똑한 에이전트가 아니라 반복 가능한 에이전트 생산 라인을 만드는 데 있다.

GitHub Trending에 오른 Logto는 AI 앱이 다음 단계로 넘어갈 때 필요한 계층을 잘 보여준다. 챗봇 데모가 아니라 SaaS·에이전트 제품을 운영하려면 OAuth/OIDC, 조직 단위 권한, M2M, RBAC, MCP 인증까지 하나의 컨트롤 플레인으로 설계해야 한다.