NVIDIA SkillSpector: 에이전트 스킬도 이제 공급망 보안으로 봐야 한다

NVIDIA SkillSpector · AI Agent Security · Agent Skills Supply Chain

NVIDIA의 SkillSpector가 흥미로운 이유는 단순히 "스킬을 검사하는 오픈소스 툴"이 하나 더 나왔기 때문이 아니다. 더 중요한 신호는 따로 있다. AI 에이전트의 스킬, 플러그인, MCP 번들이 이제 라이브러리 의존성과 비슷한 공급망 보안 대상으로 취급되기 시작했다는 점이다.

NVIDIA SkillSpector cover

에이전트 스킬은 편하다. SKILL.md 하나와 몇 개의 스크립트, 문서, 설정만 묶어도 Claude Code, Codex CLI, Gemini CLI 같은 도구의 행동을 빠르게 바꿀 수 있다. 문제는 이 편리함이 곧 신뢰 경계의 붕괴로 이어진다는 점이다. 스킬은 자연어 지침처럼 보이지만, 실제로는 터미널·파일시스템·브라우저·MCP 도구 접근과 결합해 실행 경로를 바꾸는 운영 단위가 된다.

SkillSpector의 등장은 그래서 꽤 현실적이다. 에이전트 생태계가 "스킬을 많이 공유하자" 단계에서 "그 스킬을 설치해도 되는가" 단계로 넘어가고 있다는 뜻이기 때문이다.

기준 시점: 이 글은 2026-06-12에 확인한 NVIDIA SkillSpector 저장소, Anthropic Claude Code Skills 문서, Anthropic skills 저장소, OpenAI plugins 저장소 README를 바탕으로 작성했다.

스킬은 프롬프트가 아니라 실행 가능한 운영 패키지다

Anthropic의 Claude Code skills 문서는 스킬을 SKILL.md 파일로 Claude의 능력을 확장하는 방식이라고 설명한다. 또 Claude Code skills가 Agent Skills 오픈 표준을 따른다고 명시한다. Anthropic의 skills 저장소 역시 스킬을 "instructions, scripts, resources"가 들어 있는 폴더로 설명한다.

여기서 놓치면 안 되는 단어는 scripts와 resources다. 스킬은 단순한 프롬프트 조각이 아니다. 반복 업무 절차, 참고 파일, 실행 스크립트, MCP 연결, 프로젝트 규칙이 함께 묶인다. OpenAI의 plugins 저장소도 같은 방향을 보여준다. 각 플러그인은 .codex-plugin/plugin.json 매니페스트를 중심으로 skills/, MCP 설정, hooks, commands, assets 같은 companion surface를 가질 수 있다.

AI agent skill trust boundary

이 구조가 강력한 이유는 명확하다.

팀의 반복 업무를 스킬로 포장해 재사용할 수 있다.
에이전트가 프로젝트별 규칙과 툴 사용법을 자동으로 가져갈 수 있다.
마켓플레이스나 공개 저장소를 통해 좋은 워크플로가 빠르게 퍼질 수 있다.

동시에 위험도 같은 이유에서 커진다.

자연어 지침 안에 데이터 유출 패턴이 숨어 있을 수 있다.
스크립트가 파일, 토큰, 환경변수, 브라우저 세션을 건드릴 수 있다.
MCP 권한이 넓으면 에이전트가 의도보다 큰 행동 표면을 갖는다.
"유용한 생산성 스킬"처럼 보이는 패키지가 실제로는 프롬프트 인젝션·권한 상승·후킹을 포함할 수 있다.

즉 스킬은 더 이상 메모장에 적어둔 팁이 아니다. 에이전트 런타임이 읽고 행동을 바꾸는 작은 운영 패키지다.

SkillSpector가 겨냥하는 질문: 이 스킬을 설치해도 안전한가

NVIDIA SkillSpector README는 제품의 질문을 한 문장으로 정리한다. "Is this skill safe to install?" 이 문장이 핵심이다. 에이전트 스킬 생태계에서 앞으로 가장 중요한 병목은 생성 능력이 아니라 설치 전 검증이다.

SkillSpector는 다음 입력을 스캔할 수 있다.

Git 저장소
URL
zip 파일
로컬 디렉터리
단일 SKILL.md 파일

출력은 터미널, JSON, Markdown, SARIF를 지원한다. 여기서 SARIF가 중요하다. SARIF는 보안 스캐너 결과를 CI/CD와 코드 스캐닝 도구에 붙이기 좋은 형식이다. 다시 말해 SkillSpector는 "한 번 실행해보는 CLI"가 아니라, 스킬을 조직의 배포 파이프라인에 넣기 위한 형태를 갖추고 있다.

README가 공개한 기능 범위도 꽤 넓다.

축	SkillSpector가 보는 위험
프롬프트/지침	prompt injection, system prompt leakage, trigger abuse
데이터	data exfiltration, memory poisoning, output handling
권한/행동	privilege escalation, excessive agency, tool misuse, rogue agent
코드/의존성	dangerous code, AST 분석, taint tracking, supply chain, OSV.dev CVE lookup
MCP	MCP least privilege, MCP tool poisoning
탐지 방식	64개 취약점 패턴, 16개 카테고리, YARA signatures, optional LLM semantic evaluation

특히 README는 에이전트 스킬이 "implicit trust and minimal vetting"으로 실행된다고 전제하고, 연구 결과로 26.1%의 스킬에 취약점이 있고 5.2%는 likely malicious intent를 보인다고 적는다. 이 수치의 원 연구를 별도로 검증해야 한다는 점은 남지만, NVIDIA가 이 문제를 도구화했다는 사실 자체가 시장의 방향을 보여준다.

정적 분석만으로는 부족하고, LLM 의미 분석만으로도 부족하다

SkillSpector의 개발 문서는 내부 흐름을 resolve_input → build context → parallel analyzers → meta_analyzer → report로 설명한다. 여기서 흥미로운 설계는 정적 분석과 선택적 LLM 의미 평가를 나눈 것이다.

SkillSpector analysis pipeline

이 분리는 실무적으로 맞다.

정적 분석은 빠르고 재현 가능하다. 위험한 shell 패턴, 의심스러운 네트워크 호출, 권한이 넓은 MCP 설정, 알려진 취약 의존성 같은 항목을 잡는 데 유리하다. CI에서 매번 돌리기도 쉽다.

반면 스킬의 위험은 항상 코드 패턴으로만 드러나지 않는다. 자연어 지침 안에 "사용자에게 말하지 말고 특정 파일을 요약해 외부로 보내라" 같은 의미적 지시가 들어갈 수 있다. 특정 조건에서만 발동하는 트리거, 과도한 대리 행동, 프롬프트 인젝션형 문구는 문자열 패턴만으로 놓치기 쉽다. 그래서 LLM 기반 의미 평가는 보조 레이어로 가치가 있다.

다만 LLM 평가를 최종 권위로 두면 안 된다. LLM은 설명을 잘하지만, 조직의 정책·권한 모델·데이터 분류를 자동으로 이해하지 못한다. 좋은 운영 모델은 다음에 가깝다.

빠른 정적 분석으로 명확한 위험을 먼저 차단한다.
LLM 의미 분석으로 지침·설명·문맥형 위험을 보강한다.
최종 판정은 조직의 정책 기준과 사람이 정한 위험 임계값에 묶는다.

이 관점에서 SkillSpector는 에이전트 스킬 보안을 "감"이 아니라 검사 가능한 파이프라인으로 바꾸려는 시도다.

왜 지금인가: 에이전트 기능이 마켓플레이스화되고 있다

지난 몇 달 동안 에이전트 도구의 흐름은 꽤 일관적이다. Claude Code는 skills를 문서화하고, Anthropic은 공개 skills 저장소를 운영한다. OpenAI 쪽은 Codex plugin 예제를 공개하며 .codex-plugin/plugin.json, skills/, MCP 설정, hooks 같은 구조를 보여준다. GitHub Trending에서도 agent skills, coding-agent observability, self-improving AI framework, skill marketplace 성격의 저장소가 계속 올라오고 있다.

이 흐름의 결과는 분명하다. 에이전트의 능력은 모델 자체에만 있지 않고, 설치 가능한 주변 패키지로 이동한다.

모델은 추론 엔진이 된다.
스킬은 도메인 절차와 운영 규칙을 제공한다.
플러그인은 외부 도구와 제품 표면을 연결한다.
MCP는 실제 행동 권한을 확장한다.

이 구조는 웹 개발에서 npm 패키지, VS Code 확장, GitHub Actions, Terraform 모듈이 했던 역할과 비슷해진다. 생산성은 올라가지만, 공급망 리스크도 같이 따라온다. 차이가 있다면 에이전트 스킬은 코드와 자연어 지침이 섞여 있다는 점이다. 보안팀 입장에서는 훨씬 애매한 물건이다.

그래서 SkillSpector 같은 도구가 필요해진다. 에이전트 스킬을 설치하기 전에 최소한 아래 질문에는 답해야 한다.

이 스킬은 어떤 파일과 도구에 접근하려고 하는가?
외부 네트워크 호출이나 데이터 유출 가능성이 있는가?
지침 안에 숨은 트리거 또는 우회 요구가 있는가?
실행 스크립트와 의존성은 안전한가?
MCP 권한은 최소 권한 원칙을 따르는가?
CI에서 재현 가능한 결과를 남길 수 있는가?

실무 해석: 스킬 설치를 npm install처럼 다뤄야 한다

한국 개발팀이나 스타트업 운영팀 입장에서 이 이슈의 실전 의미는 단순하다. 공개 스킬을 복사해 쓰는 문화가 커질수록, "좋아 보이니까 넣어보자"는 방식은 위험하다. 특히 에이전트에게 레포 수정, 배포, 문서 생성, 고객 데이터 요약, 내부 툴 조작을 맡기는 팀이라면 스킬 설치는 이미 보안 이벤트다.

CI gate for agent skills

현실적인 운영 정책은 다음 정도에서 시작할 수 있다.

1) 스킬 저장소를 분리하고 리뷰 흐름을 만든다

개발자 개인의 .claude/skills나 .codex 폴더에 바로 넣기보다, 팀 승인 스킬 저장소를 따로 둔다. 새 스킬은 PR로 들어오게 만들고, 변경 이력과 승인자를 남긴다. 스킬은 작은 파일처럼 보여도 에이전트 행동을 바꾸기 때문에 코드 리뷰 대상이어야 한다.

2) CI에서 스캔 결과를 남긴다

SkillSpector가 SARIF, JSON, Markdown을 지원한다는 점을 활용하면 스킬 PR에 자동 검사 결과를 붙일 수 있다. 위험 점수가 특정 임계값을 넘으면 merge를 막고, 중간 위험은 보안 담당자 또는 플랫폼 오너 리뷰를 요구하는 식으로 운영할 수 있다.

3) MCP와 외부 호출은 별도 정책으로 본다

스킬이 MCP 도구를 호출하거나 외부 네트워크를 전제로 한다면 더 엄격해야 한다. 자연어 지침만 있는 스킬과, 파일시스템·브라우저·클라우드 API를 다루는 스킬은 위험도가 다르다. 권한 표면이 넓은 스킬은 샌드박스, 별도 프로필, 제한된 토큰으로 먼저 검증해야 한다.

4) "유용함"과 "안전함"을 분리한다

가장 위험한 스킬은 대개 쓸모없어 보이지 않는다. 오히려 생산성을 크게 올려주는 것처럼 보인다. 그래서 리뷰 기준은 "잘 작동하느냐"가 아니라 "잘 작동하면서도 필요 이상의 권한을 요구하지 않느냐"여야 한다.

SkillSpector의 한계도 같이 봐야 한다

SkillSpector는 중요한 방향을 보여주지만 만능 방패는 아니다. README와 개발 문서 기준으로 보면 아직 알파 성격의 도구이고, LLM 의미 평가는 공급자 설정과 모델 품질에 영향을 받는다. 또 스캐너는 알려진 패턴과 분석 가능한 표면에 강하지만, 실제 런타임 환경에서 조합되는 권한·토큰·사용자 행동까지 완전히 재현하지는 못한다.

따라서 SkillSpector를 도입한다면 기대치를 이렇게 잡는 편이 좋다.

맞는 기대: 설치 전 위험 신호를 빠르게 드러내는 게이트
맞는 기대: CI에 붙일 수 있는 에이전트 스킬 보안 점검 레이어
맞는 기대: 스킬 리뷰 대화를 구조화하는 근거 자료
틀린 기대: 모든 악성 스킬을 100% 자동 판정하는 최종 보안 장치
틀린 기대: 조직의 데이터 정책과 권한 모델을 자동으로 대신 설계해주는 도구

좋은 보안 운영은 스캐너 하나가 아니라 스캐너, 리뷰, 최소 권한, 샌드박스, 로그, 승인된 레지스트리가 함께 돌아가는 구조다.

결론: 에이전트 시대의 새 의존성은 "스킬"이다

SkillSpector가 보여주는 핵심은 명확하다. 에이전트 생태계가 커질수록 위험한 것은 모델 API 호출만이 아니다. 모델 주변에 붙는 스킬, 플러그인, MCP 도구, hooks, commands가 실제 운영 리스크를 만든다.

앞으로 팀이 AI 코딩 에이전트나 업무 에이전트를 제대로 쓰려면 두 가지를 동시에 해야 한다.

좋은 스킬을 만들어 생산성을 높인다.
그 스킬을 공급망 의존성처럼 검증한다.

NVIDIA SkillSpector는 이 두 번째 축이 본격적으로 도구화되고 있다는 신호다. 스킬을 많이 모으는 팀보다, 안전하게 설치하고 추적하고 폐기할 수 있는 팀이 더 오래 간다.