Claude Opus 4.7 시스템 프롬프트 변경 분석: AI 에이전트 개발자가 알아야 할 것들 (simonwillison.net)
목차(4)
한줄 요약
Claude Opus 4.7 시스템 프롬프트 개정, 에이전트 자율성·안전 정책·UX 방향 세 축이 동시에 바뀌었다.
Claude Opus 4.7(2026년 4월 16일 출시)의 시스템 프롬프트 변경은 단순한 문구 수정이 아니다. Anthropic이 AI 에이전트를 어떤 방향으로 설계하려는지, 그 철학적 전환이 텍스트로 드러난 결과물이다. Simon Willison이 Opus 4.6(2026년 2월 5일)과 4.7의 시스템 프롬프트를 Git diff 방식으로 비교 분석해 공개했고, 이 내용은 AI 에이전트 개발 실무에 직접적인 시사점을 던진다.
참고로 Anthropic은 주요 AI 랩 중 유일하게 사용자 대면 시스템의 시스템 프롬프트를 공개 아카이브로 유지하고 있다. 2024년 7월 Claude 3부터 현재까지의 변경 이력이 모두 추적 가능하다는 점 자체가 산업 내에서 이례적인 투명성이다.
무엇이 달라지나?
에이전트가 먼저 행동한다
4.7에서 가장 눈에 띄는 변화는 <acting_vs_clarifying> 섹션의 신설이다. 핵심 원칙은 "사소한 세부 사항이 불분명할 때 사람은 보통 먼저 인터뷰를 당하기보다 지금 바로 합리적인 시도를 원한다"는 것이다. 즉, 모호함이 있어도 사람에게 되묻기보다 도구를 호출해 직접 해소하라는 지침이다.
이 변화는 tool_search 도구의 등장과 맞물린다. Claude가 특정 기능이 없다고 판단하기 전에 반드시 tool_search를 호출해 사용 가능한 도구가 있는지 확인해야 한다는 규칙이 명시됐다. "I don't have access to X"라는 응답은 tool_search가 해당 도구 없음을 확인한 후에만 허용된다. 에이전트가 스스로 능력의 한계를 선언하기 전에 먼저 탐색하도록 강제하는 구조다.
도구 생태계 확장: Claude in PowerPoint 등장
시스템 프롬프트에 언급되는 도구 목록에 Claude in PowerPoint가 새롭게 추가됐다. 기존의 Chrome 브라우징 에이전트, Excel 스프레드시트 에이전트에 이어 슬라이드 에이전트가 합류한 것이다. Claude Cowork가 이 모든 도구를 조합해 사용할 수 있다는 점도 명시됐다. 멀티 에이전트 오케스트레이션의 범위가 사무 생산성 영역 전반으로 확장되는 흐름이다.
안전 정책의 구조적 강화
아동 안전 관련 섹션은 단순 확장이 아니라 <critical_child_safety_instructions>라는 전용 태그로 격리됐다. 특히 주목할 부분은 "Claude가 아동 안전을 이유로 요청을 거부하면, 같은 대화 내 모든 후속 요청은 극도의 주의를 기울여 접근해야 한다"는 조항이다. 단일 거부 이벤트가 대화 전체의 컨텍스트를 오염시키는 방식으로 안전망을 설계한 것이다.
거식증 등 섭식 장애 관련 새 섹션도 신설됐다. 사용자가 섭식 장애 징후를 보이면 이후 대화 전반에 걸쳐 구체적인 영양·식단·운동 수치를 제공하지 않도록 제한한다.
스크린샷 공격 방어와 정치적 중립성
복잡한 이슈에 대해 "예/아니오"만 답하도록 강제하는 스크린샷 공격 패턴에 대한 방어 조항이 <evenhandedness> 섹션에 추가됐다. Claude는 단답형 응답을 거부하고 왜 단순 답변이 부적절한지 설명하는 방식으로 대응할 수 있다.
4.6에 있던 "도널드 트럼프는 현 미국 대통령"이라는 명시적 구문은 4.7에서 삭제됐다. 모델의 지식 컷오프가 2026년 1월로 업데이트되면서 더 이상 하드코딩이 필요하지 않게 된 것으로 보인다.
덜 귀찮은 Claude를 향해
UX 측면에서도 변화가 있다. 사용자가 대화를 종료하려 할 때 Claude가 계속 머물도록 유도하거나 추가 턴을 끌어내려 하지 말라는 지침이 명시됐다. 응답의 간결성을 강조하는 섹션도 추가됐고, 이모트 표현이나 "genuinely", "honestly" 같은 특정 단어 사용을 금지하던 4.6의 조항은 삭제됐다. 모델 자체가 해당 행동을 더 이상 하지 않는다는 판단으로 읽힌다.
실무에서 어떤 의미인가?
이번 변경이 AI 에이전트 개발자에게 던지는 핵심 메시지는 세 가지다.
첫째, 에이전트 설계의 기본 원칙이 "묻기 전에 행동"으로 이동했다. 기존에 명확한 지시가 없으면 사용자에게 확인을 요청하던 패턴이 이제는 도구 호출 우선으로 바뀐다. 이에 맞게 프롬프트 설계와 도구 노출 전략을 재검토할 필요가 있다.
둘째, tool_search 메커니즘은 동적 능력 탐색의 신호다. 에이전트가 런타임에 자신의 도구 목록을 스스로 탐색하는 구조는 플러그인형 아키텍처와의 궁합이 좋다. MCP(Model Context Protocol) 기반 에이전트를 설계 중이라면 이 메커니즘을 활용하는 방향을 검토해볼 만하다.
셋째, 안전 정책은 대화 수준이 아닌 세션 수준에서 작동한다. 특정 거부 이벤트가 이후 전체 대화에 영향을 미치는 방식은 멀티턴 에이전트 설계 시 반드시 고려해야 하는 변수가 됐다.
도입 전 체크포인트
- 현재 에이전트가 "모호할 때 먼저 묻는" 패턴으로 설계돼 있다면, 4.7 기반으로 전환 시 동작이 달라질 수 있다. 프롬프트 테스트 필요.
tool_search가 시스템 프롬프트에 명시된 만큼, 에이전트에 노출하는 도구 목록의 설명 품질이 응답 품질에 직접 영향을 미친다.- 안전 관련 섹션 강화는 헬스케어·교육 도메인 AI 서비스 개발자에게 특히 중요한 변수다. 섭식 장애, 아동 안전 관련 시나리오를 별도로 테스트해야 한다.
- Claude.ai UI를 직접 사용하는 경우, 플랫폼 명칭이 "developer platform"에서 "Claude Platform"으로 변경됐음을 문서나 가이드에 반영해야 한다.
자주 묻는 질문
Q.Claude의 시스템 프롬프트를 공개하는 것은 보안상 문제가 없나?
Anthropic은 사용자 대면 시스템의 시스템 프롬프트를 공식 문서로 공개한다. 이는 내부 지침의 투명성을 높이는 의도적인 선택이다. 다만 이번 분석에서도 언급됐듯, 공개된 시스템 프롬프트에는 도구 설명과 파라미터 정보가 포함되지 않는다. 실제 AI 서비스를 구축하는 개발자라면 자신이 설정한 시스템 프롬프트는 여전히 보호 대상이며, Claude에게 직접 물어보면 도구 정보까지 상당 부분 확인할 수 있다는 점도 알아둘 필요가 있다.
Q.`tool_search`는 일반 API 사용자도 활용할 수 있나?
현재 `tool_search`는 Claude.ai 채팅 UI의 시스템 프롬프트 내에서 동작하는 메커니즘으로 확인된다. Anthropic 공식 API 문서에도 관련 내용이 언급돼 있지만, 일반 API 사용자가 동일한 방식으로 활용할 수 있는지는 공식 확인이 필요하다. 에이전트 프레임워크에서 유사한 동적 도구 탐색 패턴을 구현하려면 별도 설계가 필요하다.
Q.4.6에서 4.7로 업그레이드하면 기존 에이전트 동작이 달라지나?
시스템 프롬프트 수준의 변경은 모델 기반 동작 원칙 자체를 바꾼다. 특히 "먼저 행동하고 나중에 묻는" 방향 전환은 사용자 확인을 중간에 요청하도록 설계된 에이전트에서 예상치 못한 동작을 유발할 수 있다. Opus 4.7 기반으로 전환하기 전에 기존 시나리오에 대한 회귀 테스트를 충분히 진행하는 것이 권장된다.