삼태연구소
SAMTAELABS삼태연구소
트렌드2026년 6월 23일·5분 읽기

Claude의 '생각 과정'은 진짜가 아니다 — Extended Thinking의 불편한 진실 (patrickmccanna.net)

AI 개발 도구Claude CodeExtended Thinking외주 개발개발 외주앱 개발 외주AI 에이전트Anthropic개발 업체
Claude의 '생각 과정'은 진짜가 아니다 — Extended Thinking의 불편한 진실
목차(4)

한줄 요약

Claude Code의 Extended Thinking은 실제 추론 로그가 아니라 요약본이며, 원본 reasoning은 Anthropic이 암호화 키를 보유한다.

무엇이 달라지나?

Claude Code가 AI 개발 도구 시장에서 빠르게 주목받는 가운데, 그 핵심 기능 중 하나인 Extended Thinking의 실체에 대한 논란이 불거졌다. 개발자 Patrick McCanna가 세션 로그를 직접 분석한 결과, thinking blocks에는 텍스트 대신 600자짜리 signature만 존재했다.

이 구조의 핵심은 세 가지다. 첫째, Claude는 자신의 추론 과정을 해당 signature로 암호화한다. 둘째, 그 복호화 키는 Anthropic이 보유하며 사용자 로컬 환경에는 전달되지 않는다. 셋째, API가 반환하는 것은 추론 그 자체가 아니라 추론의 요약이다. 전체 thinking 출력에 접근하려면 엔터프라이즈 계약이 필요하다고 공식 문서에 명시돼 있다.

문서에는 이 사실이 담겨 있긴 하다. 하지만 표현이 간접적이라, 주의 깊게 읽지 않으면 "extended thinking이 전체 사고 과정의 요약을 반환한다"는 문장을 그냥 지나치기 쉽다. 암호학 연구자 Matt Green도 이 signature 블록 구조를 별도로 분석해 관련 내용을 공개한 바 있다.

실무에서 어떤 의미인가?

개발 외주나 AI 도구 도입을 검토하는 팀 입장에서 이 이슈는 단순한 기술 호기심이 아니다. 세 가지 실질적 문제가 발생한다.

감사 추적이 불가능하다. 로컬에 저장된 reasoning 로그는 암호화돼 있어 사용자가 직접 해석할 수 없다. 에이전트가 어떤 논리로 특정 판단을 내렸는지 사후에 추적하는 것은 현재 구조상 불가능에 가깝다.

기록과 실제 추론 사이에 간극이 있다. ctrl+o로 확인하는 Extended Thinking 출력은 실제 모델 행동을 이끈 추론이 아니라, 그것의 요약이다. McCanna는 이를 BMP 파일을 JPEG로 변환한 뒤 편집하고 다시 BMP로 저장하는 것에 비유했다. 변환 과정에서 정보 손실이 발생한다.

입출력과 행동만 기록 가능하다. 현실적으로 할 수 있는 것은 Claude Code 세션의 입력값, 출력값, 에이전트 행동을 외부에서 스크래핑해 기록하는 수준이다. 하지만 이조차 에이전트의 실제 내부 추론을 반영하지 않는다.

이는 단순히 "기능이 부족하다"는 문제가 아니다. 만약 누군가에게 AI 에이전트의 의사결정 근거를 설명하거나 감사받아야 하는 상황이라면, 현재 구조는 그 요구를 충족하지 못한다.

도입 전 체크포인트

Claude Code 또는 유사한 AI 에이전트 도구를 프로젝트에 도입하기 전, 다음 질문에 먼저 답해야 한다.

1. 이 프로젝트에 감사 추적(audit trail)이 필요한가? 금융, 의료, 법무, 공공 분야처럼 의사결정 근거를 기록·제출해야 하는 도메인이라면, 현재 Extended Thinking 구조는 그 요건을 충족하지 못한다. 엔터프라이즈 계약 여부와 실제 접근 가능한 데이터 범위를 계약 전 명확히 확인해야 한다.

2. 에이전트 행동의 재현·검증이 필요한가? 버그 추적이나 품질 보증 관점에서 에이전트가 왜 그런 코드를 생성했는지 소급해서 파악하고 싶다면, 현재 로컬 로그만으로는 한계가 있다는 점을 전제하고 아키텍처를 설계해야 한다.

3. 오픈소스 모델이 대안이 될 수 있는가? McCanna는 글 말미에서 오픈소스 모델의 성능 향상이 더 빠르게 이뤄져야 한다고 언급했다. 완전한 투명성이 필요하다면, 로컬에서 직접 실행 가능한 오픈소스 모델 기반의 아키텍처가 현실적인 대안이 될 수 있다. 다만 현재 성능 격차는 분명히 존재하므로, 트레이드오프를 명확히 인식해야 한다.

AI 도구는 강력하다. 하지만 그 내부 동작이 블랙박스라면, 그 도구를 믿고 맡길 수 있는 업무의 범위도 그에 맞게 설정해야 한다.

자주 묻는 질문

Q.Claude Code의 Extended Thinking 로그를 로컬에서 확인하면 실제 추론을 볼 수 있나?

아니다. 로컬에 저장되는 thinking blocks에는 텍스트가 아닌 암호화된 signature만 포함된다. 복호화 키는 Anthropic이 보유하고 있어 사용자는 접근할 수 없다. API를 통해 반환되는 것도 추론 전체가 아니라 요약본이다. 전체 thinking 출력에 접근하려면 엔터프라이즈 계약이 필요하다고 공식 문서에 명시돼 있다.

Q.AI 에이전트 도입 시 의사결정 근거를 남기려면 어떻게 해야 하나?

현재 구조에서는 에이전트의 입력값, 출력값, 실행한 행동을 외부에서 별도로 기록하는 방식이 현실적인 대안이다. 다만 이 방법도 에이전트 내부의 실제 추론을 반영하지는 않으므로, 감사 추적이 법적·제도적으로 요구되는 프로젝트라면 도구 선택 자체를 재검토해야 한다. 개발 외주 프로젝트에서 AI 도구를 활용할 경우에도 이 한계를 발주사와 공유하는 것이 바람직하다.

Q.Anthropic 문서에 이런 내용이 명시돼 있는데 왜 문제가 되나?

문서에 명시는 돼 있지만 표현이 간접적이라 오해하기 쉬운 구조라는 점이 비판의 핵심이다. "전체 사고 과정의 요약을 반환한다"는 문장은 주의 깊게 읽지 않으면 전체 로그가 제공된다는 의미로 잘못 받아들이기 쉽다. 도구의 실제 동작 방식과 사용자의 기대 사이에 간극이 존재할 때, 그 격차를 줄이는 것은 도구를 제공하는 측의 책임이기도 하다. 📌 원문: [HackerNews](https://patrickmccanna.net/the-text-in-claude-codes-extended-thinking-output-is-not-authentic/) 🔗 새로운 기술 도입이나 기술 검토가 필요하다면 → [삼태연구소에 문의하기](/contact)

이 기술을 우리 서비스에 도입하려면? 24시간 내 답변드립니다

누적 매출 20억 / 1인 에이전시. 중간 과정 없이 의도 그대로.

관련 아티클

관련 사례

이 글의 키워드와 맞닿은 실제 개발 사례를 함께 보세요.