삼태연구소
SAMTAELABS삼태연구소
가이드2026년 5월 4일·6분 읽기

Claude Code UX에 DeepSeek 뇌를 이식하기 — deepclaude 실전 분석 (github.com)

Claude CodeDeepSeekAI 코딩 에이전트LLM 비용 최적화deepclaudeOpenRouter에이전트 루프AI 개발 도구
Claude Code UX에 DeepSeek 뇌를 이식하기 — deepclaude 실전 분석
목차(4)

한줄 요약

Claude Code의 자율 에이전트 루프를 유지하면서 추론 모델만 DeepSeek V4 Pro로 교체해 토큰 비용을 대폭 낮추는 오픈소스 래퍼다.

어떤 상황에서 필요한가?

AI 코딩 에이전트를 팀 단위로 운용하거나, 반복적인 자동화 루프를 돌리는 에이전시·스타트업이라면 모델 비용이 금방 병목이 된다. Claude Code는 자율 코딩 에이전트로서 완성도가 높지만, Anthropic의 Max 플랜은 월 $200에 사용량 상한까지 걸려 있다.

deepclaude가 주목받는 이유는 단순하다. Claude Code의 툴 루프(파일 읽기/쓰기, bash 실행, git 연산, 서브에이전트 스폰)는 손대지 않고, API 호출 대상만 DeepSeek V4 Pro로 바꾼다. Anthropic 측 출력 토큰이 $15/M인 반면 DeepSeek는 $0.87/M이다. 같은 작업을 돌렸을 때 비용 구조가 근본적으로 달라진다.

DeepSeek의 자동 컨텍스트 캐싱도 에이전트 루프에서 의미 있는 요소다. 첫 요청 이후 시스템 프롬프트와 파일 컨텍스트가 캐시되면 $0.004/M 수준까지 내려간다. 장시간 멀티스텝 루프를 돌릴수록 실질 단가가 낮아지는 구조다.

핵심 구현 방법

작동 원리는 의외로 간단하다. Claude Code는 ANTHROPIC_BASE_URLANTHROPIC_AUTH_TOKEN 같은 환경변수로 API 엔드포인트를 결정한다. deepclaude는 세션 시작 시 이 환경변수들을 DeepSeek(또는 OpenRouter, Fireworks AI) 방향으로 덮어쓰고, 세션 종료 시 원래 값으로 복원한다. 시스템 전역 설정에 영향을 주지 않는 깔끔한 방식이다.

지원 백엔드는 네 가지다. 기본값인 DeepSeek 직접 연결($0.44/$0.87 per M 입출력), US 서버 기반의 OpenRouter(같은 단가), 추론 속도를 우선시하는 Fireworks AI($1.74/$3.48), 그리고 복잡한 문제에만 쓰는 Anthropic 원본($3.00/$15.00)이다. 세션 도중 백엔드를 재시작 없이 전환하는 기능도 있다. 로컬 프록시(localhost:3200)가 API 트래픽을 인터셉트하고 /_proxy/mode 엔드포인트로 실시간 전환을 처리한다.

VS Code 사용자라면 슬래시 커맨드(/deepseek, /anthropic)를 ~/.claude/commands/에 등록해 IDE 안에서 바로 전환할 수 있다. 비용 추적도 프록시가 담당한다. curl http://127.0.0.1:3200/_proxy/cost를 치면 토큰 사용량과 Anthropic 대비 절감액이 JSON으로 반환된다.

원격 제어(--remote) 옵션은 구조적으로 흥미롭다. WebSocket 브리지는 Anthropic 인프라를 그대로 쓰되, 모델 API 호출만 로컬 프록시를 통해 DeepSeek으로 라우팅한다. 브라우저나 모바일에서 Claude Code 세션을 여는 기능은 유지하면서 비용은 낮추는 구성이다. 단, 이 옵션은 Claude.ai 구독과 claude auth login 상태가 전제조건이다.

실전에서 주의할 점

이 도구를 쓰기 전에 제약을 먼저 파악해야 한다. 이미지/비전 입력은 DeepSeek의 Anthropic 호환 엔드포인트가 지원하지 않아 동작하지 않는다. MCP 서버 툴도 호환 레이어를 통과하지 못한다. Anthropic의 cache_control 프롬프트 캐싱 지시자는 무시되고 DeepSeek 자체 캐싱으로 대체된다.

모델 성능 차이도 솔직하게 봐야 한다. 프로젝트 측 설명에 따르면 루틴한 작업(전체 업무의 약 80%)에서는 DeepSeek V4 Pro가 Claude Opus와 비슷한 수준이지만, 복잡한 추론이 필요한 나머지 20%에서는 Claude Opus가 우위라고 밝히고 있다. DeepSeek V4 Pro의 LiveCodeBench 점수는 96.4%로 표기되어 있다.

에이전시 관점에서 가장 실용적인 접근은 비용 민감도와 작업 복잡도에 따라 백엔드를 분리 운용하는 것이다. 반복적인 코드 생성, 리팩터링, 테스트 작성은 DeepSeek으로, 아키텍처 설계나 까다로운 버그 분석은 Anthropic으로 라이브 전환하는 워크플로가 현실적이다. 세션 중단 없이 전환되는 구조 덕분에 이 전략은 실행 가능하다.

DeepSeek 서버가 중국에 위치한다는 점은 데이터 보안 정책이 엄격한 클라이언트 프로젝트에서 검토가 필요하다. OpenRouter나 Fireworks AI 백엔드는 US 서버를 쓰므로 이 경우 대안이 된다.

자주 묻는 질문

Q.기존 Claude Code 설정이나 프로젝트 파일에 영향을 주나?

deepclaude는 환경변수를 세션 범위에서만 덮어쓰고, 종료 시 원래 값으로 복원한다. 프로젝트 파일, `.claude` 디렉토리 설정, Claude Code의 툴 동작 자체에는 변경이 없다. 시스템 전역 환경변수를 영구적으로 바꾸는 구조가 아니다.

Q.Anthropic 구독 없이 사용할 수 있나?

기본 CLI 모드와 VS Code 통합은 DeepSeek, OpenRouter, Fireworks AI 키만으로 동작하므로 Anthropic 구독이 필수는 아니다. 단, `--remote` 원격 제어 기능은 Anthropic 브리지 인프라를 사용하기 때문에 claude.ai 구독과 `claude auth login` 상태가 반드시 필요하다.

Q.팀 단위 도입 시 비용 모니터링은 어떻게 하나?

로컬 프록시가 토큰 사용량을 세션 단위로 집계하고, `/_proxy/cost` 엔드포인트로 조회할 수 있다. 다만 이 집계는 프록시 프로세스 수명 동안만 유지되며 별도 데이터베이스에 저장되지 않는다. 팀 전체의 누적 비용을 추적하려면 각 세션 종료 시 비용 데이터를 외부로 내보내는 별도 처리가 필요하다.

직접 구축이 어렵다면, 전문가에게 맡겨보세요

대표 개발자가 직접 소통하고, 설계하고, 구축합니다. 중간 과정 없이 의도 그대로.

관련 아티클

관련 사례

이 글의 키워드와 맞닿은 실제 개발 사례를 함께 보세요.