삼태연구소
SAMTAELABS삼태연구소
가이드2026년 4월 5일·4분 읽기

AI 응답 토큰을 75% 줄이는 '동굴인 모드': Caveman 플러그인 완전 분석 (github.com)

AI 토큰 절감Claude 플러그인Codex 플러그인CavemanLLM 최적화
AI 응답 토큰을 75% 줄이는 '동굴인 모드': Caveman 플러그인 완전 분석
목차(7)

한줄 요약

Claude·Codex의 AI 응답에서 불필요한 말을 제거해 평균 65%, 최대 87% 토큰을 아끼는 오픈소스 플러그인이다.


어떤 상황에서 필요한가?

AI 코딩 어시스턴트를 하루에도 수십 번 쓰다 보면, 정작 필요한 답은 두 줄인데 응답은 열 줄인 경우가 많다. "기꺼이 도와드리겠습니다", "한번 살펴보겠습니다" 같은 문구는 읽는 시간도 낭비고 토큰 비용도 낭비다. Caveman은 Claude와 Codex에서 이런 군더더기를 시스템 레벨에서 잘라내는 플러그인으로, API 사용량이 많거나 응답 속도가 중요한 개발자에게 실질적인 효과를 준다.


핵심 구현 방법

1. 설치

Claude Code 환경에서는 한 줄로 끝난다.

npx skills add JuliusBrussee/caveman

Claude 플러그인 시스템을 직접 쓴다면 아래처럼 설치한다.

claude plugin marketplace add JuliusBrussee/caveman
claude plugin install caveman@caveman

Codex 사용자는 레포를 클론한 뒤, Codex 내에서 /plugins → Caveman 검색 → 설치 순서로 진행한다. 한 번 설치하면 이후 모든 세션에서 자동 적용된다.

2. 활성화와 종료

세션 중 언제든 아래 트리거로 모드를 켤 수 있다.

  • 켜기: /caveman 또는 $caveman, "talk like caveman", "less tokens please"
  • 끄기: "stop caveman" 또는 "normal mode"

3. 강도 선택 (Intensity Levels)

상황에 따라 압축 수준을 세 단계로 조절할 수 있다.

레벨트리거특징
Lite/caveman lite불필요한 채움말만 제거, 문법은 유지
Full/caveman full기본값. 관사 제거, 단편 문장
Ultra/caveman ultra최대 압축. 전보체, 약어 적극 사용

설정한 레벨은 직접 바꾸거나 세션이 끝날 때까지 유지된다.

4. 실제 토큰 절감 수치

Claude API에서 실측한 결과는 아래와 같다.

작업일반 (토큰)Caveman (토큰)절감률
React 리렌더 버그 설명1,18015987%
인증 미들웨어 수정70412183%
PostgreSQL 커넥션 풀 설정2,34738084%
Docker 멀티스테이지 빌드1,04229072%
평균1,21429465%

절감 범위는 작업 종류에 따라 22%~87%로 편차가 있다.

자주 묻는 질문

Q.Caveman 플러그인을 쓰면 Claude나 Codex의 기술적 답변 품질이 떨어지지 않나요?

실측 기준으로는 기술 정확도가 유지된다. Caveman이 제거하는 건 "기꺼이 도와드리겠습니다", "한번 살펴보겠습니다" 같은 관용 표현과 관사, 헤징 표현뿐이다. 코드, 에러 메시지, 기술 용어는 원문 그대로 출력된다. 2026년 3월 발표된 연구에서도 간결한 응답이 오히려 특정 벤치마크에서 더 높은 정확도를 보인 사례가 확인됐다. 단, 작업 성격에 따라 체감 차이가 있을 수 있으므로 Lite 모드부터 시작해 보는 걸 권장한다.

Q.Caveman 플러그인을 쓰면 토큰 비용이 얼마나 절감되고, 응답 속도는 얼마나 빨라지나요?

실측 평균 기준으로 출력 토큰이 65% 줄어든다. 절감 범위는 작업에 따라 22%~87%로 편차가 크다. 생성해야 할 토큰 수가 줄어드는 만큼 응답 속도도 빨라지는 구조다. 다만 사고(thinking) 토큰은 영향을 받지 않으며, 실제 비용 절감 효과는 사용 패턴과 작업 종류에 따라 달라진다.

Q.Caveman 플러그인은 Claude와 Codex 외에 다른 AI 도구에서도 사용할 수 있나요?

현재 공개된 설치 방법은 Claude Code(skills 시스템, 플러그인 시스템)와 Codex 두 가지다. 다른 AI 도구나 환경에서의 지원은 원문에 명시되어 있지 않다. 설치는 원라인 명령어로 가능하고, 한 번 설치하면 이후 세션에서 별도 설정 없이 계속 사용할 수 있다.

직접 따라하기 어려우면, 대표 개발자가 1:1로 진행해드립니다

누적 매출 20억 / 1인 에이전시. 중간 과정 없이 의도 그대로.

관련 아티클

관련 사례

이 글의 키워드와 맞닿은 실제 개발 사례를 함께 보세요.