Claude Code 2026년 4월 업데이트 총정리 - 토큰 절약, 성능, Advisor Tool
v2.1.91 (4월 2일) 기준 최신 변경사항 정리. 토큰 절약, 성능, 답변 품질 세 카테고리로 나눴다.
토큰 절약
Edit 도구 old_string 최소화 (v2.1.91)
파일 편집할 때 기준 문자열(old_string)을 더 짧게 잡는다. 출력 토큰이 직접 줄어든다.
체감 가장 큰 변경. 코드 수정 많이 하는 세션에서 효과 확실하다.
MCP 스키마 캐시 최적화 (v2.1.90)
매 턴마다 MCP 툴 스키마를 JSON.stringify하던 불필요한 작업 제거. 캐시 효율과 처리 속도 둘 다 개선.
Sonnet 4.6 자체 효율 향상
Claude Code 기본 모델인 Sonnet 4.6이 이전 버전보다 적은 토큰을 소비한다. 모델 레벨 최적화.
웹 검색 결과 사전 필터링
웹 검색/fetch 결과가 컨텍스트에 들어오기 전에 코드로 필터링한다. 불필요한 토큰 유입 자체를 차단.
/clear 힌트 버그 수정 (v2.1.89)
“토큰 절약하려면 /clear 하세요” 힌트가 잘못된 수치를 보여주던 버그 수정. 현재 컨텍스트 크기가 아니라 누적 세션 토큰을 보여주고 있었다.
성능 향상
Write 도구 Diff 계산 60% 향상
탭, &, $가 포함된 대용량 파일에서 diff 계산이 60% 빨라졌다. 실제 코드 작업 속도 체감 가능.
SSE 스트리밍 처리 개선 (v2.1.90)
대용량 스트리밍 프레임 처리 성능 개선. 장시간 세션에서 응답 속도가 안정적이다.
MCP 비동기 연결 옵션
MCP_CONNECTION_NONBLOCKING=true
-p 모드에서 MCP 연결 대기를 완전히 건너뛴다. --mcp-config 서버 연결도 가장 느린 서버 대기 대신 5초로 제한.
MCP 서버 여러 개 쓰는 환경에서 세션 시작 지연이 사라진다.
stripAnsi Bun 최적화 (v2.1.91)
Bun 런타임에서 ANSI 이스케이프 제거가 빨라졌다. 터미널 렌더링 소폭 향상.
답변 품질 향상
/claude-api 스킬 가이던스 강화 (v2.1.91)
Claude API로 에이전트 만들 때 설계 패턴, 컨텍스트 관리, 캐싱 전략에 대한 내부 가이던스가 강화됐다.
Compaction API (Beta)
서버 사이드에서 컨텍스트를 자동 요약한다. 사실상 무한 대화 가능. Opus 4.6에서 사용 가능.
긴 세션에서 품질 저하 없이 대화를 계속할 수 있다.
Advisor Tool (Beta)
여기가 핵심이다. 별도 섹션으로 다룬다.
Advisor Tool 상세 분석
동작 방식
흔히 생각하는 “Opus가 먼저 계획 → Sonnet이 실행” 구조가 아니다.
역전된 오케스트레이션:
Sonnet/Haiku (Executor)
│
│ 작업 수행 (툴 호출, 결과 처리)
│
├── 판단이 어려운 분기점 도달
│ ↓
│ advisor() 호출 → Opus가 전체 컨텍스트 리뷰
│ ↓
│ Opus: 계획/수정/중단신호 반환 (400~700 tokens)
│ ↓
└── Sonnet/Haiku: 조언 반영 후 작업 재개
Sonnet이 달리다가 막힐 때만 Opus한테 물어본다. Opus는 툴을 직접 호출하거나 사용자 대면 출력을 생성하지 않는다. 오직 Executor에게 guidance만 제공.
advisor() 호출 시점
- 본격적인 작업 시작 전 — 글쓰기, 접근 방식 확정, 전제 구축 전
- 작업 완료 직전 — 단, 파일 저장/커밋 등 결과물을 먼저 만들어야 함 (advisor 호출 중 세션이 종료될 수 있으니)
파일 탐색 같은 오리엔테이션은 예외. 먼저 하고 나서 advisor 호출.
벤치마크
| 조합 | 벤치마크 | 결과 |
|---|---|---|
| Sonnet + Opus Advisor | SWE-bench Multilingual | 74.8% (Sonnet 단독 72.1% 대비 +2.7p) |
| Sonnet + Opus Advisor | 비용 | 작업당 11.9% 절감 |
| Haiku + Opus Advisor | BrowseComp | 41.2% (Haiku 단독 19.7%의 2배 이상) |
Opus는 consultation당 400~700 tokens만 생성. Executor가 저렴한 레이트로 전체 출력을 처리하니까 Opus 단독보다 총 비용이 훨씬 낮다.
Advisor Tool vs opusplan vs Ultraplan
이 세 가지 헷갈린다. 완전히 다른 레이어다.
| 구분 | Advisor Tool | opusplan | Ultraplan |
|---|---|---|---|
| 레이어 | API (개발자용) | Claude Code 모델 설정 | Claude Code 명령어 |
| 작동 방식 | Sonnet이 필요시 Opus 자동 호출 | 플랜=Opus, 실행=Sonnet 자동 전환 | 플랜을 클라우드 CCR에 오프로드 |
| Opus 개입 | 동적 — Sonnet이 판단해서 필요할 때만 | 정적 — plan mode 진입 시 항상 | 통째로 — 플랜 전체를 Opus가 생성 |
| 사용자 개입 | 불필요 | 불필요 | 브라우저에서 검토/승인 |
| 터미널 블로킹 | 없음 | 있음 | 없음 (클라우드 실행) |
한 줄 요약
| Advisor Tool | “Sonnet이 달리다가 막히면 그때 Opus한테 전화해” (API 레벨, 동적) |
| opusplan | “계획은 Opus가, 코딩은 Sonnet이” (정적 역할 분리) |
| Ultraplan | “플랜을 클라우드에 통째로 맡기고 나는 딴 거 해” (비동기 오프로드) |
opusplan
/model 명령어에서 4번 옵션. Plan mode 진입 시 Opus, 실행 모드에서 Sonnet 4.6으로 자동 전환.
Ultraplan
/ultraplan 명령어. Cloud Container Runtime(CCR)에서 Opus 4.6이 최대 30분까지 깊은 추론. 여러 Opus 에이전트가 병렬로 코드베이스 분석해서 로컬 단독 대비 약 4배 빠른 플랜 생성.
로컬 터미널은 플래닝 중에도 자유롭게 사용 가능.
요약 표
| 카테고리 | 주요 변경 | 버전 |
|---|---|---|
| 토큰 절약 | Edit 도구 old_string 최소화 | v2.1.91 |
| 토큰 절약 | Sonnet 4.6 자체 효율 개선 | API 릴리즈 |
| 토큰 절약 | 웹검색 결과 사전 필터링 | API 릴리즈 |
| 성능 | Write diff 계산 60% 향상 | 최신 릴리즈 |
| 성능 | MCP 스키마 JSON.stringify 제거 | v2.1.90 |
| 성능 | MCP 비동기 연결 옵션 | 이전 릴리즈 |
| 품질 | Advisor Tool 베타 | API 베타 |
| 품질 | Compaction API — 무한 세션 | API 베타 (Opus 4.6) |
참고
Advisor Tool과 Compaction API는 현재 API 레벨 베타다. Claude Code 터미널에서 바로 쓸 수 있는 게 아니라 API 직접 호출 시 베타 헤더를 붙여야 한다.
MCP 기반으로 뭔가 만들고 있다면 Advisor Tool이 직접 관련된다. advisor_20260301 툴 타입 선언 하나로 Haiku 에이전트 품질을 Opus 수준으로 끌어올릴 수 있다 — 비용은 Sonnet 이하로 유지하면서.