Andrej Karpathy: "90% of your AI coding bill is paying for context you didn't need to send"
Here are 10 things senior AI engineers stopped wasting tokens on:
1. Auto-context loading 50 files for a 30-line fix: $1.20/turn for tokens you'll never read. 80% input waste, every session
2. Running Opus on lint, format, and rename tasks: $0.60 for what Haiku nails at $0.02. 30x overpay on the cleanup tier
3. Tool call loops that re-send the full repo on every retry: 5x context cost per agentic flow. fixing these alone cuts 30-50% of bills
4. Sonnet as the default model: Kimi 2.6 matches its quality on most coding tasks at 1/6 the cost. defaulting to Sonnet in 2026 is leaving 60-70% on the table
5. Streaming responses on stable-prefix workflows: kills your prompt cache. you pay 10x for tokens that should have cost cents
6. "Just in case" file includes: 80,000-token prompts that should be 3,000. context bloat is the silent budget killer
7. Per-session knowledge rebuilding: 10 min writing a SKILL.md once vs paying agents to re-figure out your environment every run. $4 vs $0.30 per execution
8. Single-model setups: premium tier on every task is the most expensive mistake in AI coding right now
9. Asking 10 small questions one at a time: 10 separate input prefix charges vs one batched call. 70-90% savings on routine workflows
10. Buying Claude Pro + ChatGPT Plus + Cursor Pro: you seriously use one. the other two are habit, not utility
what actually compounds instead:
- context discipline (grep before fetching, always)
- prompt caching on every stable prefix
- multi-model routing (Kimi 2.6 default, Opus for the 10%)
- graduated skills via SKILL.md files
- profiling tool calls before optimizing prompts
- the routing mindset (right model for right task)
in 12 months, the gap between developers shipping on $200/month and $4,000/month budgets won't be skill
it'll be how well they route
study this.
Ruflo - 클로드 코드를 위한 멀티 에이전트 AI 오케스트레이션 플랫폼
- 클로드 코드에 100개 이상의 특화 에이전트를 조율하는 능력을 부여하는 플랫폼으로, 기존 Claude Flow에서 리브랜딩
- `npx ruvflo init` 한 줄이면 에이전트가 스웜으로 자기 조직화하고, 작업…
https://t.co/NGisIljcjX
터미널폰 – 명령줄에서 사용하는 종단간 암호화 워키토키
- Tor 네트워크를 통해 음성과 텍스트를 익명·종단간 암호화(E2EE) 방식으로 주고받는 Bash 기반 워키토키형 통신 도구
- 서버, 계정, 전화번호 없이 `.onion` 주소만으로 상대와 직접 연결하며, 음성 메시지를…
https://t.co/3KSiT7GXvS
Cloudflare, AI로 Next.js를 1주일 만에 Vite로 재구현한 vinext 공개
Cloudflare의 한 엔지니어가 AI(Claude)의 도움을 받아, 복잡한 Next.js 인프라를 Vite 기반으로 완전히 새로 작성한 프로젝트 'vinext(vee-next)' 를 공개. 기존 Next.js의 고질적인 배포 및 빌드 문…
https://t.co/GvbDMg9Gxx
AI 코딩 에이전트(Codex, Claude Code)를 직접 쓰는 대신, 상위 오케스트레이터(OpenClaw의 "Zoe")가 여러 에이전트를 관리하는 2계층 시스템을 구축에 관한 아티클입니다.
너무 좋은 글이네요.
----------------------------------------------------------
요약
왜 오케스트레이터가 필요한가?
: 컨텍스트 윈도우는 한정적이라 코드와 비즈니스 맥락을 동시에 넣을 수 없습니다. 그래서 오케스트레이터(Zoe)는 고객 데이터·회의록·과거 의사결정 등 비즈니스 컨텍스트를 담당하고, 코딩 에이전트에게는 코드에 집중할 수 있는 정밀한 프롬프트만 전달합니다.
작동 방식 (8단계)
: 고객 요청 → Zoe와 스코핑 → git worktree + tmux로 에이전트 스폰 → 크론잡이 10분마다 상태 모니터링 → 에이전트가 PR 생성 → Codex·Claude·Gemini 3개 모델이 자동 코드리뷰 → CI/테스트 통과 → 텔레그램 알림 후 사람이 최종 머지
핵심 차별점
: 에이전트가 실패하면 같은 프롬프트로 재시도하는 게 아니라, Zoe가 실패 원인을 비즈니스 맥락과 함께 분석해서 더 나은 프롬프트로 재스폰합니다. 성공 패턴도 학습해 시간이 갈수록 프롬프트 품질이 올라갑니다.
실적
: 하루 평균 커밋 50개, 최대 94개. 에디터를 열지 않고도 고객 요청을 당일 배포. 비용은 월 ~$190 수준. 실제 B2B SaaS(에이전틱 PR 서비스)를 이 시스템으로 혼자 운영 중입니다.
Kimi Claw - OpenClaw를 클라우드에 원클릭 배포해서 사용하기
- OpenClaw를 Kimi 플랫폼을 통해 클라우드에 원클릭으로 몇 초안에 배포 가능
- 복잡한 설정 없이 24시간 온라인 상태로 유지되며, 즉시 사용 가능한 형태로 제공됨
- Kimi K2.5 Thinking이 적용되어…
https://t.co/6zxfavsXvw
agent-of-empires - tmux와 git Worktree를 활용한 AI 코딩 에이전트 터미널 세션 관리자
- AI 코딩 에이전트의 병렬 실행과 세션 관리를 위해 개발
- Claude Code, OpenCode, Codex CLI, Gemini CLI 등 주요 AI 코딩 도구를 통합 지원
- Linux와 macOS에서 동작하며…
https://t.co/yPhh6LCDDD
AionUi - 오픈소스 멀티 AI 에이전트 데스크톱
- 여러 AI 모델과 CLI 도구를 하나의 UI에서 관리하는 Claude Cowork 대체제
- Gemini CLI, Claude Code, Codex, Open Claw 등 주요 AI 툴 자동 인식/전환 및 통합 GUI 제공
- 맥·윈도우·리눅스 지원하며, WebUI 및 Te…
https://t.co/iMnWTiqemg
Show GN: slimg - Rust로 만든 이미지 최적화 CLI (54GB → 8GB)
왜 만들었나요?
Google의 Squoosh라는 툴을 애용했는데, CLI 버전은 실행하면 오류가 나고 웹 버전은 쓸만했지만... Google 특유의 방치 상태에 결국 직접 만들기로 했습니다. 대체제를 찾아봤는데 …
https://t.co/xqRww8a7c3
ACE-Step-1.5 - 유료 서비스를 능가하는 로컬 음악 생성 모델
- Suno 같은 상용 수준의 음악 생성 품질을 일반 소비자 하드웨어에서도 구현한 오픈소스 음악 생성 모델
- 10초 이내(RTX 3090) 로 전체 곡 고속 생성
- 4GB VRAM 이하 환경에서도 로컬 실행 가능하며,…
https://t.co/4VlJF3kpYG
just-bash - 에이전트를 위한 Bash 시뮬레이션 환경
- Vercel에서 만든 "Bash for Agents"
- 안전하고 샌드박스 처리된 bash 환경이 필요한 AI 에이전트를 위해 설계된 TypeScript 기반 가상 Bash 환경
- 메모리 내 가상 파일시스템(InMemoryFs) 위에서 동작하며, 실…
https://t.co/LTAbda1L3h
소프트웨어 팩토리와 에이전트 시대의 도래
- StrongDM AI팀은 코드를 보지 않고도 고품질 소프트웨어를 만드는 Software Factory 개념을 주장
- 명세/시��리오 기반으로 에이전트가 코드를 작성하고, 테스트 하네스를 실행, 인간의 검토 없이 수렴하는 비대화형 개발 …
https://t.co/gzUowkXPLh
2026년 AI와 UX에 대한 18가지 예측
- 올해는 생성형 AI의 참신함 단계가 끝나고 더 이상 관망이 불가능해지는 해. 개인·기업·직업 모두가 의도적으로 적응하거나 도태를 선택해야 하는 전환점
- AI 경쟁의 중심이 자율 에이전트·위임형 UI·생성형 인터페이스로 이동하…
https://t.co/YFmCcOWVf9
Claude Code 완전 가이드: 해커톤 우승자의 70가지 파워 팁 [54p PDF]
- Anthropic 해커톤 우승자 ykdojo의 팁 Repo과 Anthropic DevRel Ado Kukic의 Advent of Claude 에서 소개된 팁을 묶어서 정리/번역
- 각 팁마다 실제로 사용할 수 있는 명령어, 스크립트, 설정 파…
https://t.co/myngG5LGuO
Mole - Mac을 깊게 청소하고 최적화하는 올인원 도구
- macOS의 불필요한 파일과 성능 저하 문제를 해결해주는 도구로, 다양한 청소·분석·최적화 기능을 단일 실행 파일로 제공
- CleanMyMac, AppCleaner, DaisyDisk, iStat Menus 등의 기능을 통합한 올인원 툴킷
-…
https://t.co/bLLC7IxoSh
NanoClaw – Apple 컨테이너 격리 환경에서 실행되는 500줄짜리 TypeScript 기반 Claude 어시스턴트
- NanoClaw는 Apple 컨테이너에서 실행되는 개인용 Claude 기반 AI 어시스턴트로, 단일 프로세스 구조와 소수의 파일로 구성된 경량형 시스템
- 각 그룹별 컨테이너 격…
https://t.co/6hAJrfVZTI
2026 기술 트렌드 보고서: AI 에이전트부터 소버린 AI, 피지컬 AI까지
- CB Insights가 올해 기술 트렌드 14가지를 분석한 보고서(102p PDF). AI 에이전트, 스테이블코인, 데이터센터 인프라, 피지컬 AI 등 핵심 분야를 다룸
- AI 에이전트의 ROI 측정이 기업들의 주요…
https://t.co/TVYuDo0z1p