AI subscriptions are dead
Claude Fable 5 will only be on the Anthropic subscription until June 22nd. After that, you will need to pay for usage per token
This will be the start of a much larger trend
Frontier models will no longer be included in subs
You’ll pay a fee and it will only get you access to older, much cheaper models
If you want access to that dank AI sour diesel, you’re going to need to pay for every token you use. No more subsidies
And it make sense. The subsidies were just a Ponzi scheme
For those that don’t know, when you pay $200 a month for an AI sub, you get thousands of dollars of tokens
These AI companies actively lose tremendous amounts of money because of these subscriptions. GDPs of most countries every year are lost on your $200 Claude Max sub
The investor money is running dry. IPOs are coming because of this. And with IPOs need to come profitability
The golden age of paying $200 a month and being able to code on 40 Claude Code instances and getting a usage reset every 5 minutes are about to die
The party couldn’t continue ever. You can’t just leverage the entire global economy for years and expect nothing to break. Now it’s time to pay up
Means a few things:
1. Time to be responsible when it comes to which models you use. You don’t need Fable 5 for GPT 5.5 Xhigh for everything. Build the skill of knowing when to use cheap models
2. Local LLMS/hardware will come even more in demand. I’m currently running GLM on my Mac Studio. It’s great. Is it Fable? No. But it gets the job done for free on simple tasks. Learn about local LLMs
3. This is the beginning of the wealth gap expansion. Those that can afford to spend $10,000 a month on Fable 5 will build incredible products that eat up more and more of the economy. Those that can’t afford Fable 5 will have an insane disadvantage
4. The government will need to step in eventually. There will be too much civil unrest. I hope the answer isn’t free money. That won’t do anything. I hope the answer is education/access to AI resources for ALL. Universal Basic Opportunity
5. You need to seriously reconsider where your money goes every month. If you are complaining about AI prices and in the back of your mind you know your skill set is becoming quickly irrelevant, all while spending money every month on Netflix, Xbox Live, Paramount +, drugs, DoorDash, Uber, and other things that bring nothing positive to your life, you are simply doing it wrong. AI is an investment in yourself. It’s an investment in your relevance to the global economy. You need to make sure you make that investment
The pieces on the board are quickly moving around. The rules are changing. The battlefield is shifting. If you’re not strategizing accordingly, you’re cooked.
그리고 질문 기술의 피날레는, 다음에 만났을 때 전에 들었던 정보를 자연스럽게 흘리는 것이다. "그때 맡으셨던 프로젝트, ()()분이 ()()해서 고민이라고 하셨잖아요. 그거 어떻게 됐어요?" 신이 나서 말하는 상대를 마주하게 될 거다.
인간관계 기술은 많다. 하지만 1:1에서 단 하나만 가져갈 수 있다면, 나는 망설임 없이 이걸 고른다.
AI 다루는 기술 이름의 트렌드가 3년 만에 3번 바뀌었습니다.
프롬프트 엔지니어링→ 컨텍스트 엔지니어링 → 하네스 엔지니어링. 하는 일은 사실 처음부터 같았는데, 왜 자꾸 이름이 바뀔까요?
저는 이 셋 중에서 사업가나 실무자가 제대로 이해해야 할 관점은 컨텍스트 엔지니어링이라고 봅니다.
Karpathy(OpenAI 창립멤버, 전 Tesla 오토파일럿 수석 디렉터)가 이 차이를 한마디로 정리했는데, 이게 꽤 뼈 때립니다.
Karpathy가 한 말의 핵심은 이겁니다.
사람들이 "프롬프트 엔지니어링"이라고 하면 떠올리는 건 질문 한 줄 잘 다듬는 건데, 실제로 AI 성능을 결정하는 건 그 질문 한 줄이 아니라, AI에게 넘기는 전체 맥락이라는 거예요.
작업 설명, 참고 예시, 관련 데이터, 이전 대화 이력... 이걸 얼마나, 어떤 형태로 넣느냐가 결과를 좌우합니다.
근데 여기서 재밌는 게, 이게 단순히 "많이 넣으면 좋다"가 아니에요.
너무 많이 주면 비용도 올라가고 오히려 성능이 떨어지고, 너무 적게 주면 AI가 맥락을 못 잡아서 엉뚱한 결과를 냅니다.
Karpathy는 이 균형을 맞추는 걸 "예술이자 과학"이라고까지 표현합니다. (무한 삽질하면서 갈아 엎다보면 공감이 가는 말입니다 ㅋㅋㅋ)
그래서 결국 AI를 잘 쓴다는 건, 질문을 잘 쓰는 게 아니라 맥락을 잘 설계하는 겁니다.
그런데 맥락이란 게 매번 새로 만드는 게 아니라, 평소에 쌓아둔 정보에서 나오거든요.
그래서 평소에 구축해둔 세컨드브레인이 최고의 컨텍스트 엔지니어링 툴이 되는 겁니다. (갑자기 세컨드브레인 권유일까요?😅 진심으로 그렇게 생각합니다!)
+1 for "context engineering" over "prompt engineering".
People associate prompts with short task descriptions you'd give an LLM in your day-to-day use. When in every industrial-strength LLM app, context engineering is the delicate art and science of filling the context window with just the right information for the next step. Science because doing this right involves task descriptions and explanations, few shot examples, RAG, related (possibly multimodal) data, tools, state and history, compacting... Too little or of the wrong form and the LLM doesn't have the right context for optimal performance. Too much or too irrelevant and the LLM costs might go up and performance might come down. Doing this well is highly non-trivial. And art because of the guiding intuition around LLM psychology of people spirits.
On top of context engineering itself, an LLM app has to:
- break up problems just right into control flows
- pack the context windows just right
- dispatch calls to LLMs of the right kind and capability
- handle generation-verification UIUX flows
- a lot more - guardrails, security, evals, parallelism, prefetching, ...
So context engineering is just one small piece of an emerging thick layer of non-trivial software that coordinates individual LLM calls (and a lot more) into full LLM apps. The term "ChatGPT wrapper" is tired and really, really wrong.
인맥이 자산이라고 하는데,
관리하는 사람은 거의 없습니다.
Claude Skill 하나면
AI가 내 인간관계를 기록하고 기억해줍니다.
누굴 만났는지, 무슨 얘기를 했는지.
이번 달에 누구와 연락했는지,
누구에게 소홀했는지.
인간관계에 전략적 조언도 주고, 인맥 현황을 대시보드로도 보여줍니다!
저도 옛날엔 그랬습니다.
업무는 Claude한테 다 넘기면서,
인간관계는 머릿속에만 있었어요.
인맥만큼 중요한 자산이 없는데도 말이에요.
그래서 직접 만들었어요 ㅋㅋㅋ
개인 인간관계 CRM.
Claude 데스크톱만 있으면 돼요.
Claude Cowork Skill로 만들었어요.
내 로컬에서 마크다운 파일로 관리됩니다.
"오늘 재현이 형 만났어."
한 마디면 기록 끝.
6개월 후에 Claude한테 물어봐도 다 나옵니다!
지금 배포할 수 있게 다듬는 중이에요.
받고 싶은 분들 댓글 남겨주세요.
완성되면 바로 공유할게요!
🤖Claude Code로 창업하기 - Project SHIPIT Pre-Launch (2)🔥
"Claude Code로 창업하기. 사업자등록 신청 완료🙀"
-Claude Code 로 창업하기로 처음 마음 먹었던게 지난 2월 11일이네요. 오늘 사업자등록 신청까지 하고나니 기분이 이상합니다.ㅋㅋ 진짜 이래도 되나 싶고요. 어쨋든 끝이 어딘지 궁금해서 가보려고 하고 있습니다.
-랜딩페이지도 최초에 프롬프트 한방에 생성했던 버전과는 많이 달라졌습니다. 한땀한땀 고친거라 그래도 많이 세련되졌다고 생각합니다ㅋㅋㅋ😅 개인적으로는 Dark-warm 테마에서 눈이 제일 편하네요.
-원래 목표는 지난주 런칭이었는데, 며칠만 더 손보려고 합니다. 대화 하면 할수록 아이디어가 계속 떠올라서 ㅋㅋ
-그래서 지난 글 올리고 나서도 계속 달렸습니다. 지난 한 주 동안 진행한 작업들입니다.
✅SmartForm 역설계 시스템 개편: 테마 랜덤 -> 테마 선택
✅데이터 스키마 CSV 통일 : CSV 업로드 → 내 데이터 활용
✅소스코드 ZIP 다운로드 기능 구현(Hetzner)
✅구글 Auth 로그인 연동(Supabase+RLS)
✅브라우저 전용 -> 데스크톱 앱 확장 (Tauri, Win/Mac)
✅Vercel 자동 무료 배포(언제든 접속할 수 있는 URL)
-클로드 맥스 x20 다 쓰고 새로 들어온 400불 중 270불을 더 태우고 GPT 프로도 겁나 괴롭혔습니다 ㅋㅋㅋ
-가장 큰 과제였던 Scale-up을 위해서 병렬로 여러 빌드를 돌리다보니 노트북 메모리가 버텨주질 못했습니다. 빌드 하나 하나가 AI가 직접 코드 짜고, 컴파일하고, Puppeteer로 직접 열어서 버튼 다 눌러보는 과정이라 메모리를 꽤 먹더라구요..그것도 많이..
-그래서 Hetzner에 서버를 올렸습니다. 16코어 32GB, 월 $60짜리입니다. 누가 얼마나 들어와서 쓸지 조차도 모르는 상황에 ㅋㅋㅋ😅
-물어보니 어지간한 작은 LLM 정도는 돌릴 수 있는 스펙이더라구요? 지금 최대 20개 빌드를 병렬로 동시에 돌리는데도 메모리에 여유가 넘칩니다 ㅋㅋ
-그리고 빌드 결과물을 직접 열어보면서 이상한 것들을 하나씩 잡기 시작했습니다. 1빌드 15분 컷 목표를 수정할 수 밖에 없게 되었습니다.
-겉보기엔 그럴싸했는데, 버튼을 눌러도 아무 반응이 없는 앱들이 있더라구요. 서브페이지에 직접 들어가면 데이터가 텅 비어있는 것도 있었고, 시드 데이터 로더를 메인 페이지에서만 호출한다던지 등등.
-UX QA를 충분히 했다고 생각했는데 시늉만 했더라구요. 결국 빌드당 QA 시간이 5-15분 추가됐습니다.
-어쨋든 전부 고쳤고,
-남은건 멀티에이전트 빌드 파이프라인 안정화로 QA PASS 율 90% 이상 맞추기입니다. 거의 다 온 것 같습니다.ㅋㅋ
-만약 빌드가 실패한 채로 timeout 되어 서빙되더라도, 소스코드 zip을 다운받고, 정확히 어느 파일 어느 라인 어느 코드를 고치면 되는지를 상세하게 작성한 QA Handoff를 다운 받을 수 있도록 세팅하고 있습니다.
-지금은 Next.js 기반 프론트엔드 웹앱 빌드 품질에 집중하고 있는 상태지만, 점차적으로 Native app 으로, 1인용 웹앱에서 다인용으로, SaaS로, +백엔드 풀스택으로, 확장해 나가 보려고 합니다.
-그동안 LLM의 성능이 더욱 올라와주길 기도하고 있습니다 ㅋㅋ
-프리 런치 기간에는 모든 이용자에게 다음의 것들이 제공됩니다.
✅개인용 3D Agent Office/무료 빌드 2회/소스코드 ZIP파일/QA Handoff/Vercel URL(24/7 웹 호스팅)
-지난 주 미리 연락주신 분들에게는 무료 빌드 5회 제공해드릴 예정입니다.
-댓글/DM 미리 주신 분들은 조금만 기다려주세요..!