👩🏻💻 Claude Code / Cowork 어떻게 다르게 써야 할까
> PM 기술 스택 + 새로운 스킬 + AI 세상에서 살아남자..
Cat Wu의 인터뷰 후반부에서 나온 얘기인데, 생각보다 구체적이고 실용적인 내용이 많았어요.
Claude Code, 데스크톱, Cowork. 세 가지 제품이 있는데 뭘 언제 쓰는지 헷갈리는 사람이 많죠.
그녀가 알려준 기준은 단순했어요.
"결과물이 코드라면 Claude Code나 데스크톱, 모바일을 쓴다. 코드가 아닌 것이라면 Cowork를 써요."
Claude Code CLI는 가장 파워풀한 선택지지만, 로컬 환경에서만 동작하죠. 모바일��나 웹에서 시작하면 이동 중에도 작업을 킥오프할 수 있습니다.
데스크톱은 프론트엔드 작업에서 특히 유용하구요. 웹앱을 만들고 있다면 Preview 기능을 활용해 실시간으로 확인하면서 작업하는 게 좋음요.
또 데스크톱은 일종의 컨트롤 플레인 역할을 해요.
CLI 세션, 데스크톱 세션, 웹/모바일에서 시작한 작업까지 한 화면에서 볼 수 있어서 여러 작업을 동시에 돌릴 때 특히 유용하죠.
↓
Cowork를 처음 시작한다면, 제일 먼저 해야 하는 건 데이터 소스 연결.
Slack, Gmail, Google Calendar, Google Drive. 이 네 가지가 기본 세팅!
Cowork가 잘 작동하려면 맥락이 있어야 하는데, 이 소스들이 없으면 제대로 된 결과를 내기 어렵다고 합니다.
그녀의 사례가 인상적이었는데.. Code with Claude 컨퍼런스 발표 슬라이드를 만들어야 했는데, Cowork에 "이런 이야기를 하고 싶어요"는 내러티브를 주고 Google Drive, Slack을 연결해뒀더니 밤새 알아서 작업해서 아침에 20페이지짜리 덱을 만들어놨다고..
트위터에서 출시 내용을 훑고, 팀 채널에서 데모를 찾고, PMM이 정리해둔 초안도 읽고, Anthropic 디자인 시스템에 맞게 슬라이드를 만들었죠.
"디자이너가 만든 것처럼 보였어요!!"
직접 만들었다면 몇 시간이 걸렸을 작업을 피드백 한 번 주고 끝냈다는 것.
↓
그렇다면 그녀 본인의 PM 툴 스택은 어떨까요.
"거의 Claude Code와 Cowork 두 가지가 전부예요."
Anthropic은 Slack을 회사 OS처럼 씀. 실시간 업데이트와 커뮤니케이션 인프라로 쓰고, Slack 봇도 자체 제작해서 씀.
그리고 재미있는게 있는데.. 내부 도구를 직접 만드는 문화가 자리잡고 있다는 것.
Claude Code가 커스텀 앱을 만드는 장벽을 낮추면서, 완벽하게 맞지 않는 범�� SaaS 대신 딱 맞는 내부 도구를 직접 만드는 흐름이 생겼다고 합니다.
영업 담당자가 만든 예시도 기억에 남네요.
반복적으로 만들던 고객 맞춤 데크를 자동화하는 웹앱을 직접 빌드했는데, Salesforce와 Gong에서 고객 정보를 당겨와서 HIPAA 준수 여부, 사용 중인 플랫폼(Bedrock인지 Vertex인지...)에 따라 슬라이드를 자동 조합했다고 합니다.
수동으로 30분 걸리던 작업이 몇 초로 줄었다고!
↓
토큰을 가장 많이 쓰는 팀이 어딘지도 물어봤는데..
엔지니어링이 1위인 건 당연하고, 2위가 Applied AI 팀이라고 해요.
고객이 API를 도입하는 걸 돕는 팀인데, 고객 프로토타입을 Claude Code로 빠르게 만들고, 고객 미팅 히스토리와 액션 아이템은 Cowork로 관리합니다.
흥미로운 루틴은,, Applied AI 팀이 하루에 고객 미팅이 5~10개 있을 때, 전날 밤에 Cowork에게 "내일 미팅 목록, 각 고객이 요청한 것들, 이전 미팅 액션 아이템" 정리를 시키고요.
아침에 브리핑 문서가 준비돼 있는 것.. 여기다 고객이 물어본 기능 출시 예정일 같은 내용도 Slack에서 검색해서 추가합니다.
토큰 비용이 엔지니어 연봉보다 많아지는 시대가 올 거냐는 질문에, "아직 그 수준은 아니지만 모델이 좋아질수록 퍼센티지가 올라가고 있어요" 이렇게 얘기해줬죠.
↓
AI 기업에서 PM에게 새로 필요한 스킬은 무엇일까.
그녀의 답 = "한 달 뒤 제품이 어떤 모습이어야 하는지 정의하는 능력"
모델 역량이 빠르게 바뀌고, 유저 행동도 같이 바뀌기 때문.
어려운 지점은 AGI 과몰입을 경계하는 것.
미래에는 모델이 알아서 다 할 테니 텍스트 박스만 있어도 된다는 생각은 옳지만, 지금 이 모델의 최대 역량을 끌어내는 방법을 고민해야 한다는 겁니다.
유저가 어디서 막히는지, 어떻게 하면 모델의 강점을 살리고 약점을 보완할 수 있는지를 설계하는 게 지금 PM의 ���할.
이 스킬을 기르는 방법으로는 세 가지를 꼽았어요.
첫째는 모델과 직접 대화를 많이 해보는 것.
모델이 실수했을 때 왜 그랬는지 물어보면 시스템 프롬프트의 어떤 부분이 혼란을 줬는지 알 수 있다고 했음.
둘째는 모델 피드백을 잘 주는 사람 5명을 찾아두는 것.
모든 피드백이 같은 가치를 가지지 않음. 모델이 어디서 잘하고 어디서 부족한지를 정확하게 짚어내는 사람이 따로 있음.
셋째는 Eval을 직접 만들어보는 것.
↓
Eval이 왜 과소평가받는가.
그녀의 말로는 "Eval은 팀이 목표가 무엇인지, 지금 얼마나 왔는지, 무엇이 빠졌는지를 수치로 볼 수 있게 해줍니다."
수백 개가 아니어도 돼요. 잘 만든 Eval 10개가 팀 전체의 방향을 잡아준다는 것입니다.
그녀 본인도 기능이 충분히 정의되지 않았다고 느낄 때 직접 Eval을 만든다고 했어요.
"이 5��� Eval 중에 성공하는 것, 실패하는 것, 그리고 성공률을 높이기 위해 쓴 프롬프트"
이렇게 정리해서 팀에 전달하는 방식..
PM이 Eval을 쓴다는 건 "성공의 ���준을 내가 직접 정의한다!!!" 이런 의미예요. 그게 왜 중요한지를 이제는 알 것 같습니다.
↓
Claude Code와 Cowork의 비전은 어떠할까나..
중요한건 단일 태스크의 성공률을 높이는 것!
지금은 하나의 태스크를 잘 완료하는 것이 기준이지만, 모델이 좋아질수록 동시에 여러 태스크를 돌리는 게 자연스러워지죠.
2025년 말부터 멀티 코딩이 많아졌고, 지금은 수십 개의 Claude를 동시에 돌리는 사람도 생겨났어요.
그 다음 단계는 수백 개를 동시에 돌리는 것이고, 이 시점부터는 로컬에서 다 처리할 수 없어서 원격 실행 인프라가 필요해져요.
그래서 지금 Claude Code 팀이 집중하는 건 세 가지!
첫째, 수백 개의 태스크를 어떻게 관리할 것인가.
둘째, 에이전트가 스스로 결과를 완벽하게 검증해서 사람이 빠르게 신뢰하고 머지할 수 있는 구조.
셋째, 피드백이 다음 실행에 자동 반영되는 셀프 개선 루프.
한 번 쓴 피드백이 다음 모든 실행에 적용되면, 자동화의 품질이 쌓인다는 개념임.
↓
AI 중심 세상에서 성공하기 위한 조언을 물었어요.
"반복적으로 하고 있는 일을 발견할 때마다, AI로 ��동화할 수 없는지 생각해보세요."
대부분의 사람에게는 좋아하는 창의적인 업무와 싫어하는 반복 업무가 공존하잖아요?
AI가 반복 업무를 처리하면 그 시간을 창의적인 일에 쓸 수 있게 되는거죠.
구체적인 순서는 이렇게 제시했어요.
반복 업무를 찾아서 Claude Code나 Cowork에 넘기고, 성공률이 높아질 때까지 반복하고, 그렇게 생긴 20%의 여유를 팀이나 회사에서 아직 아무도 못 하고 있는 일에 쓰라는 것..
↓
마지막으로 95% 자동화가 충분하지 않은 이유.
"자동화가 100% 작동하지 않으면, 그건 자동화가 아닙니다."
95%로 포기하는 사람을 자주 봤다고 했어요. 그 마지막 5%가 더 오래 걸리고 더 힘든 건 사실이죠.
하지만 그 5%를 완성하지 않으면 결국 믿고 맡길 수 없는 자동화가 되는 것!
그녀도 Gmail 인박스 제로 자동화를 가르치는 중인데, 아직 100%가 아니어서 여전히 손이 간다고 했어요. 자신도 이 조언이 필요한 사람이라는 것이죠.
자동화를 완성하는 데 드는 시간이 직접 하는 것보다 오래 걸릴 수도 있어요.
그럼에도 투자해야 하는 이유는 한 번 완성하면 그 다음부터는 신뢰하고 맡길 수 있기 때문이죠.
100%가 아닌 95% 자동화에 ��주하지 맙시다!
Most people say "build an AI agent."
Very few know what that actually means.
Here’s the real blueprint to go from idea → working agent 👇
1. Define the job
What problem are you solving?
Who’s the user? What does success look like?
2. Design the brain
Clear system prompt, role, instructions, guardrails
(This is where most agents fail)
3. Pick the right model
Speed vs cost vs intelligence
Don’t overpay for simple tasks
4. Add tools
APIs, databases, MCP servers, custom functions
Agents become powerful when they can act, not just answer
5. Give it memory
Short-term + long-term context
So it learns, adapts, and improves over time
6. Orchestrate everything
Workflows, triggers, retries, agent-to-agent communication
7. Build the interface
Chat, app, API, Slack bot
Make it usable, not just functional
8. Test + improve
Evals, latency checks, real-world feedback
Iteration is the real moat
💡 Truth:
An “AI agent” isn’t one prompt.
It’s a system.
And the people who understand systems…
are the ones building unfair advantages right now.
📌 Save this (you’ll need it when you build)
🔁 Repost for builders
➕ Follow @elora_khatun for practical AI breakdowns (no fluff) 🚀
All Paid Courses (Free for First 4500 People)
𝗣𝗮𝗶𝗱 𝗖𝗼𝘂𝗿𝘀𝗲 𝗙𝗥𝗘𝗘 (PART - 1)
1. Artificial Intelligence
2. Machine Learning
3. Prompt Engineering
4. Claude,Chatgpt,Grok
5. Data Analytics
6. AWS Certified
7. Data Science
8. BIG DATA
9. Python
10. Ethical Hacking
(72 Hours only )
To get-
1. Follow me to get DM
2. Like + RT
3. Reply " All "