Claude로 겉보기에 번지르르한 앱 뚝딱 만들어서 바로 시장에 던지는 양산형 빌더들이 법적 시한폭탄을 마주하는 중임. SQL 인젝션이나 .env 파일 유출 같은 뼈아픈 백엔드 공백을 완전히 방치했다가 청구서 폭탄이나 소송으로 직행하는 판임. AI가 코드를 초고속으로 짜준다고 인프라 보안과 규격 검증이라는 필수 노가다까지 건너뛸 수는 없음.
연구실 대학원생이 아주 기가막힌 비유를 해줬습니다.
부패와 발효의 차이와 똑같습니다.
같은 LLM 결과에 대해서
쓸모가 없으면 hallucination이라고 하고
쓸모가 있으면 inter/extrapolation이라고 부릅니다
쓸모가 없는데 재밌으면 creative라고도 합니다
제가 웬만해선 필독, 무조건, 100% 같은 단어는 자주 사용하지 않으려고 하는데요,
이 아티클은 무조건 필독하셔야 합니다.
아마 많은 분들은 앤트로픽과 오픈AI의 관계를 잘 모르실 것이고 또 그들이 추구하는 철학과 그들이 현재 미국 증시에 미치고 있는 막대한 영향에 대해 깊히 알기 어려우실 거라 생각합니다.
저를 오래 보신 분이라면 알겠지만 저는 오픈ai를 샘 알트만 때문에 싫어합니다.
챗봇도 chatGPT는 사용하지 않은지 오래 됐습니다.
이번에 오픈ai가 투자규모 축소를 발표했는데, 생각보다 빠른 시간에 일이 터질지도 모르겠네요.
I have built the future
I'm now running 3 of the most powerful AI models in the world on my desk, completely privately, for just the cost of power.
3rd 512gb Mac Studio is in (Apple reached out and lent me the third one! Thanks Apple!)
Here are the models I'll be running:
• Kimi K2.5 (600gb across all 3 studios via EXO labs)
• MiniMax 2.5 (120gb on one studio)
• Qwen 3.5 (220gb on one studio)
• GOT OSS 120B Heretic (60b on one studio- completely uncensored 😈)
3 ultra powerful models coding, writing, researching, reading your posts, 24 hours a day. 7 days a week. Nonstop.
Running across 4 OpenClaws on 3 Mac Studios and a Mac Mini
A few use cases I have set up:
• Kimi K2.5 reading feature requests for Creator Buddy and building out the feature requests autonomously. My own personal product manager
• MiniMax 2.5 reading Reddit all day, looking for challenges to solve. Then building prototypes for me to review every morning. All autonomously.
Qwen 3.5 hitting the X API every hour to see top trending posts in AI and vibe coding. Turning those into video scripts for me to review hourly (this has already built me one script with over 100k views on YT)
Unlimited economic power just sitting there. No cloud APIs. No crazy API bills. No tech executives reading my logs. Totally customizable and private.
This is the future. I'm just showing it to you before it arrives
🍌 Nano Banana Pro 레시피 북
> 159페이지 껴~~
와 감동.. 정말 다양한 케이스와 프롬프트를 담고 있는 레시피들이 공유되었네요.
https://t.co/LVMDC2vLMI
사실 프롬프트는 정답이 없습니다. 제공된 자료들을 참고해서 다양한 시도를 해본다면 다채로운 결과물을 얻으실 수 있습니다.
이렇게 공유해주셔서 감사드리네요~~
💬
이 책은 혼자 만든 결과물이 아닙니다.
각자의 자리에서 바쁘게 살아가면서도 기꺼이 참여해준 30여명의 크리에이터들이 본인이 맡은 카테고리에서 최선을 다해 사례를 공유해주었습니다.
완벽하지 않을 수도 있지만, 그래서 더 살아있는 자료라고 생각합니다.
- 레시피 북 프롤로그에서..
Harvard's just open-sourced their ML Systems textbook. it's extremely practical for not just learning how to build and train models, but to build production systems (the skill that actually matters). topics are cool af:
> building autograd, optimizers, attention, and a mini-pytorch from scratch to truly learn how an ML framework runs. (i love this the most)
> basics of DL, batch sizes, precision, model architectures, and training
> ML performance optimization, HW acceleration, benchmarking, efficiency
so this is not just an intro to machine learning, it's the full package from the beginning to the actual end. right now you can read the book and access the code for free. this is one of the best books I've seen dropping in 2025, so don't sleep on it.
here's the repo (you can find the book link there): https://t.co/5OEWPBNaJp
ChatGPT의 메모리 시스템을 리버스 엔지니어링한 분의 글을 읽었는데, 벡터 DB + RAG로 하겠지 라고 생각했던게 아니라는걸 알게 됨.
결론부터 말하면, ChatGPT는 거의 RAG를 안 쓴다.
벡터 임베딩도, 유사도 검색도, 리트리벌 비용도 거의 없다.
대신 훨씬 더 단순하고, 훨씬 더 영리한 4단계 계층만으로 모든 걸 해결한다.
1. 세션 메타데이터 (일시적)
너가 지금 모바일인지 데스크톱인지, 다크모드 켜져 있는지, 화면 크기, 시간대, 구독 등급, 심지어 최근 사용 패턴까지 전부 실시간으로 주입됨.
이건 영구 저장 안 하고, 세션이 끝나면 바로 버림. 덕분에 "지금 새벽 2시에 폰으로 물어보는구나" 하고 답변 길이랑 포맷을 알아서 조절함.
토큰 낭비 없이 환경 적응을 완벽하게 해냄.
↓
2. 명시적 장기 메모리 (최대 33개 사실)
이거 기억해줘~라고 한 거나, 대화 중에 중요한 사실을 모델이 제안하면 확인한 것만 저장됨.
이름, 직업, 목표, 취향, 진행 중인 프로젝트 정도. 그 이상은 안 넣음.
"모든 걸 기억해야 한다"는 착각 버렸고, 진짜 중요한 것만 골라서 넣는 것.. 이게 오히려 훨씬 깔끔.
↓
3. 최근 대화 요약 (약 15개)
이거 좀 흥미로움..
과거 대화 전체를 임베딩해서 검색하는 게 아니라, 그냥 미리 계산된 초경량 요약만 던져줌.
형식은 제목 + 타임스탬프 + 사용자 메시지 몇 줄 발췌. 어시스턴트 답변은 아예 안 넣음.
그러니까 "너 지난주에 뭐 물어봤더라?" 할 때 정확히 기억 안 해도, 대략적인 주제 흐름만으로도 충분히 이어갈 수 있음.
정확도 조금 희생하고 속도랑 토큰을 극한까지 아끼는 방향..
↓
4. 현재 세션 슬라이딩 윈도우
평범해 보이지만, 메시지 개수가 아니라 토큰 수로 제한 걸고,
한계 다다르면 오래된 메시지 날리면서도 2번과 3번은 계속 살아있음.
그래서 대화가 아무리 길어져도 장기 연속성은 끊기지 않음.
RAG의 집착은 그래.. 비효율적이지.
정확도 100% 챙기려고 매번 검색 돌리고, 임베딩 저장하고, 비용 올라가나 싶었는데,
OpenAI에서는 95%의 유저는 이 정도만 기억해도 충분하다라고 판단한 것.
결과적으로 속도는 빠르고, 토큰은 적게 들고, UX는 더 자연스럽게.. 좋구만...
you must read Harvard’s AI Research Experience if you’re a student/researcher. A free course book which covers the essentials and tips on doing research:
> VSCode, Git, Conda
> PyTorch, W&B
> AWS, colab
> LLMs and VLMs
> reading AI papers
> research progress and organization
PYTHON is difficult to learn, but not anymore!
Introducing "The Ultimate Python ebook "PDF.
You will get:
• 74+ pages cheatsheet
• Save 100+ hours on research
And for 48 hrs, it's 100% FREE!
To get it, just:
1. Like & RT
2. Reply "Python"
3. Follow @Ronycoder [MUST]
PYTHON is difficult to learn, but not anymore!
Introducing "The Ultimate Python ebook "PDF.
You will get:
• 74+ pages cheatsheet
• Save 100+ hours on research
And for 48 hrs, it's 100% FREE!
To get it, just:
1. Like & RT
2. Reply "Py"
3. Follow @Ronycoder [MUST]