🤖 Self-Correction Loops
> 모델이 스스로 고치고 기억하게 만드는 시대로...
Anthropic에서 진행한 실험들은 놀랍네요.
특히 Mythos-class 모델.. Claude Fable 5 을 다루는 방식이 이전과 확연히 달라졌다는 점이 인상적이었죠.
직접 프롬프트를 잘 다루는 것보다, 자기 교정 루프,, self-correction loop 와 세션 간 메모리를 설계하는 것이 훨씬 더 중요해졌습니다!
↓
Self-Correction Loops
Fable 5는 피드백이 주어지면 스스로 고치는 능력이 뛰어나다고 합니다.
Claude Code의 /goal이나 Claude Managed Agents의 Outcomes 같은 장치가 그 역할을 해주고요.
중요한건 모델이 자신의 출력을 스스로 평가하는 게 아니라, 별도의 verifier가 독립적인 맥락에서 채점한다는 점이었어요.
자기 비판은 의외로 약하고, 외부에서 명확한 기준을 제시할 때 훨씬 더 잘 움직인다는 거죠.
Parameter Golf라는 ML 엔지니어링 챌린지에서 Fable 5는 Opus 4.7보다 약 6배 더 나은 개선을 이끌어냈다고 하네요.
작은 파라미터 조정이 아니라, 구조적인 변화를 시도하고, 실패에서도 회복하는 모습을 보였다고!
↓
Memory Across Sessions
세션 간 메모리.. 이것도 눈여겨 봐야해요.
Fable 5는 이전 세션의 결과를 단순히 저장하는 데 그치지 않고, 아래 과정을 꽤 잘 수행했다고 해요.
1. Fail → 실패를 문서화
2. Investigate → 왜 실패했는지 파악
3. Verify → 진단을 검증된 사실로 전환
4. Distill → 검증된 내용을 일반적인 규칙으로 압축
5. Consult → 다음번에는 규칙을 읽고 활용
이 과정을 끝까지 밟는 모델은 Fable 5가 유일했다는 점!
Sonnet은 1단계에서 멈추고, Opus는 3단계 정도까지 가지만 검증률이 낮았다고 합니다.
결국 모델이 '기억'하는 것이 아니라 우리가 모델에게 기억할 수 있는 구조를 주는 것.. 이게 중요해요.
↓
루프가 아무리 정교해도, 결국 중요한 건 두 가지예요.
- Verification은 여전히 외부에서 이루어져야 한다.
- Memory는 디스크에 있어야지, 컨텍스트 안에만 있으면 안 된다.
그리고 한 가지 더.
모델은 잊지만, 우리가 남긴 기록은 잊히지 않는다!
이 문장이 어쩌면 지금 우리가 해야 할 일의 본질을 가장 잘 말해주는 것 같기도 하네요.
모델이 스스로 움직일 수 있는 목표와 기억의 구조를 설계하는 것.
그게 지금 Loop Engineering이 조금 더 깊어지는 지점인 것 같습니다.
Tesla AI chip design engineering reviews are so great! Team is awesome.
Our AI6 chip might set a record for most amount of usable intelligence from a wafer when factoring in yield.
일반 차보험에서 레모네이드로 변경. 프리미엄이 너무 싸서 안바꿀수가 없었음. 이전 보험에서는 보상 조건이 그냥 평균적인 수준이였는데 레모네이드로 바꾸면서 보상액을 전부 최고 수준으로 올렸음. 대물 보상도 50만불까지 올렸는데 보험료가 25% 저렴함. 그리고 가입 과정도 채팅 형식으로 되어 있어서 아주 간편.
텍사스에는 아직 FSD 할인이 적용되지 않았는데도 이 가격인데, 적용되면 얼마나 싸질지? 자동차 보험에 혁명이 온듯. $TSLA
컨슈머 FSD는 로보택시와 달리 Supervised 만으로도 상당히 매력적이다. 왜냐하면 실질적으로 Supervised 해야할 순간은 주행의 처음과 끝 정도. 그나마도 저속에 사람 수준의인지 능력(사인, 텍스트, 수많은 수신호 등) 및 판단 능력이 필요한 상황 정도만.
이 부분은 솔직히 텍스트를 읽을 수 있는 능력과 그럭 보이스 컨트롤과 같은 다른 수단이 있어야 보다 쉽게 해결될 수 있는 부분들로 보인다.
그러나, 이 외에는 거의 개입할 일이 없다. 따라서, 감독의 강도를 좀 낮춰줘서 보다 자유로움만 느낄 수 있게 해줘도 많은 사람들이 만족하며 사용할 수 있을 터.
그렇다면 필요한 것은 보다 많은 사람들이 경험하는 것. 그러기 위해서는 지역 커버리지가 넓어져야 하고 무리하게 Unsupervised 로 지역 커버리지를 넓히는 것보다 Supervised 로 커버리지를 넓히면 사고 리스크도 좀 더 덜 수 있고 신규 사용자에게도 좀 더 안정감을 줄 수 있다. 정 안되면 사용자가 개입하면 되니깐. 또한, Supervised가 규제 승인에도 보다 용이하다.
테슬라는 이 때문에 Unsupervised 로 급하게 전환하는 것 보다 Supervised 로 빠르게 저변확대하는 쪽으로 전략을 실행 중인 것으로 보인다.
이러한 전략 때문에 컨수머 FSD의 Unsupervised 가 좀 늦춰지더라도 Supervised 에서 더 많은 롱테일 케이스를 발굴하여 주행의 처음과 끝에 보다 완벽한 차량 컨트롤을 할 수 있어 오히려 더 도움이 된다.
Unsupervised 는 분명히 잘못된 판단에도 사고는 피할 수 있는 능력이 있을 것이다. 그러나, 보다 나은 판단 능력을 갖추기 위해선 이런 부분에서도 개입이 필요하다. 그래야 더 세련된 판단 능력을 갖출 수 있다.
따라서 컨수머 FSD는 Unsupervised 에 너무 집착할 필요가 없다. 중요한 것은 더 많은 사람이 경험할 수 있도록 지역이 확대되는 것이 훨씬 중요하다.
그런 측면에서 유럽 국가들 연이는 FSD 승인은 매우 호재다.
$TSLA 🇳🇱
테슬라, FSD(Supervised)가 유럽 네덜란드 공공도로에서 인간 운전자보다 3.5배 더 안전하다고 공식적으로 발표
• 3.5x Fewer Collisions
• 14.9x Fewer Automatic Emergency Braking Events
• 8.8x Less Harsh Acceleration
• 7.3x Less Harsh Braking
• 8x Fewer Hard Swerves
수집 데이터 기간은 네덜란드 최초 승인인 4월 10일부터 6월초인 약 2개월 기간 동안임
Samsung, $NVDA
[속보] 삼성, 전체 관계사 모든 업무에 외부 생성형 AI 도입
삼성이 전체 관계사 모든 업무에 인공지능(AI)을 전면 도입하는 등 'AI 대전환'에 나섭니다.
전체 사장단을 대상으로 첫 AI 집중 교육을 실시하고 사별로 AI 전담 조직도 신설합니다.
삼성은 AI 시대를 주도하고 도약의 기회를 선점하기 위해 사장단과 임원, 직원들의 일하는 방식과 조직문화 등 기업 DNA 자체를 AI 중심으로 탈바꿈하는 대혁신을 추진한다고 9일 밝혔습니다.
각사 최고경영자(CEO)가 8대 업무(개발·구매·제조·물류·마케팅·판매·서비스·경영지원) 프로세스에 AI를 적용해 경영 혁신을 직접 주도하면서 AX(인공지능 전환)를 통한 혁신 기업으로의 대전환을 추진할 예정입니다.
이재용 삼성전자 회장은 올해 신년사에서 "일하는 방식과 조직 DNA를 송두리째 바꿔야 한다"며 "연구개발(R&D)부터 생산·마케팅·지원 등 모든 업무 밸류체인에 AI를 접목해야 한다"고 말한 바 있습니다.
속보) 테슬라 옵티머스 V3 양산 주문 소식!
연말까지 2000대 증산이다!
테슬라 주가도 연말까지 떠억상이다!
✅ Q3 주산 50-100대
✅ 연말까지 2000대 이상으로 증산
✅ 휴머노이드 로봇 산업의 0에서 1로의 양산 전환점이 이미 확립됨!
(본문)
이번 주 초, 테슬라 $TSLA가 핵심 공급업체에 옵티머스 V3 최초 명확한 양산 주문을 하달했다는 소식이 전해졌으며, 프로젝트가 PPA 프레임워크 단계에서 SOP 양산 준비 단계로 공식 진입했다
시장 초점은 거대한 내러티브에서 벗어나, 확실한 점유율을 갖추고 실적을 실현할 수 있는 공급망 핵심 자산의 재평가로 전환될 전망이다!
옵티머스가 가속하며 이륙 중이다, 이 파도 같은 이익을 위해 준비됐나? 🤖💰
출처: AlphaPai
#테슬라 #옵티머스