앤트로픽에서 분기별 인당 LOC 를 발표했길래 우리도 똑같이 계산해보니 비슷하게 8.x 배 나오더라.
LOC caveat 도 왜 붙인건지 알것 같아서 피식 했는데,
사실 이쯤되면 메트릭이 어쩌고가 문제가 아니라 정신이 없다.
이 속도에서의 커뮤니케이션을 큰 규모로 어떻게 해결 했는지가 신기함.
유명한데서 LLM 추론에 TP=2 로 초선형 스케일링을 하는 글을 쓰길래 와 뭘하면 저렇게 할 수 있지 나만 모르는건가? 구경 갔는데.. 2x5070 에서 VRAM 늘어서 오프로딩이 줄어든거였다;
옛날 같으면 긱들이 하나라도 보였을것 같은데 요즘 다들 둥글둥글 혹은 저는 친절한 AI assistant 노잼이네.
NVIDIA 최신 컨슈머용 GPU 구매자들도 이번 RTX Spark 출시의 수혜자 같음.
요즘 데이터센터용 GPU 지원이 우선시돼서 SM12x 계열(Blackwell 이지만 RTX 계열이나 DGX Spark 등)은 지원이 밀리곤 하는데,
같은 아키텍쳐를 쓰는 생태계가 커지는건 좋은소식.
deepseek 급 오픈모델인데,
모델이 개선되며 per-harness gap 이 줄어든 차트가 흥미롭다.
사실 이런게 예전부터 하던 고민의 원인이기도 하다.
장기적으로 보면 harness 의 유용함이 빠르게 풍화됨.
그래도 해야하는데 그럼 어디를 힘주고 어디를 힘빼야 할까?
https://t.co/DJMIaxCoO1