Claude Fable 5는 돌종벤치 100점을 맞음.
그렇다면 엔지니어링 업무에서 가장 중요한 도면 처리 능력은 어떨까? 아직 2D도면으로부터 3차원 형상을 인식하는 능력은 부족하다.
Claude Fable 5 현존하는 최고의 모델. 2D도면/3D모델링 능력 테스트 https://t.co/5qjNlrR5IN
비전기능이 없지만 Reasoning에서는 꽤 괜찮은 성능을 가지고 있는 것 같다. 엔지니어링 업무능력을 평가하는 돌종벤치에서 14문제 기준 96점을 받았다.
엔비디아의 최대 크기 모델 Nemotron-3-Ultra 550B-A55B 엔지니어링 업무 능력 테스트 https://t.co/Ob1n9aEGOF
중국은 오픈웨이트모델 쪽으로 활발한 움직임이 있다.
AI연구기업 NexAGI가 Qwen3.5-397B 모델을 개선해서 Nex-N2-Pro를 내놨다. 돌종 벤치에서는 QWen3.5-397B을 앞섰다.
새로운 모델 Nex N2 Pro Qwen3.5-397B을 개선한 모델. 엔지니어링 업무 능력 테스트 https://t.co/p5c3LQ0cSe
알리바바는 모델이 워낙 많다보니 관리하기도 복잡할 것 같다. 이번에 출시한 Qwen3.7-Plus는 멀티모달 에이전트를 지향하고 있지만 탑클래스 모델들에는 못미친다. 클로즈드 모델
Qwen3 7 Plus 알리바바의 멀티모달 에이전트 모델. 엔지니어링 업무 능력 테스트 https://t.co/L3CymgxiuY
Gemini 3.5 Falsh가 돌종벤치 100점을 맞았다. 마이너 모델도 100점을 맞았으니 무제를 업그레이드 해야겠다. 모델의 발전속도가 너무 빠르다.
Gemini 3.5 Flash. 마이너 모델 최초로 돌종벤치 100점 + 놀라운 속도 https://t.co/DV1mjK4NCL
서소문고가교량에 2008년부터 2019년까지 10년이 넘게 미장판이 붙어있었습니다. 수분이 침투하면 미장판은 거더 열화를 촉진시킬 수 있습니다. 안전 vs 미관. 당연히 안전이죠.
서소문고가 붕괴 사고 화장판이 거더 열화 촉진했나? (ft.토목구조기술사) https://t.co/HjeuCuUuop