요며칠동안의 젠슨 황 방한 행보를 보면, 현재뿐 아니라 앞으로도 대한민국 산업이 엔비디아의 AI 인프라에 대한 의존도를 더욱 높여가는 계기가 된 것 같다. 주요 대기업 총수들과의 잇단 만남에서 발표된 사업 규모도 결코 작지 않다. 이를 통해 국가 경쟁력을 안팎으로 키울 수 있다는 기대감도 있지만, 한편으로는 대등한 협력이 아닌 종속적인 관계로 굳어지는 것은 아닌가 하는 우려도 든다. 더더욱 투트랙 , 쓰리트랙 전략이 필요해 보이는데 아직은 시간이 더 걸릴 것 같고. 이러한 협력을 통해서 엔비디아는 셀러로써도 바이어로써도 지속적인 우위에 있을 것 같은데.
앤쓰로픽의 최근 블로그에서 언급하는 재귀적 자기 개선에 대해서 언급하면서 이로 인한 위험성과 이에 대비하고자 "검증 가능한 글로벌 중단체제 구축을 제안"하는 내용을 보면서 자기들은 할거 다하면서 갑자기 후발주자들에 대해서 사다리를 걷어차버리자고 말하는 것 같아서 불편하다.
재귀적 자기 개선에 의해서 인공지능의 지능이 경제와 온갖 생태계를 주도하고 인간이 이를 통제하지 못할 것에 대한 우려를 하는데 논리적 , 이론적으로는 그럴싸해보이지만 너무 공포마케팅 같다.
물론 이를 통해서 빠른 속도로 모델 개발이나 소프트웨어 개발의 속도가 급진전하고 그 비중이 커질 수는 있겠지만 임계점이 있기 마련일텐데 지능이 마치 무한 증식하는 것처럼 얘기하는 것은 아닌지 또는 이런 내용을 인용해서 과대 해석을 하는 것은 아닌가 싶다.
NSA가 엔트로픽의 Mythos 을 이용하고 있다고 하면서 전쟁부에서는 여전히 앤트로픽을 공급망 위험 요소로 지목하고 있다는 상반된 기사를 보면 한켠에서는 윤리적인 기업으로써 탄압받는 이미지를 가져가면서 다른 한편에서는 미정부, 국방부가 적극적으로 사용하고 있도록 꾸준히 협력하고 있다는 점에서 IPO를 앞두고 머리를 참 잘 쓰고 있구나라고 생각이 든다는.
OpenClaw Desktop 도 있는 것 같긴 하지만 이 녀석이 모든 환경을 제대로 지원하는 듯. 로컬도 되고 원격에 있는 에이전트 프레임워크도 접속할 수 있게 해놓았음. 모바일 환경이 아니면 굳이 텔레그램과 같은 메세지앱을 사용하지 않아도 될 듯.
Hermes Desktop
https://t.co/j8WdoYkWwi
마이크로소프트의 오늘 발표에서 나온 제품리스트. (제미나이가 도와줌)
자체 모델 MAI 를 얘기할 때 Humanist Superintelligence / Human First 를 강조
1. 자체 개발 AI 모델 (MAI 패밀리)
오픈AI 등 외부 모델 의존도를 낮추기 위해 마이크로소프트가 처음부터 자체 학습시킨 7가지 신규 모델(MAI) 라인업입니다.
MAI-Thinking-1: 심층적인 추론(Reasoning) 및 사고 능력에 특화된 중형(35B) 플래그십 AI 모델
MAI-Code-1 / MAI-Code-1-Flash: 깃허브(GitHub) 및 VS Code에 최적화된 고효율 코딩 전용 모델
MAI-Image-2.5 / MAI-Image-2.5-Flash: 텍스트-이미지 변환 및 정밀한 이미지 편집 작업을 수행하는 모델
MAI-Transcribe-1.5: 43개 언어를 지원하는 초고속 실시간 음성 전사(자막 변환) 모델
MAI-Voice-2 / MAI-Voice-2-Flash: 15개 이상의 언어와 다양한 목소리를 지원하는 합성 음성 생성 모델
2. 칩 및 하드웨어 (Silicon & Hardware)
AI 에이전트 구동 및 미래 컴퓨팅을 겨냥한 맞춤형 하드웨어와 실리콘 아키텍처입니다.
Majorana 2 (마조라나 2): 전작 대비 신뢰성을 1,000배 향상시켜 2029년 상용 양자 컴퓨터 구현을 목표로 하는 차세대 양자 컴퓨팅 칩
Surface RTX Spark Dev Box (서포스 RTX 스파크 데브 박스): 엔비디아(Nvidia)의 RTX Spark 칩을 탑재하여 현장에서 최대 1 페타플롭의 AI 연산과 128GB 통합 메모리를 제공하는 개발자 전용 고성능 디바이스
Project Solara (프로젝트 솔라라) 콘셉트 디바이스: 앱 중심이 아닌 '에이전트 중심(Agent-first)' 컴퓨팅을 위한 안드로이드 기반 OS 하드웨어 플랫폼
Solara 웨어러블 배지(Badge) 디바이스: 이동 중에도 에이전트와 상호작용할 수 있는 사원증 형태의 기기 (퀄컴 실리콘 탑재)
Solara 데스크 디바이스: 업무 흐름을 관리해주는 탁상형 디스플레이 동반 기기
DGX Station for Windows: 엔비디아 GB300 그레이스 블랙웰 울트라 슈퍼칩(Grace Blackwell Ultra Superchip) 기반으로 윈도우 환경에서 에이전트를 개발·구동할 수 있는 데스크사이드 AI 슈퍼컴퓨터
3. 소프트웨어 및 AI 에이전트 프러덕트
사용자의 업무를 자율적으로 돕고 개발 생태계를 지원하는 지능형 에이전트와 도구입니다.
Microsoft Scout (마이크로소프트 스카웃): 오픈소스 프레임워크인 OpenClaw 기반으로 구축되어 팀즈(Teams), 아웃룩(Outlook) 등과 연동되는 항상 켜져 있는(Always-on) 개인용 업무 AI 에이전트
Microsoft IQ 시리즈: 데이터와 지식을 에이전트에 긴밀히 연결해주는 의미론적 정보 통합 모델
Web IQ: 에이전트에 실시간 웹 컨텍스트를 가장 빠르게 그라운딩해주는 신규 기능
Fabric IQ / Foundry IQ / Work IQ
Rayfin (레이핀): 에이전트가 코드를 직접 작성하여 마이크로소프트 패브릭(Fabric) 환경에 프로덕션 백엔드 애플리케이션을 즉시 배포할 수 있도록 돕는 SDK 및 CLI 도구
Microsoft Execution Containers (MXC) SDK: 윈도우 내에서 AI 에이전트가 안전하게 격리된 상태로 실행(Local Sandboxing)되도록 권한 정책을 제어하는 오퍼레이팅 시스템(OS) 레이어 보안 솔루션
Azure HorizonDB: AI 앱 구동 및 대규모 데이터 처리에 최적화된 신규 PostgreSQL 기반 데이터베이스 (퍼블릭 프리뷰)
Frontier Tuning: 기업들이 자체 마켓에 맞게 도메인 맞춤형으로 고효율 AI를 가공할 수 있도록 돕는 기능
MS Build 2026
너무 많은 것을 한꺼번에 쏟아내서 정리가 안된다. (귀찮다) 마지막에 소개된 퀀텀칩 Majoran 2 빼고는 죄다 AI 얘기이긴 한데. 구글과 마찬가지로 AI Full Stack을 가진 회사 답다는 생각을 하지만. (칩셋부터 모델, 클라우드, 엣지까지 죄다 다 하는 몇 안되는 회사이긴 하지)
갑자기 새로운 폼팩터라면서Agent Gagdet 을 위한 OS라면서 Project Solara 를 소개하는데 뭐지? 하는 생각이 들기도 하고.
OpenClawWindows 를 보면서 AI 에이전트는 그냥 OpenClaw 인가 싶기도하고.
GTC가 열리고 있는 타이페이에서는 지금 Computex 2026이 같이 열리고 있는데 Intel, ARM, Qualcom 과 같은 칩벤더 CEO 키노트 공통 키워드는 에이전틱 AI.
한줄 요약
인텔은 뭔가 안타깝고 ARM은 뭐 다 우리 아키텍쳐 가져다가 만들고 있다고 자랑하고 퀄컴은 온디바이스 에이전틱 AI , CPU 역할이 매우 중요하다고 강조. ARM 키노트에 젠슨 황이 등장해서 열심히 썰을 풀고 감. AMD 키노트는 안보이네.
얼마전 본 구글 인프라를 총책임지고 있는 아민 바닷의 인터뷰 영상 내용도 그렇고 어제 젠슨 황의 키노트를 보면서 익숙했던 예전 웹 스케일 아키텍쳐의 시대에서 CPU/GPU/MEMORY/NETWORK 의 성능을 최대한 뽑아내기 위한 AI 스케일 아키텍쳐가 요구하는 바가 뭔지 좀 이해가 되었음.
그동안 관심을 크게 가지질 않았고 의례히 예전 아키텍쳐의 확장 정도로 생각했었는데 완전히 추구하는 바가 다른 거였음. 한마디로 하나의 목적을 위한 최대 성능을 가지는 슈퍼컴퓨터 만드는 일임.
데이터센터라고 하는 제한된 공간과 제한된 전력공급망하에서 최대한의 성능을 뽑아내서 학습과 추론을 해낼 수 있는 하이퍼스케일이 뭔지 살짝 이해되었다고나할까.
Google I/O 발표에서 밝혔듯이 구글은 전세계적으로 1M+ 노드 이상을 연결할 수 있는 기술과 인프라를 갖춰었다고 하고 , 장애시에 OCW(Optical Circuilt Switch)를 통해서 장애가 난 랙을 우회해서 다른 랙으로 컴퓨틀를 재분배해서 장애를 최소화하고 성능 저하를 최대한 막고 있다고 한다.
엔비디아 역시 사실상 수십개의 랙을 연결해서 하나의 AI 슈퍼컴퓨터를 만들어 내고 있는데 구글이나 엔비디아나 학습과 추론을 위한 전용 칩셋을 개발 , 통합해서 성능을 최대한 뽑아내고 있고. 다만 엔비디아의 경우 하나의 랙이나 노드가 장애가 날 때 어떻게 대응하는지에 대한 얘기는 없는데 비슷한 솔루션이 있지 않을까 생각된다.
흥미로운 점 중 하나는 엔비디아의 플랫폼은 수냉식이 기본인 반면 구글은 데이터센터가 지역사회의 주요 자산으로 인식하고 지역의 생태계 보호등을 이유로 일부 전력효율을 희생하더라도 수냉식만을 고집하고 있지 않다는 점이다.
- 슬라이드는 아민바닷 인터뷰 내용을 NotebooLM으로 만든 일부 장표.
MS 가 엔비디아와 협력해서 개발하는 PC (서피스, 델 등) 에 Copilot 이 아니라 OpenClaw 기반의 로컬 AI 에이전트를 개발중이라는 얘기. 정말 이쪽은 생각한 것보다 두세발 앞서 치고나가지 않으면 안되나보다. 이번주는 GTC 와 Build 행사에서 발표되는 내용을 잘 지켜볼 필요가 있겠다. Google I/O 에 이어 GTC, MS Build 이어서 바로 WWDC 까지 ... 빅테크쪽은 정말 정신없는 시즌이네.
https://t.co/RYgDjS4bfK
다음주 타이페이에서 열리는 GTC에서 엔비디아가 ARM+RTX5070급 모바일 GPU 통합에 128기가 LPDDR5X 메모리 지원하는 N1/N1X 칩셋을 발표할 수 있다는 얘기가 있구나.
PC 시장에 본격적으로 진출한다는건데 애플의 M시리즈의 대항마가 될 것인지 지켜볼 필요가 있겠네. 적어도 현재 인텔/AMD 계열로는 전성비를 따라갈 수 없는 상황이니 마이크로소프트나 PC/노트북 제조사들 입장에서는 희소식일 수도 있고.
인텔,AMD,퀄컴등은 긴장하고 있겠네. 사실 엣지단의 젯슨나노등도 있고 DGX Spark도 있는데 그 중간지점이 비어 있었으니 그냥 둘리가 없었을테고.
좀더 시간이 지나면 http 스택이 OS커널 안에 들어갔듯이 OS 커널레벨로 AI 모델이 임베딩될 가능성은 더 커졌다. 애플역시 이번 WWDC 2026에서 크게 업그레이드된 Siri를 발표할 텐데. MS 역시 이러한 하드웨어 기반에서 Copilot을 강화할 터.
PC벤더들은 Googlebook 도 만들어야하고 , 엔비디아 칩기반의 MS 윈도우 노트북도 만들어야하고. 이래서 ARM 홀딩스 주식이 오르는건가? MS 윈도우의 WSL이 이러한 칩셋을 제대로 지원해준다면 금상첨화일 듯.
ARM .vs. Apple Sillicon 시장에 엔비디아도 참전하면 어떤 일이 벌어질려나...
#아님말구
구글의 현재 시총이 대략 4조 7,300억 달러(약 6,300조 원) 라고 본다면 정말 대단한 몸값이긴 하다. 자체 AI 인프라를 제대로 갖추지 못하고 여기저기 의존하고 있는 회사라는 점에서 OpenAI 와 비슷한데,
이들이 만들어 낸 비지니스, 기술적 가치도 중요하지만 전 산업에 끼치고 있는 영향을 생각하면 이 정도 가치 인정을 받아도 될 것 같기도 하고.
셈이 안되는 숫자라...
https://t.co/I8jNx0oP5i
국책과제 예산이 늘고 기회가 많아지면서 여러 공공기관에 AI를 이용해서 응모/제안하는 건수가 크게 증가하면서 거꾸로 AI를 이용해서 이런 제안서 검토를 하게된다는. 우정사업본부뿐 아니라 다른 기관들도 개발해서 도입 예정이라는 얘길 들음.
https://t.co/uJiNmkF9lr
너무 당연한 건데 Hermes Agent 에서 여러가지 모델을 테스트해보다니 역시 Direct API 를 사용하는게 속도가 빠르다. codex , gemini cli 을 이용할 경우 확실히 latency 가 생긴다. OpenRouter 에서 공짜 모델을(프로모션을 위해서 일시적으로 공짜로 제공할 뿐 나중에 유료로 제공함) 써봤는데 일정관리나 메모 관리 , shell 에서 뭔가 설치하고 실행하는 것도 매우 느려서 그렇지 하긴 한다. hermes agent 의 다양한 skill 들이 잘 짜여져 있어서 그런것 같기도 하고. Direct API 를 사용하려면 중국 모델을 사용해야 하나 싶다. DeepSeek V4 가 1/4 가격으로 가격을 확 낮췄다고 하던데. 이런면에서 OpenRouter 는 기가막히게 길목을 선점한듯.
레거시 시스템에 대한 유지보수에 있어서는 여전히 AI보다는 인간 개발자의 역할이 더 중요하다고 생각했었다. 기능적인 요소보다 비기능적인 요소들이 많이 담겨져 있고 연결된 시스템간의 무결성과 안정성이 매우 중요하다고 생각했기 때문이다.
그런데 이 생각도 이젠 틀린 것 같다는 생각이다. 집에 있는 두대의 데스크탑 수준에서 구현, 배포해보는 수준이라서 상대적으로 쉽다고 생각했는데 사실 충분한 제약조건을 (하네스 엔지니어링?) 주고 기존 레거시코드에 대한 분석이 끝난 상태라면 이러한 인터페이스와 비기능적인 요소들도 AI를 이용해서 지속적으로 고도화하고 유지보수가 가능할 것 같다. 이런 일 안한지 15년도 더 넘어서 짐작일 뿐이지만.
남들이 어떻게 하는지에 대해서 구체적으로 모르고 더이상 개발자가 아니라서 최근 클라우드 컴퓨팅의 복잡도에 대해서도 체감하지는 못하지만 이것저것뭘 시켜보고 지켜본 입장에선 의외로 간단히 해낼 것 같다. 일부러 복잡한 프로젝트를 만들어서 테스트를 해볼 순 있겠지만 귀찮음
물론 최종적으로 인간 개발자의 확인과 승인이 필요하겠지만 중간에 적당한 스테이징 환경만 있다면 실환경 가기전에 충분히 테스트도 가능해보이고. 실서비스의 중요도에 따라서 감수해야할 위험도 있겠지 하지만 , 이미 비기능적인 요소들에 대해서도 문제없을 정도로 사전 검증을 해내는 것을 보면서 정말 아이디어만 있으면 되겠네라는 생각이 든다.
이런 생각을 하게 된 케이스들. 비개발자인 나도 이런 생각이 들 정도면 아마 현직 소프트웨어 엔지니어 입장에서는 더 많은 것을 체감하고 있을 것임.
1. Open API 쓰겠다고 하니 해당 API 에 대한 rate limits 을 스스로 측정해서 그 결과를 알려주고 알아서 세팅함.물론 이 정보를 통해서 개발자가 다시 지정할 수있음.
2. 개발환경과 배포환경이 틀릴 경우 로컬에 설치된 도커를 이용해서 배포환경 VM을 설치해서 배포 및 실행 검증까지하고 설치 프로그램까지 구현.
3. 로컬망에서 실행될 때와 외부망에서 실행될 때 웹 접근성을 진단해서 방어 코드 구현
최근 벌어지고 있는 일들을 잘 정리해주는 글이다. 특히 구글의 최근 개발자 컨퍼런스 발표 내용을 보면, 이제 '검색 엔진(Search Engine)'이라는 말은 더 이상 유효하지 않은 것 같다. 구글은 이제 'Agent Engine', 즉 에이전트 플랫폼이 되려 하고 있다. 전에도 몇 차례 얘기했던 것처럼, 사용자의 니즈에 맞는 앱을 실시간으로 생성하고 즉시 실행할 수 있는 런타임 환경을 제공한다. 그것도 글로벌하게 ...
인용된 글은 여전히 SEO·AEO 관점에서 얘길하고 있지만, 이제 구글 입장에서 보면 정적인 데이터만 제공하는 곳들은 구글이 한두 차례 데이터를 수집하고 나면 더 이상 방문할 이유가 없어진다. 출처 링크만 저장해두면 그걸로 끝이다.
앞으로 살아남는 곳은 지속적으로 유니크한 콘텐츠를 생산하거나, 동적인 서비스를 제공하는 — 사실상 앱(App)의 역할을 하는 곳들뿐일 것이다. 물론 그 앱이 실제로 쓸모 있어야 한다는 건 전제 조건이고, MCP·A2A 같은 프로토콜로 연동되지 않는다면 도태될 수밖에 없다. 결국 구글의 판단은 이렇게 수렴한다. 웹페이지는 웹앱이 되어야 가치가 있다.
문제는, 웬만한 웹앱은 구글 검색의 AI 모드 안에서 즉석으로 만들어질 수 있다는 점이다. 충분한 사용자 기반을 갖추지 못한 중소형 서비스들은 점점 설 자리를 잃게 될 것이다. 오히려 구글 검색 노출에 매달리기보다는 또 다른 메타 서비스나 서비스 마켓플레이스를 찾아 나서는 것이 현실적인 대안이 될 수 있다.
개인들이 필요한 소소한 서비스들은 이미 우후죽순 만들어져 클라우드에 올라오고 있고 , 혼자 혹은 관련된 사람들 몇몇들이 쓰다가 버려지면서 쓰레기들이 넘쳐날 것이고. 이번 구글의 서비스는 이렇게 한번 쓰고 버려질 앱들의 생산을 더 가속화할텐데 이게 당장 지구적 관점에서 맞나 싶기도 하다. 이미 생성형 콘텐츠로 인한 에너지 소비가 적지 않을텐데 말이지.