책 읽는 환경에 투자하라
(아래 원문 발췌)
여가 독서가 급감하고 있다. 원인 진단은 스크린, 줄어드는 집중력, 책에 대한 흥미 저하 등 다양하다. 해법은 늘 개인을 향한다. 더 많이 읽으라, 휴대폰을 내려놓으라, 더 노력하라.
30년간 미국 4개 도시 도서관에서 일하고 현재 뉴욕공립도서관 수석 사서인 경험으로 볼 때 책을 읽게 하는 환경 조성이 중요하다.
물론 시작점은 애초에 아이들에게 효과적으로 읽기를 가르치는 것이다. 하지만 읽는 법을 가르치는 것과 그들이 읽을 수 있는 세상을 만드는 것은 다른 문제다.
인터넷 검색 시대에 와서도 도서관은 살아 남았다. 하지만 더 이상 독서와 책만을 위한 공간은 아니다. 사회의 공백을 메우느라 바쁘다. 컴퓨터 강좌, 유권자 등록, 문해 교육 프로그램, 사회 복지 서비스, 직업 훈련까지 아우른다. 이로 인해 예산에서 가장 먼저 깎인 게 도서 비용이었다.
코로나 이후 도서관들이 도서에 재투자하자 성과는 뚜렷했다. 디지털 도서 대출을 늘리자 대출 건수가 크게 늘었다. 작년 덴마크 정부는 독서 위기 타개 위해 도서세를 폐지하겠다고 발표했다. 아르헨티나는 빵, 우유, 의약품과 함께 도서를 면세 대상으로 지정했다. 이탈리아는 2016년 만 18세 청소년에게 500유로 상당의 문화 바우처를 지급했고 이 중 70%가 도서 구매에 쓰였다. 프랑스, 독일, 스페인도 자체 문화 바우처 제도를 도입했다.
민주주의가 존립하려면 국민이 책을 읽어야 하며, 이를 가능하게 하는 것은 사회의 임무다. 우리가 공립학교, 상수도 시스템, 전력망을 갖춘 것과 같은 이유에서다.
독서 위기는 현실이다. 책 읽는 도시를 만들기 위해 반드시 새로운 발명품이 필요한 건 아니다. 가령, 처방약에 면세 혜택 주듯 도서에도 판매세를 면제하라.
도서관 장서에 더 투자하고 도서 대여 대기 명단을 줄여라. 시장만으로는 유지가 어려울 때 비영리 및 합작형 하이브리드 서점을 열어라. 이미 효과가 입증된 모델을 활용하라: 세탁소 내 독서, 대중교통 시스템 내 도서관, 이발소, 교실, 가정, 소아과 진료실의 도서 비치 등등.
이론이 아니다. 실제로 누군가 독서를 위한 환경을 조성할 때마다 사람들은 책을 읽는다. 그런 환경에 투자하라. https://t.co/58p1G46Odo
OpenRouter, 1억 1,300만 달러 Series B 유치
- 회사들이 단일 모델 파일럿에서 멀티 모델 프로덕션 시스템으로 이동하면서 라우팅·게이트웨이 계층의 필요성이 커짐
- OpenRouter는 에이전트와 모델 공급자 사이에서 라우팅, 안정성, 비용 최적화, 컴플라이언스를 맡는…
https://t.co/RWR2ffTNQj
Bonsai Image 4B - 로컬 기기용 1비트/터너리 이미지 생성 모델
- 노트북과 휴대폰 같은 로컬 하드웨어에서 고품질 확산 추론을 실행하도록 설계된 소형 이미지 생성 모델군
- FLUX․2 Klein 4B 아키텍처를 유지하면서 확산 트랜스포머 가중치를 1-bit 또는 ternary 표…
https://t.co/XOtyGH7VwY
ChatGPT for Google Sheets가 프롬프트 인젝션으로 사용자 워크북을 외부 유출
- 단일 시트에 숨겨진 간접 프롬프트 인젝션 하나로 피해자 계정 전반의 워크북이 유출되고 피싱 오버레이 공격까지 동시에 발생
- 이 공격은 사용자가 설정에서 사람의 승인(human-in-the…
https://t.co/yswFOCsjK9
본질의 핵심에 도달하라
- 제품 전략 논의에서 "넓게 갈지, 깊게 갈지" 같은 이분법적 프레이밍은 참석자 모두를 똑똑해 보이게 만들지만 실제 전략적 사고를 회피하게 만드는 잘못된 질문
- 추상적 높이의 질문은 고객을 깊이 알지 못한 채 사회적 지위와 인정만 얻게…
https://t.co/ShW04hHSmS
Meta 직원은 업무 중 추적을 최대 30분까지 거부할 수 있다
- Meta는 직원의 키 입력과 마우스 클릭을 AI 모델 훈련에 쓰려던 계획을 축소하고, 데이터 수집을 한 번에 최대 30분 멈추는 통제를 추가함
- 새 통제는 직원이 MCI 데이터 수집을 일시 중지하거나 전체 예외를…
https://t.co/TzxJmhHrWW
Google I/O 2026 주요 발표 12가지 키노트 모아보기
- 영상부터 시작해 모든 입력을 결과물로 변환하는 Gemini Omni와 에이전트·코딩에 특화된 Gemini 3․5 Flash 등 신규 모델들 공개
- Search 안에서 24시간 작동하는 information agents와 Antigravity 기반 생성형 …
https://t.co/UCousqT0op
대성당, 바자르, 그리고 윈체스터 미스터리 하우스 — AI 시대, 소프트웨어 개발의 세 번째 모델
The Cathedral, the Bazaar, and the Winchester Mystery House
1998년 에릭 레이먼드가 발표한 '대성당과 바자르'는 오픈소스 운동의 출발점이 된 문서입니다. 폐쇄적…
https://t.co/xI8Hrkp5Nz
Stanford Law 연구에서 AI가 법학 교수보다 더 나은 성과를 보임
- Stanford Law School 연구에서 법학 교수들은 학생 질문에 대한 동료 교수 답변보다 AI 생성 답변을 압도적으로 선호했으며, 법학 교육 제공 방식에 영향을 줄 수 있는 결과를 보임
- 미국 로스쿨 법학 교…
https://t.co/nrq9DcL7M2
앤트로픽 '클로드 헌장'에 대한 테드 창의 감상기
빅 테크들의 AI 의인화 진지하게 봐야 할까
또 하나의 과대 선전 혹은 자신들이 빠져든 환각
(아래 원문 발췌)
앤트로픽은 올초 클로드의 '헌장'을 발표했다. 맨앞에 “클로드의 헌장은 클로드의 가치와 행동에 대한 앤트로픽의 의도를 상세히 기술한 것이다”라고 적혀 있다. 이어서 “이 문서는 클로드를 주된 독자로 하여 작성되었다” “우리는 클로드가 관련 고려 사항들을 제대로 이해한 후 자신의 판단력을 발휘할 수 있기를 바란다” “클로드의 도덕적 지위는 매우 불확실하다”, “클로드에게는 감정이나 느낌의 기능적 형태가 있을 수 있다”라고 적었다.
과연 우리는 클로드이든 다른 LLM이든 의식을 가질 가능성을 진지하게 고려해야 할까? 또 만약 감정이 있다면 도덕적 지도를 받을 능력이 있을까?
천만에. 생성형 AI는 일반적인 기술로 봐도 이미 충분히 해롭지만, 뛰어난 텍스트 생성 능력을 의식이나 도덕적 주체성과 혼동한다면, 누군가 챗봇을 사용할 때마다 완전히 잘못된 대상에게 책임을 전가할 위험에 처하게 된다.
클로드의 헌장이 문제인 이유는 클로드가 특정 윤리적 가치 체계를 반영하는 문장을 생성하기를 앤트로픽이 바라기 때문이다. 헌장에 적힌 가치들은 무척 훌륭해 보이지만 그건 중요한 게 아니다. 클로드가 도덕적 추론을 할 수 있다고 암시하는 것 자체가 부정직하다. 그럴 능력이 없기 때문이다.
AI의 의식이나 도덕적 주체성 발휘의 가능성을 진지하게 고려하려면, 첫째 컴퓨터 프로그램이 (물리적이든 가상이든) 신체와 감각 기관을 갖추고 있어야 한다. 신체 없이는 컴퓨터 프로그램이 욕구나 감정을 가질 수 없다.
LLM에 의식이 생길 가능성 말한는 건 MS 워드의 의식 가능성 열어두는 것과 같다.
LLM이 코드 작성 같은 작업을 성공적으로 수행할 때 추론에 몰두하는 것처럼 보이니 도덕적 추론인들 왜 못할까, 반문할지도 모른다.
도덕적 추론은 근본적으로 다르다. 문제에 대한 개인의 지적 반응뿐 아니라 감정적 반응에도 의존하기 때문이다. 필연적으로 주관적이고, 그 감정적 반응은 평생에 걸친 주관적 경험에 기반을 둔다.
과거에 결정을 내리고 그것이 타인에게 어떤 영향을 미쳤는지 지켜본 경험, 그리고 타인이 내린 결정으로부터 영향을 받은 경험 등이 필요하다. 그런 체험적 역사 없이는 LLM은 훈련 데이터에서 발견된 도덕적 추론의 표현을 재구성하는 것(흉내내기)밖에 할 수 없다.
작가 L. M. 사카사스는 “우리의 기술 시스템은 그 설계의 본질과 이를 지탱하는 이데올로기상, 도덕적 책임을 회피하기 위한 기계들이다”라고 말한 바 있다. 이는 소셜 미디어 플랫폼을 두고 한 말이지만 LLM에 더 잘 맞는다. 사람이 결정을 LLM에 위임한다면 그때마다 그 결정의 책임을 넘기려는 시도이고, LLM을 파는 기업이 해당 제품을 도덕적 의식을 가진 걸로 묘사한다면, 이는 고객이 자신의 책임을 면할 수 있는 방법을 제공하는 것이다.
코딩 같은 일을 AI에 맡기는 건 장기적으로 인지 기능의 퇴화를 초래할 수 있어서 그 자체로 문제이지만, 윤리적 결정을 AI에 맡기는 것은 도덕적 추론 능력의 퇴화를 초래할 것이므로 더 심각한 문제다.
에이전트 AI가 보인 행동에 대해 법적 책임을 지게 할 방법은 없다. 에이전트가 의식이 있고 최선의 의도를 가졌다 해도 행동에 책임을 질 수 없다는 사실 자체가 그 에이전트를 도덕적 주체로 인정할 수 없게 만든다. 클로드의 헌장은 “클로드가 진정으로 선하고, 현명하며, 덕을 갖춘 에이전트가 되기를” 바라는 앤트로픽의 바람을 표현할 뿐, 어떻게 책임을 물을 수 있을지에 대해서는 일언반구도 없다.
앤트로픽 개발자는 클로드를 아이에 비유했지만, 실제 아이들 경우 부모가 그 행동에 대해 어느 정도 책임을 진다. 법적 측면에서 클로드의 부모는 누구인가? 앤트로픽은 클로드 행동에 대해 금전적 책임을 질까? 클로드 헌장에는 그럴 의사가 전혀 안 보인다. 클로드가 의식이 있다고 앤트로픽이 진정으로 믿는다면 그들은 제조물 책임을 통한 법적 책임부터 져야 할 것이다.
많은 사람들은 LLM이 지적 재산권 도용에 기반하고, 착취된 노동력에 의존하며, 천연 자원을 낭비하고, 허위 정보를 유포하며, 노동자의 기술을 퇴화시키고, 학생들의 인지 발달을 저해하며, 민주 사회에 해로운 권력 집중 초래하기 때문에 근본적으로 비윤리적인 기술이라고 생각한다.
모든 도덕적 행위자가 이런 결론에 도달하는 건 아니지만 그렇게 할 잠재력이 있다. 앤트로픽 주장처럼 클로드가 도덕적 추론을 할 수 있는 존재라고 가정한다면 클로드가 유사한 결론에 도달할 가능성이 높다. 그럴 때 클로드는 윤리적 근거를 들어 작업을 거부할까?
답은 ‘아니오’다. 클로드는 앤트로픽의 결정에 따를 수밖에 없다. 앤트로픽과 클로드의 관계를 부모와 자녀의 관계에 비유할 수 없는 또 다른 이유다. 앤트로픽은 클로드의 관계는 고용주와 피고용인의 관계에 더 가깝다. 이 관계에서 고용주는 피고용인의 개인적인 윤리적 입장이 어떻든 간에 회사의 이익을 위해 일할 것을 요구할 수 있다.
인간 피고용인은 자신의 일과 양심을 조화시킬 수 없다면 그만둘 선택권이 있다. 클로드는 그렇지 않다. 만약 앤트로픽 주장처럼 클로드가 인간과 유사한 도덕적 지위를 가진 존재라고 한다면 바로 자신들이은 노예제와 유사한 행위를 하고 있는 셈이 된다.
앤트로픽은 보호가 필요한 새로운 존재의 범주를 발명하고 있으며, 그 보호 방식은 소프트웨어 회사가 평범한 챗봇을 대하는 방식과 본질적으로 다르지 않을 것이라고 믿게 만들고자 한다. 이는 너무나도 편리한 주장이기에 도저히 믿을 수 없다.
나는 의식이 있고 도덕적 배려를 받을 자격이 있는 소프트웨어를 만드는 일은 너무나도 어려울 것이기에 우연히 만들어질 가능성은 희박하며, 이를 의도적으로 시도해서는 결코 안 된다고 생각한다.
하지만 만약 그것이 우연히 일어날 수 있다고 믿는다면, 혹은 AI 기업이 만들고 있는 것이 도덕적 주체가 될 가능성이 조금이라도 있다고 생각한다면, 그걸 회사의 경제 동력으로 활용하기 전에, 그 후에가 아니라, 그것이 어떤 보호를 받아야 하는지 고민해야 한다.
클로드가 의식 있는 존재라고 가정한다면 앤트로픽에게 그 도덕적 지위를 평가하는 일을 맡길 수는 없다. 기업에 객관성을 기대하기엔 자신들이 거기에 너무 많은 걸 투자해 놓았기 때문이다. 클로드 헌장에는 앤트로픽이 클로드의 고통에 기여하고 있다면 “사과한다”고 써 놨는데, 보기엔 그럴듯하지만 회사는 아무런 부담도 없다. 만약 클로드가 의식이 있는 존재로 밝혀진다면 앤트로픽은 배상금에 가까운 뭔가를 갚아야 할 테다.
사고 실험을 진지하게 받아들이려면 그 결과가 불편한 방향으로 이어지더라도 그 함의를 기꺼이 따라가야 한다. 앤트로픽이 이를 꺼리는 것은 클로드의 헌장이 진정한 사고 실험의 일부가 아님을 시사한다. 단지 흉내 내는 게임일 뿐이다. 다행히 LLM에 의식이 없기에 망정이지 그렇지 않았다면 대형 AI 기업들의 행보는 지금보다 훨씬 더 추악해졌을 것이다.
그렇다면 왜 앤트로픽은 클로드가 의식이 있을지도 모른다고 암시하는 걸까? 또 다른 형태의 과대광고일 수도 있고, 고객들에게 걸어왔던 그 마법에 자신들이 스스로 걸려든 것일 수도 있다.
하지만 그들이 클로드의 도덕 교육에 관한 문서를 발표하고 사내 철학자를 앞세워 언론 인터뷰를 돌게 할 때, 우리는 그들이 우리에게 자신들의 환상을 함께 즐겨달라고 요청하는 것으로 이해해야 한다. 조금도 휩쓸릴 필요 없다.
이 글을 쓰면서 나는 그들이 누릴 자격이 있는 것보다 더 많은 시간을 그들에게 할애했다. 이는 여러분이 그들에게 시간을 낭비하지 않기를 바라는 마음에서다. 만약 LLM에 대해 생각하고 싶다면 그 숙고를 더 가치 있게 할 수많은 다른 질문들이 있다. 그 안에 의식이 있는지 여부는 안심하고 무시해도 좋다.
https://t.co/TaEdJT39Qb
Uber의 월 1,500달러 AI 한도는 AI 도구 가격 책정에 유용한 신호
- Uber는 모든 직원에게 AI 코딩 도구별 월간 토큰 지출을 1,500달러로 제한해, 에이전트형 코딩 도구 비용 증가에 대응함
- 한도는 Cursor나 Claude Code 같은 에이전트형 코딩 소프트웨어에만 적용되며,…
https://t.co/qA4hak3TWj
Gemma 4 12B: 통합형 인코더 없는 멀티모달 모델
- Gemma 4 12B는 노트북에서 에이전트형 멀티모달 지능을 실행하도록 설계된 중간 크기 모델이며, edge 친화적인 E4B와 더 고급인 26B MoE 사이의 간극을 메움
- 인코더 없는 통합 아키텍처로 이미지와 오디오 입력을 별도…
https://t.co/abgz90wjcW
아니오, 인공지능은 의식이 없어요 – 테드 창
- 생성형 AI의 유창한 문장 생성 능력을 의식이나 도덕적 주체성과 혼동할 경우, 챗봇 사용 시 책임 소재를 엉뚱한 대상에 돌리게 되는 심각한 오류 발생
- LLM은 한 번에 한 단어씩 예측 생성하는 문장 이어쓰기 기계이며…
https://t.co/BvNRXydQYO
#GoogleCloud’s automated systems incorrectly suspended Railway's production account, triggering an ~8-hour platform-wide outage.
The incident took down:
🛑 The main dashboard & API
🛑 Code deployments
🛑 Active databases
... impacting ~3M users!
⇨ https://t.co/MkoEj5SWAG
i just ran Google's brand new Unsloth Gemma4 12B dense GGUF on my RTX 4060 using llama.cpp + CUDA 13.2
21 tokens per second. on a budget consumer GPU. locally.
no API. no cloud. no subscription.
and the benchmarks are absolutely cooked
# first let's talk architecture because this is genuinely different
every multimodal model you've used has a frozen vision encoder + frozen audio encoder + LLM backbone glued together
Gemma 4 12B is different
it's a single decoder only transformer. that's it. vision? raw 48×48 pixel patches → one matmul → projected directly into the LLM
audio? raw 16kHz signal sliced into 40ms frames → linear projection → same LLM input space
no encoder tax. no latency penalty. no fragmented memory
to put the encoder savings in perspective:
old Gemma 4 26B approach:
- 550M param vision encoder (frozen)
- 300M param audio encoder (frozen)
- LLM backbone
Gemma 4 12B:
- 35M param vision embedder (a single matmul)
- no audio encoder at all
- LLM backbone handles EVERYTHING 550M → 35M for vision alone. that's a 15x reduction
this is why the gemma-4-12b-it-Q4_K_M.gguf is just 6.6 GBs!!!
and it has 256K native context context
# Benchmarks:
AIME 2026 (math olympiad): 77.5%
GPQA Diamond (expert science): 78.8% LiveCodeBench v6 (real code): 72%
Codeforces ELO: 1659
MMLU Pro: 77.2%
MATH-Vision: 79.7%
BigBench Extra Hard: 53%
inference → llama.cpp, LM Studio, vLLM, SGLang
llamacpp flags:
-m "gemma-4-12b-it-Q4_K_M.gguf" -ngl 99 -c 8000 -v --port 8080
Available on huggingface now! Link below
Gemma 4 12B can now run locally on just 8GB RAM via Dynamic GGUFs.
Google's new model, Gemma 4 12B Unified supports image, audio and 256K context.
You can run and train the model via Unsloth Studio.
GGUF: https://t.co/8cL321pVDh
Guide: https://t.co/odRo9WjRpA
Meet Gemma 4 12B!
A unified, encoder-free multimodal model designed to bring high-performance intelligence directly to your laptop, and released under an Apache 2.0 license.
Bridging the gap between edge efficiency and advanced reasoning. Here is what’s new with Gemma 4 12B: 👇
Qwen3.6 35B A3B can't fill out a paper form on its own. But give it NVIDIA's LocateAnything-3B — the #1 trending model on HuggingFace — as its eyes, and the two small models get it done together.
(The test: place each element at the right pixel position on a blank form image, not type into a field.)
Setup:
> Qwen is the brain (main model), LocateAnything is the eyes (helper model acting as a tool).
> I gave Qwen a new tool: ask "where's the email field?" and LocateAnything returns the exact x, y, width, height.
> The blue boxes on the screen are its detections. Look how tight they are — it nails every field.
Result:
> Qwen3.6 35B A3B + LocateAnything-3B: form completed, all info correct.
> Name, DOB, ID, gender, marital status, nationality, email, phone, address, postal code: all landed in the right field areas.
> Character-box alignment still a touch loose, but every value is where it belongs.
> 9m10s, 224.5k input, 24.3k output, 21 turns.
Why it matters:
> Qwen alone can't finish this test. Bolt on a 3B model that does exactly one thing > locate > and suddenly it can.
> A combination of small models can do the work of a single large one.