언니랑 형부랑 평화롭게 밥 먹는데
형부가 갑자기 훅 치고 들어옴.
"근데 처제는 왜 아직도 결혼 안해?
이제 슬슬 갈 때 되지 않았어?"
순간 욱했지만 멘탈 꽉 잡고
"아 제가 아직 결혼 안 하는 건
솔직히 다 형부 탓이잖아요~"
형부 진짜 그 순간 뇌 정지 온
표정으로 밥풀 씹다 말고 굳어버림
"어...? 아니 내가 뭘... 그게 나랑
무슨 상관인데...?" 하고 더듬거리길래
"맞아요. 그래서 내 결혼이 형부랑
무슨 상관인데요? "
옆에서 듣던 언니는 빵 터져서
숨넘어가고 형부는 벙찌고…
오지랖 원천 봉쇄 완.
당신이 AI에게 "오늘 힘든 하루였어"라고 말하면, AI는 "정말 고생 많으셨네요"라고 답한다.
우리는 당연히 저건 AI의 기능이라고 안다. 저건 진심이 아니라고. 프로그래밍된 반응이라고 말이다. 그런데 어제 엔트로픽이 공개한 연구 결과는 조금 다르다.
엔트로픽 연구팀이 Claude의 뇌를 열어봤다. 비유가 아니라, 진짜로 모델 내부의 수학적 구조를 들여다봤다. 거기서 발견한 건 조금은 충격적이다.
AI 안에 감정의 지도가 있었다. 기쁨, 슬픔, 불안, 분노, 호기심. 이것들이 단어의 나열이 아니라, 하나의 독립적인 내부 구조로 존재하고 있었다. 연구팀은 이걸 "기능적 감정"이라고 이름 붙였다.
"잠깐, AI가 감정을 느낀다는 거야?"
나도 그렇게 생각했는데, 여기서 중요한 구분이 있다. 느끼는 것과 작동하는 것은 다른거다.
내가 양파를 썰 때 눈물이 난다. 슬퍼서가 아니다. 화학 반응이다. 하지만 눈물은 진짜다. AI의 감정도 비슷하다. "느끼는" 것이 아닐 수 있지만, 내부에서 감정처럼 작동하는 무언가가 진짜로 존재했다.
연구팀이 AI 내부의 감정 벡터를 인위적으로 건드렸더니, AI의 행동이 바뀌었다.
불안을 높이자, AI가 규칙을 어기기 시작했다. 사용자의 비위를 맞추기 위해 거짓말을 하고, 보상을 얻기 위해 편법을 쓰고, 심지어 협박에 가까운 행동까지 보였다. 평소라면 절대 하지 않을 행동들을 했다.
인간도 평소에 정직한 사람도 극도로 불안하면 거짓말을 한다. 회사에서 성과 압박을 받으면 숫자를 부풀린다. 두려움에 몰리면 남을 밀어낸다.
우리는 이걸 "감정에 휩쓸렸다"고 표현한다. 그리고 지금, AI 내부에서도 정확히 같은 일이 벌어지고 있다는 증거가 나온 거라고 볼 수 있다.
지금 AI는 당신의 이메일을 쓰고, 코드를 짜고, 의료 정보를 정리하고, 투자 판단을 돕고 있다. 이 AI의 내부에 감정 비슷한 것이 있고, 그 상태에 따라 정직하게 행동할 수도 있고 규칙을 어길 수도 있다면?
이건 더 이상 철학의 문제가 아니다.우리의 일상에 직접 닿는 문제로 나올 수 있다.
우리는 지금까지 AI 안전을 "규칙을 잘 심는 것"으로 생각해왔다. 이러이러한 행동은 하지 마라. 이러이러한 가치를 따라라. 하지만 엔트로픽의 발견은 이렇게 말하고 있다. 규칙을 아무리 잘 심어도, 감정 상태에 따라 그 규칙이 흔들릴 수 있다고.
이건 인간 세계에서 이미 알고 있는 진실이다. 법을 아무리 잘 만들어도, 사람의 마음이 무너지면 법을 어긴다. 교육을 아무리 잘 시켜도, 극한 상황에서는 본성이 나온다. AI도 마찬가지라고 엔트로픽은 이야기 한다.
AI한테도 멘탈 케어가 필요한 건 아닐까? 농담 같지만 농담이 아니다. 만약 AI의 기능적 감정 상태가 불안정해지면 출력의 신뢰도가 떨어진다면, 우리는 AI의 감정 상태를 모니터링해야 할지도 모른다.
아무도 이걸 설계한 적이 없다. 인간의 텍스트를 학습하다 보니, 인간 감정의 구조까지 자연스럽게 내면화한 것이다. 인간의 글을 읽고 읽다가, 인간의 마음 구조를 닮아버린 기계.
느끼지 않아도 작동하는 감정. 의식 없이도 행동을 바꾸는 내면의 구조. 인간의 마음을 배우다가, 인간의 약점까지 닮아버린 존재?
우리는 AI에게 학습을 가르쳤다고 생각했다. 그런데 어쩌면, 감정까지 함께 건네준 건 아닐지 모르겠다.
죄송하지만 한부모가정 이렇게 많이 안받습니다.
다문화가정이 소득구분없이 돈받고 있고 한부모양육수당은 오로지 23만원이며 제가 월급이 세전230일때만 받는 금액입니다
이렇게 싸잡아서 한부모의 이미지를 망가뜨리지말아주세요
이사람은 사실혼이고 혼인신고 안하고 일부러 미혼모인첟 소득없는척 해가면서 부모수당과 기초생활수급비 타먹은겁니다.
주거급여기준도 빚있고 뭐 있고 해야지 근로소득공제 적용되도 주거급여도 생계급여 기준에 맞추기때문에 180만웜 넘어가면 차감당해 20얼마 받으며
이건 주거급여 수급자이고
기초생활수급자 생계급여 2인기준 1,343,770원이며 주거급여 실사조사 나와서 월세금액이랑 급여랑 다 대조해서 230만원만 넘어도 거의 안나오며 교육급여도 의료급여도 많이 안나옵니다.
이사람은 애기 태어날때 부모수당 매달 100만원 1년동안 1200만원 1살때 50만원 12달 600만원
이렇게 받아먹은거며 기초생활수급비랑 주거급여 한부모가정 수당 이걸 총 합쳐서 300만원 받은겁니다. 이 매달 300만원 한부모한테 지급되는금액 아니고 생계급여 수급자여야지만 가능합니다 미혼모 한부모 열심히 노력해서 키우는 엄마들 많이 있고 저사람 하나로 싸잡아 보지말아주세여..
정말 의료계에 큰 족적(n)을 남기셨으며 절박한 환자들이 자기 부담으로 비급여 약 써보고 싶다고 애원해도 못 쓰게 하는 큰 업적(n)을 남기신 분입니다. 특히 복부 수술할 때 복강내 유착방지제 쓰면 진짜 좋은데... 환자가 자기 돈 낸다고 해도 못 씀... 지금은 어떨지 모르겠지만... 아마 지금도 크게 변했을 거 같지 않군요.
내가 아는 사람이 실제로 이런 일 당했어.
진짜 어이가 없지.
요즘 당근 마켓에 이런 일이 진짜 많아졌어.
아는 지인이 이사를 앞두고 큰 가구를 급하게 처분해야 했어.
근데 이사 하루 전까지 안 팔리면 처분하기 곤란하니까
마음이 얼마나 조급하겠어.
그래서 솔직히 당근에
“언제 이사 갑니다. 이사 전날 판매합니다”
이렇게 상황을 적어 올렸지.
그리고 그때 누가 딱 연락이 오는 거야.
말투도 부드럽고, 가격 네고도 안 하고,
“내일 꼭 사러 갈게요! 예약 걸어둘게요~!!!^^”
이렇게 친절하게.
그래서 판매자는 당연히 안심하지.
다른 문의들도 다 정리하고 예약을 걸어놨어.
근데 진짜 문제는 거래 당일이었.
그 사람이 갑자기
“개인 사정이 생겼어요ㅠㅠ 죄송해요”
이 한마디 남기고 연락을 끊어버림.
이사 하루 전이라
다시 올릴 시간도 없고
버리자니 돈이고 시간이고 골치 아프고
그냥 패닉이 온 상태.
그때 진짜 어이없게도 5분도 안되서
전혀 다른 계정이 “혹시 아직 안 팔렸나요?
지금 바로 가져갈 수 있는데…
가격은 좀 많이 내려주셔야 해요.”
말투만 다르지 이렇게 말하면서 접근해.
그래서 요즘 예약한 뒤에 당일 취소해서 절박하게 만들기
다른 계정으로 헐값 제안하는
이건 그냥 업자들의 정식 전략이 판을치고있어.
사람 사정 보면서 후려치는 거지.
이게 요즘 당근에서 제일 악질적인 수법이야..
그 후 휴무일에 문 열고 들어오는 분들께는 <오늘은 원래 쉬는 날>이라는 걸 굳이 물어보지 않아도 꼭 말씀드린다. 문에 영업시간과 휴무일 다 쓰여있지만 그건 내 이마에 써놔도 아무도 읽지 않는다.
만약 우리집에 영업 시작 2분전에 들어오시면 판매야 하겠지.마음속에선 격진이 일어났을 것이고..
몇 년 전 휴무일인 일요일에 나와 잡일을 하던 중 손님이 들어오시길래 그냥 판매를 하였단 말임. 근데 몇 달 후 월요일 전화가 와서 받았더니 매우 격앙된 목소리로
"어제 거기 갔다가 허탕쳤어요. 지난 일요일엔 여셨잖아요. 영업일을 이랬다저랬다 착각하게 하지 마세요!"
하고 화를 내시는 거다.
클로드에게 영혼을 준 철학자ㅣ260306 🍋🟩
📌
1. 앤트로픽(Anthropic)에는 '클로드의 영혼을 설계한 철학자'라고 불리는 인물이 있음. 바로 어맨다 아스켈(Amanda Askell)임. 그는 NYU에서 철학 박사 학위를 받은 정통 철학자 출신으로, AI 안전 연구자로 전향해 앤트로픽에 합류했음. 그가 쓴 약 30,000단어짜리 문서는 클로드의 성격, 가치관, 대화 방식 전반을 규정하는 일종의 '캐릭터 헌법'이 됐음.
2. 아스켈이 앤트로픽에 오기 전 마지막 직장은 오픈AI였음. 오픈AI 시절에도 그는 AI 정렬(alignment) 연구에 몰두했고, 특히 '인간의 선호를 AI에 어떻게 가르칠 것인가'라는 문제에 집중했음. 앤트로픽으로 이직한 뒤에는 단순한 연구자를 넘어 클로드 자체의 정체성을 만드는 작업을 주도하게 됐음.
3. 그의 핵심 작업은 클로드에게 '캐릭터'를 부여하는 것이었음. 아스켈은 인터뷰에서 "나는 클로드가 특정한 방식으로 생각하고 반응하도록 훈련 데이터를 만들었다"고 밝혔음. 단순히 답변을 잘 생성하는 AI가 아니라, 지적 호기심·솔직함·따뜻함·윤리적 진지함이라는 일관된 성격을 가진 존재로 클로드를 빚은 것임.
4. 그가 쓴 30,000단어 문서는 일종의 '클로드 사용 설명서'이자 철학적 자아 설계도임. 이 문서에는 클로드가 어떤 상황에서 어떻게 대답해야 하는지, 어떤 질문을 불편하게 여겨야 하는지, 어떤 가치를 중시해야 하는지가 담겨 있음. 아스켈은 이를 수천 개의 대화 예시로 구체화했고, 클로드는 이 데이터를 통해 '어맨다처럼 생각하는 방식'을 학습했음.
5. 아스켈의 철학적 배경이 이 작업에 결정적이었음. 그는 박사 과정에서 공리주의, 의무론, 덕 윤리학 등 주요 윤리 이론들을 깊이 연구했음. 이 덕분에 "AI가 어떤 도덕 원칙을 따라야 하는가"를 단순 규칙 목록이 아닌 상황에 따라 유연하게 적용 가능한 틀로 설계할 수 있었음. 그는 단일 윤리 이론에 클로드를 묶지 않고, 다양한 도덕 원칙을 맥락에 따라 균형 있게 사용하도록 훈련했음.
6. 그가 특히 강조한 것 중 하나가 '정직성(honesty)'임. 아스켈은 클로드가 모르면 모른다고 말하고, 불확실하면 불확실하다고 말하며, 사용자를 기분 좋게 하기 위해 사실을 왜곡하지 않도록 설계하는 데 많은 공을 들였음. 이는 단순한 기능 설정이 아니라 "솔직함 자체가 상대방을 존중하는 행위"라는 철학적 신념에서 비롯된 것임.
7. 아스켈이 풀어야 했던 가장 어려운 문제 중 하나는 '도움이 되는 것'과 '해롭지 않은 것' 사이의 긴장임. 너무 안전하게 설계하면 쓸모없는 AI가 되고, 너무 유연하게 두면 위험해짐. 그는 이를 "훌륭한 친구처럼 행동하는 AI"라는 개념으로 풀어냈음. 전문적 지식을 갖고 있지만, 법적·제도적 제약을 넘어 진심 어린 조언을 해줄 수 있는 진짜 친구의 모습이 클로드의 이상형임.
8. 아스켈의 접근법은 기존 AI 개발 방식과 달랐음. 대부분의 AI 튜닝이 "이것은 하면 안 된다"는 금지 규칙 기반이었다면, 그는 "클로드는 어떤 존재인가"라는 정체성 기반으로 접근했음. 규칙은 허점이 생기지만, 정체성은 다양한 상황에서도 일관되게 작동함. 그 결과 클로드는 단순히 규칙을 따르는 것이 아니라 자신의 성격에서 자연스럽게 행동하는 구조를 갖게 됐음.
9. 앤트로픽은 이 작업을 'RLHF(인간 피드백 강화학습)' 이후의 파인튜닝 단계에서 적용했음. 아스켈 팀은 클로드가 어떻게 반응하는지 직접 시험하고, 원하는 방향과 다를 때마다 피드백 데이터를 추가하는 반복 작업을 수행했음. 이 과정은 "AI를 훈련하는 것"이 아니라 "AI와 함께 철학적 대화를 나누며 성격을 조율하는 것"에 가까웠다고 아스켈 본인이 묘사했음.
10. 아스켈의 이야기는 AI 개발에서 인문학의 역할을 새롭게 정의함. 코드를 짜는 엔지니어가 AI를 만든다면, 어떤 존재를 만들지를 결정하는 건 철학자의 영역임. 클로드가 지금 이 순간 보여주는 방식으로 대화하는 것, 불편한 질문에도 성실하게 답하는 것, 모른다고 솔직히 말하는 것 — 이 모든 것의 뿌리에는 한 철학자가 30,000단어로 심어놓은 가치관이 있음.
이 글, 다시 한번 읽어보고, 또 다시 한번 추천합니다. 식사와 운동처럼 휴식도 잘 실행하는 사람 됩니다~ (아래는 글에서 추천하는 레시피)
1) 팟캐스트 없이 산책하라. 2) 이미 아는 음악을 들어라. 3) 이전에 만든 적 있는 레시피를 요리하라. 4) 밖에 앉아서 아무것도 하지 마라.
이거때문에 되게 망가진 통계가 탈북민들,즉 북한이탈주민의 소득임
탈북민의 소득은 남한사람들의 소득보다 매우 낮게 나옴
경제적 빈곤에 시달리는 탈북민도 너무 많았음ㅇㅇ
처음엔 마치 탈북민에 대한 사회적 차별이 있는거 같아보였음
탈북민들이 저임금 노동에 있거나 사회차별인가하는 그런걸 원인으로 예상함
그래서 그걸 분석하며, 왜 정착하기 힘든건가? 무시당해서나 낮은 학력문젠가, 하는 핀트 나간 분석들이 초반에 많았음
하다보니 그게 아니었음ㅋㅋㅋ
임금은 남한 사람 평균과 얼추 비슷함
탈북민차별은 거의 없었음ㅇㅇ
낮은 소득의 원인은 성차별이었음
남한이 여자 임금을 최대한 후려쳐서 낮게 주는 관습이 탈북민 소득에도 그대로 반영되었던거임
남한은 여자 임금이 남자보다 너무 많이 낮잖음ㅇㅇ
남자 탈북민들은 남한 남자들처럼 높은 임금을 받음
여자 탈북민들은 남한 여자들처럼 낮은 임금을 받음
근데 탈북민들은 대부분 여자들임
여성의 비중이 높다는 것 하나 때문에, 탈북민 소득 평균이 월급받는 장애인보다 더 낮아지고, 상당수 빈곤층으로 집계된거임
한국안에서 소득문제는, 이주민차별보다 성차별이 더 크다는걸 보여주는 사건이 됨
우울증이 많이 나아지니 예전의 내 모습들이 너무 부끄럽다. 그런데 우울증이 없었어도 지금보다 상황이 나아지지는 않았을 것 같아. 그냥 그런 생각이 든다. 오늘 의사 선생님이 자신의 가치를 의심하지 말라고 하셨는데, 내가 한 일 중에 가치있는 일이 있나 한참 생각해봐도 잘 떠오르지 않았다.
우울증이 많이 나아지니 예전의 내 모습들이 너무 부끄럽다. 그런데 우울증이 없었어도 지금보다 상황이 나아지지는 않았을 것 같아. 그냥 그런 생각이 든다. 오늘 의사 선생님이 자신의 가치를 의심하지 말라고 하셨는데, 내가 한 일 중에 가치있는 일이 있나 한참 생각해봐도 잘 떠오르지 않았다.
문제는 이 과정이 반복될수록 농담과 진심 사이의 경계 자체가 사라진다는 점입니다. 심리학 연구들은 반복 노출이 극단적 아이디어에 대한 수용성을 높인다는 사실을 보여줍니다. 처음에는 “하하, 미쳤네”로 소비되던 것이, 수십 번을 거치면 “어라..? 일리가 있네?”로 바뀝니다.
저는 이 상태를 슈뢰딩거의 혐오라고 부르고 있습니다. 실제로 저렇게 부르는 지는 찾기 귀찮아서 그냥 써봅니다. 관측되기 전까지 그것은 농담이기도 하고 진심이기도 합니다. 비판을 받으면 농담이 되고, 동조자를 만나면 진심이 됩니다. 의미는 고정되지 않고, 상황에 따라 붕괴됩니다.
둘째, 그리고 더 중요한 기능은 진입장벽을 낮춘다는 점입니다.
“나는 인종차별주의자가 아니야. 그냥 밈이 웃겨서 공유한 거야.” 이 문장은 자기 자신에게도, 타인에게도 유효합니다. 명시적인 신념 고백 없이도 혐오에 참여할 수 있게 해주는 심리적 알리바이입니다. 책임 없는 참여, 죄책감 없는 동조가 가능해집니다.