🚨마이크로소프트가 무료로 공개한 음성 인식 AI를 직접 테스트해 봤는데, 60분 분량의 회의를 단 한 번의 끊김도 없이 완벽하게 텍스트로 변환해 내는 성능이 정말 대박입니다.
네이버 클로바 안써도 되겠는데요?
이미 깃허브에서 별 3.8만 개를 받은 'VibeVoice'라는 오픈소스 기술입니다.
보통 AI로 긴 음성을 텍스트로 바꿀 때 텍스트를 여러 구간으로 쪼개서 처리하기 때문에 문맥이 어색해지거나 누가 말했는지 섞이는 오류가 자주 발생합니다.
그래서 이 기술이 정말 실용성이 있는지 직접 확인해 보고 싶었어요.
✅공식 문서에 적힌 대로 60분 분량의 음성을 분할 작업 없이 한 번에 입력해 보았고, 실제 대화의 흐름과 화자가 전혀 섞이지 않고 그대로 유지되는 것을 확인했습니다.
사용 과정은 복잡한 세팅 없이 아주 직관적입니다.
• 아래 댓글에 있는 github repo에서 clone합니다.
• 변환이 필요한 음성 파일을 지정된 폴더에 넣습니다.
• 실행 명령어를 입력하고 기다립니다.
결과물은 단순한 텍스트가 아니라, 대화가 오고 간 타임스탬프와 누가 말했는지(화자 분��)까지 정확하게 표기된 문서 파일로 곧바로 저장됩니다.
✅하지만 실제 구동 환경에서 직접 겪은 주의사항도 있습니다.
한 번에 처리할 수 있는 최대 입력 길이가 정확히 60분으로 제한되어 있습니다.
1시간이 넘어가는 녹음 파일을 그대로 넣으면 시스템이 중간에 멈추거나 에러를 발생시킵니다.
따라서 60분이 넘는 회의 음성은 반드시 사용자가 미리 60분 단위로 파일을 잘라서 입력해야 합니다.
✅이 툴의 효율을 극대화하는 저만의 실무 적용 방법도 공유해 드립니다.
VibeVoice는 50개 국가의 언어를 지원합니다. 외국어 화자가 섞여 있는 다국어 회의 녹음 파일을 입력해도, 각 언어를 인식하여 정확하게 텍스트로 분리해 냅니다.
또한 이 기술은 텍스트를 음성으로 만들어주는 오디오 생성 기능도 포함하고 있습니다. 최대 90분 길이까지 생성할 수 있으며, 텍스트에 화자를 여러 명으로 지정하고 감정을 텍스트로 입력하면 여러 사람이 감정을 담아 대화하는 음성을 그대로 만들어냅니다.
이 기술은 ��리가 대화와 회의 내용을 기록하는 방식 자체를 완전히 바꿀 것입니다.
사람이 직접 오디오를 들으며 타이핑하고 대화자를 구분해야 했던 긴 시간의 단순 작업은 이제 오픈소스 AI가 무료로 전부 처리할 수 있습니다.
단순한 리뷰를 넘어서, 여러분도 지금 당장 업무 프로세스에 이 툴을 적용해 보고 반복 작업에 들어가는 시간과 비용을 직접 줄여보시기를 바랍니다.
https://t.co/a6AtAxywyN
@junghwan 님께서 한국 법을 모두 git repo로 옮겨주셨다! 한국법령정보 MCP보다 얘가 훨씬 빠르고 편하다!!!!
코드 : https://t.co/l8JqMuHfV9
이거 예전부터 하고싶었지만 은근히 까다로운 처리가 필요해서 미뤘던건데, 시간지나니 다 해주셨다 와와와와
🎨 Awesome DESIGN.md
https://t.co/fkDrB10M9a
DESIGN.md 파일 하나를 프로젝트에 복사하고, AI 코딩 에이전트에게 ㄱㄱ
이건 Google Stitch가 소개한 개념인데, 아이디어 자체가 너무 단순해서 오히려 강력하다고 봐요. 일관된 UI를 만들어내기 되게 편합니다.
지금까지는 디자인 시스템을 별도 문서로 관리하거나, 에이전트한테 매번 "Stripe 스타일로 만들어줘"라고 설명해야 했죠.
DESIGN.md는 그 설명을 파일로 만든거예요.
↓
📋 각 DESIGN.md에 포함된 내용
1. Visual Theme & Atmosphere - 분위기, 밀도, 디자인 철학
2. Color Palette & Roles - 의미 있는 색상 이름 + HEX + 역할
3. Typography Rules - 폰트 패밀리 + 전체 계층 구조 테이블
4. Component Stylings - 버튼, 카드, 입력창, 네비게이션 등 (상태별 스타일 포함)
5. Layout Principles - 스페이��� 스케일, 그리드, 여백 철학
6. Depth & Elevation - 그림자 시스템, 표면 계층 구조
7. Do's and Don'ts - 디자인 가이드라인과 금지 패턴
8. Responsive Behavior - 브레이크포인트, 터치 타겟, 반응형 전략
9. Agent Prompt Guide - 빠른 색상 참조 + 바로 쓸 수 있는 프롬프트
각 사이트 폴더에는 디자인 시스템, 색상, 타이포그래피, 컴포넌트, 다크모드.. 포함되어 있습니닷!
컬렉션을 슥 보시면 굉장히 다양한 스타일의 디자인 시스템을 볼 수 있어요.
🔥해커톤 우승자가 필살기를 공개했다.
비결은 코딩 실력이 아니라 Claude Code 셋팅 파일이었다.
그걸 그대로 GitHub에 올렸다.
2달 만에 12만 명이 별을 눌렀다.
이름은 ECC (Everything Claude Code)
AI 혼자 쓰던 사람이 AI 28명짜리 팀을 굴리게 해주는 세팅집이다.
게다가 무료로 쓸 수 있는 오픈소스다.
✅ 설치법
Claude Code 실행 후 명령어 2줄
🔹/plugin marketplace add affaan-m/everything-claude-code
🔹/plugin install everything-claude-code@everything-claude-code
28개 에이전트, 119개 스킬, 60개 명령어
즉시 사용 가능하다.
✅ 사용법 (몇 가지만 소개한다.)
/plan "기능명" → 구현 계획 자동 작성
/tdd → 테스트 주도 개발 강제
/code-review → 코드 품질 자동 검토
/security-scan → 보안 취약점 스캔
혼자 개발하는데 팀처럼 돌아간다.👍
🤖Claude Code 쓰면서 매번 같은 프롬프트 복붙하고 있었다면, 스킬이라는 걸 아직 모르셨던 겁니다.
Anthropic이 Claude Code용 skill-creator 플러그인을 공식 출시했습니다.
Skill(스킬)은 Claude가 특정 작업을 반복 수행할 수 있도록 지시문, 스크립트, 리소스를 담아둔 폴더입니다.
브랜드 가이드 문서 작성, 사내 데이터 분석 워크플로우, 개인 업무 자동화 같은 걸 한 번 세팅해두면 계속 불러와서 쓸 수 있는 거죠.
이번 skill-creator로 가능해진 것들:
- 내가 만든 스킬이 실제로 작동하는지 검증
- Regression(회귀 오류, 예전에 잘 되던 게 어느 순간 깨지는 현상) 자동 탐지
- 스킬 설명 문구 품질 개선
anthropics/skills 레포지터리는 현재 별 82,542개에 지난달까지 활발하게 커밋이 이어지고 있습니다.
공식 플러그인 디렉토리(anthropics/claude-plugins-official)에도 별 8,858개로 정식 등록되어 있고요.
설치는 `/plugin install skill-creator@claude-plugin-directory` 한 줄입니다.
https://t.co/MKcvpjYk8e
Anthropic이 Skill Creator Plug In의 기능을 업데이트했다는 소식에 '스킬 만들어주는 스킬이 그게 뭐 얼마나 대단할까'라는 생각으로 공식 블로그를 확인해봤습니다.
근데 이 녀석 물건입니다..!
테스트 케이스 작성, 벤치마크, A/B 비교 —
소프트웨어 개발 문화에서 쓰이던 검증 프레임워크를
코드 한 줄 없이 스킬에 적용할 수 있게 만들었습니다.
📍Anthropic은 왜 이러한 스킬 만드는 스킬을 만들었나?
Anthropic이 알아차린 게 있습니다.
스킬을 만드는 사람 대부분이 개발자가 아니라 도메인 전문가인데 이들은 스킬이 새 모델에서도 작동하는지, 제때 트리거되는지, 수정 후 실제로 나아졌는지를 **판단할 도구가 없다는 것.
그래서 Anthropic이 개발 문화에서 쓰이는 평가 시스템을 Skill Creator에 붙였는데, 이게 멀티에이전트로 돌아갑니다. 병렬로 빠르게 돌리면서, 컨텍스트끼리 오염을 방지하기 위해서입니다.
궁극적으로 여러 테스트 케이스를 https://t.co/MVUtQuhXHg를 적용한 결과 vs 그리고 https://t.co/MVUtQuhXHg 없이 만든 결과를 에이전트���이 비교합니다:
1⃣ 독립 에이전트들이 병렬로, 각각 깨끗한 컨텍스트에서 테스트 케이스들을 빠르고 독립적으로 병렬 실행
2⃣ 비교만 담당하는 에이전트가 A/B 테스트를 진행. (두 버전 결과를 블라인드로 판정)
각각 독립 컨텍스트에서 병렬로 돌아가니
컨텍스트 오염이 없습니다.
직접 스킬 만들어 쓰는 입장에서, 저도 지금까지는 대충 지시한대로 돌아가는 거 같으니 만족하고 넘어갔었는데요, 이젠 이 플러그인을 안 쓸 이유가 없을 거 같습니다.
써보고 싶으면 https://t.co/9gU6WMOBdK 혹은 Cowork에서 "skill-creator 써줘"라고 하면 됩니다.
Claude Code 쓰신다면 공식 플러그인 설치하면 되구요.
스킬 만들어본 분이라면 한 번 돌려볼 만합니다.
🔍 Claude Code 개발 직전 리뷰 위한 스킬 공유
> Y Combinator Garry Tan
한글버전 필요하신 분들에게
= /plan-exit-review
https://t.co/ttZEOcXRQg
이전에 공유했던 Garry Tan의 Claude Code 프롬프트가 /plan-exit-review 라는 이름의 스킬로 공유되었네요. 꼭 Claude Code가 아니어도 활용할 수 있죱.
중요한 부분은 Plan 모드에서 코딩으로 ���어가기 직전, AI에게 "야 잠깐, 이 계획 한번 제대로 뜯어봐"라고 강제하는 거예요.
단순 코드 생성이 아니라 시니어 엔지니어 수준의 코드 리뷰를 먼저 거치게 만드는 거죠.
💬 이것은 제가 만든 Claude Code용 /plan-exit-review 스킬의 최신 버전입니다.
플랜 모드를 종료할 때 사용하는데, 모든 문제를 걸러내고, 아키텍처 및 코드 스멜 이슈를 찾아내고, 성능 문제를 파악하며, 마지막으로 PR의 모든 부분이 테스트되었는지 확인하는 데 매우 잘 작동합니다.
(요즘 저는 실제 코드 1줄당 평균 1.3줄의 테스트 코드를 작성하고 있어요)
- Garry Tan
엔지니어링 원칙도 변함없이 일관되어 있군요!
- DRY 원칙 — 반복은 공격적으로 잡아낼 것
- 충분한 테스트 — 적은 것보다 차라리 많은 게 낫다
- 적절히 설계된 코드 — 과소도 과도도 아닌 딱 적정 수준
- 명시성 > 기교 — 똑똑한 코드보다 명��한 코드
- 최소한의 변경 — 가장 적은 파일과 추상화로 목표 달성
Alright - here's my most powerful vibe coding prompt ever.
Plug this straight into the new Opus 4.6 model, and you'll literally be able to ship anything.
SEO optimised websites, fully functional Claude apps, personal dashboards - literally anything.
Takes <5 minutes:
현명한 사람은,
1. 자신을 존중하지 않는 사람들에게 구태여 나이스한 행동을 하지 않습니다. → 팃포탯
2.(아무리 유행해도) 자신이 어리석다고 생각하는 것들은 믿지 않습니다 → 忠
3. 관계, 일, 건강 등 자신이 무엇을 원하는지 알고 있습니다. → 메타인지, 자기객관화.
#기여가치주도성장
아 엄마의 병 후일담
엄마는 간경화랑 간염이었나 쨋든 간질환이 두 개에 너무 악화돼서 가는 병원마다 손 쓸 도리 없다 소리 들음
그래서 결국 IT업계인이던 아빠가 한의학 공부를 시작해서 한의사가 되��니 직접 엄마를 완치시켜버림......
우리 엄마 지금은 완전 건강해요!
https://t.co/Jyhc8RPd4w
축구협회는 손흥민 지원한 적 없고,
오히려 손흥민이 축구협회의 무능력을 상쇄시켜주는 국뽕을 안겨줬고,
김연아는 빙상연맹에서 뭘 지원한게 있기는 한가?
광고 따서 훈련비 마련하고, 장비도 알아서 수배해야 했고, 오히려 연맹에서 방해가 된게 훨씬 많지 않았나?
역설적으로 안세영과 비슷하네.