The entire RAG industry is about to get cooked.
Researchers have built a new RAG approach that:
- does not need a vector DB.
- does not embed data.
- involves no chunking.
- performs no similarity search.
It's called PageIndex. Instead of chunking your docs and stuffing them into pinecone, it builds a tree index and lets the LLM reason through it like a human reading a book.
hit 98.7% on financebench. beats every vector RAG on the leaderboard.
no embeddings. no chunking. no vector DB.
100% open source.
ANTHROPIC JUST RELEASED THE OFFICIAL PLAYBOOK FOR BUILDING A COMPANY WITH CLAUDE CODE.
30 minutes. free. from the engineers who built it.
Bookmark this before you forget.
CEO: 1 human. Employees: AI agents. Operations: fully automatic.
The zero-headcount company is no longer a joke.
يا اخي هذا الشخص فناااان 🔥
كورس 5 ساعات مجانا عن بناء وكلاء الذكاء الاصطناعي.
صدقني اذا فهمت كل شيء في هدا الفيديو تصير انت من افضل 1% من الناس في العالم باستخدام الذكاء الاصطناعي.
You watch one more episode of some Netflix nonsense series instead of spending an hour learning Obsidian + Claude?
Quit this, I’m begging you.
You’ll thank me later.
This 1 hour podcast with the Head of Claude Code will teach you more about vibe-coding than 100 paid courses.
Bookmark this & give it 1 hour today. It's the best video about AI you'll watch this week. Then read the article below.
CPU만으로 1초에 100장의 PDF를 마크다운으로 변환하는 무료 오픈소스가 공개되었습니다.
RAG 시스템을 만들 때마다 PDF 문서 파싱이 가장 번거로운 작업이었습니다.
마침 깃허브 트렌딩 1위에 OpenDataLoader PDF가 올라와 있어서 바로 로컬 환경에서 테스트해 보았습니다.
벤치마크 점수가 0.907로 1위라고 적혀 있었는데, 실제로 실행해 보니 복잡한 2단 구성 논문과 표까지 정확하게 텍스트로 분리해 냅니다.
✅사용법도 아주 단순합니다. 파이썬 환경에서 명령어 한 줄만 터미널에 입력하세요.
• pip install opendataloader-pdf
설치 후 파이썬 코드 단 3줄이면 데이터 변환이 끝납니다.
출력 결과물은 마크다운뿐만 아니라, 데이터 출처 표기를 위한 바운딩 박스가 포함된 JSON, 그리고 HTML 형식으로도 받을 수 있습니다.
✅하지만 공식 문서만 보고 바로 실무에 적용하기 전에 알아두셔야 할 점이 있습니다.
기본 설정인 결정론적 로컬 모드(Deterministic local mode)는 텍스트 위주 문서에서 매우 빠르지만, 테두리가 없는 표나 복잡한 수식이 섞인 페이지에서는 문서 구조가 어긋나는 현상이 발생합니다.
이런 복잡한 페이지나 화질이 낮은 스캔본을 처리할 때는 반드시 AI 하이브리드 모드를 활성화해야 합니다.
이 모드를 켜면 80개 이상의 언어를 지원하는 내장 OCR이 작동하여 300 DPI 이상의 스캔본이나 복잡한 차트 설명까지 텍스트로 추출해 냅니다.
제가 실무에 적용하면서 찾은 가장 효율적인 활용법은 랭체인(LangChain) 통합 기능을 사용하는 것입니다.
OpenDataLoader가 출력한 구조화된 마크다운 문서를 랭체인으로 바로 넘겨서 데이터를 분할(Chunking)하면 RAG 파이프라인 구축이 매우 간결해집니다.
실제로 기존 파싱 도구로 5시간 넘게 걸리던 3,000장 분량의 사내 문서 전처리 작업을 단 10분 만에 서버 비용 추가 없이 완료했습니다.
지금까지 AI 서비스 개발에서 가장 시간과 비용이 많이 들었던 구간은 PDF 같은 비정형 데이터를 AI가 읽을 수 있게 가공하는 과정이었습니다.
이 도구는 값비싼 GPU 리소스 없이 오직 CPU 환경만으로 그 전처리 문제를 무료로 해결했습니다.
앞으로 기업들의 내부 데이터를 활용한 AI 구축 속도가 이전과 다르게 빨라질 것입니다. 지금 RAG 시스템을 기획하고 있다면 바로 깃허브 저장소에서 코드를 다운로드하여 확인해 보세요.
Anthropic just dropped 13 AI courses… for FREE.
Go to each link below. Sign up. It's free.
---
1 - Claude 101. Learn Claude for daily work.
↳ https://t.co/QLuvwwhcgF
2 - AI Fluency: Frameworks & Foundations.
↳ https://t.co/w0ia8khS4Y
3 - Introduction to Agent Skills.
↳ https://t.co/AFIZqZmzyg
4 - Building with the Claude API.
↳ https://t.co/mRfIu1I0W4
5 - Claude Code in Action.
↳ https://t.co/iaDRqQd7Ax
6 - Intro to Model Context Protocol.
↳ https://t.co/sZ5ZPcF94f
7 - MCP: Advanced Topics.
↳ https://t.co/ykpE7SYqOb
8 - AI Fluency for Students.
↳ https://t.co/8sMNksGI8I
9 - AI Fluency for Educators.
↳ https://t.co/5QPodf3Fti
10 - Teaching AI Fluency.
↳ https://t.co/vUJyPrIK4M
11 - AI Fluency for Nonprofits.
↳ https://t.co/MkjQmdc0B9
12 - Claude with Amazon Bedrock.
↳ https://t.co/DPxRB8vrqH
13 - Claude with Google Cloud Vertex AI.
↳ https://t.co/tvHianMoVp
No need for language school when AI’s got your back 😎 My daily language hack in Paris 👉 3 AI tutors:
◼︎ Duolingo → fun vocab & phrases
◼︎ ElevenLabs → spot-on pronunciation
◼︎ ChatGPT → grammar made simple
Just 1–2 hrs a day and it’s like a free study abroad program!
I don't understand why people aren't using AI for trading.
They could make more profits using AI.
Here is a list of tools that can be used for trading:
곧 도착할 멤버들을 기다리며 한달 간 머물 집과 환경을 세팅하고 있다. 먼저 일주일을 살아보니, 환경이 사는 방식을 결정한다는 말이 와 닿는다. 오늘 아침엔 해변 요가에 참석했는데, 성공하고 돈벌어서 살고 싶은 삶이, 바로 지금 이 삶이란 생각이 들었다. https://t.co/xXBVpWIRb3
Welcome to the job market showdown: AI vs. AI! 🤖 Everyone thinks AI tools will scout the top talent, but where's the proof? Seems like they're really just trimming hiring costs. Maybe tht's the real endgame for companies?
https://t.co/AM43gGMCDf
"이제 채용시장은 AI 와 AI 의 대결이다. 흔히들 AI 툴을 쓰면 최고의 인재를 찾을 거라 생각하지만, 그렇다는 증거는 많지 않다. 대신 AI 툴은 채용에 들어가는 비용을 줄여준다. 어쩌면 그게 기업이 원하는 핵심일지도 모른다"
https://t.co/j7r7h6elox