🔍 Tôi vừa đọc source code Hermes Agent và phát hiện ra điều hầu hết mọi người bỏ qua:
Framework này không chạy 1 vòng lặp.
Nó chạy 8 — đồng thời — ở các quy mô thời gian khác nhau.
Và chúng compound lẫn nhau.
Đây là toàn bộ kiến trúc 🧵
Kiến trúc chi tiết này giúp nâng tầm tư duy xây dựng Agent thực chiến.
Mình có vẽ sẵn sơ đồ tương tác kèm tài liệu hướng dẫn cấu hình thực tế cho anh em bên dưới bình luận nhé 👇
https://t.co/CxNLmGUsuJ
⚡ Bạn biết Python. Biết gọi API. Nhưng vẫn chưa build được AI agent chạy 24/7?
Vấn đề thường không nằm ở mô hình (model). Nó nằm ở kiến trúc: memory, context loop, gateway và cron.
Hermes là một ví dụ rất đáng học. Dưới đây là breakdown chi tiết 🧵
4/ GATEWAY VÀ CRON JOBS ĐỘC LẬP
Gateway (Telegram/Slack) lắng nghe bất đồng bộ và tự động dựng lại ngữ cảnh từ SQLite DB.
Cron Jobs tick mỗi phút độc lập qua jobs.json, tự động thực thi tác vụ ngầm và đẩy kết quả về gateway đích thay vì bắt người dùng gõ lệnh.
3/ THUẬT TOÁN NÉN NGỮ CẢNH (CONTEXT COMPRESSION)
Để tránh tràn token trong các workflow dài, Hermes tự động nén ngữ cảnh khi vượt ngưỡng 50% context window.
Một prompt chuyên sâu sẽ tóm tắt mục tiêu, key decisions và active state để gộp vào context mới, giải phóng hoàn toàn tin nhắn cũ.
2/ BỘ NHỚ PHÂN TẦNG THỰC DỤNG
Không nhồi nhét mọi thứ vào Vector DB, Hermes chia bộ nhớ thành:
- soul.md: Hành vi cốt lõi, tính cách và goals bất biến.
- user.md: Tích lũy preference và bối cảnh làm việc của người dùng.
- memory.md: Lưu bài học và workflow kỹ thuật tự học được.
1/ TRÁNH BỊ "MẤT TRÍ NHỚ" DÀI HẠN
Chatbot thông thường chỉ hoạt động tốt trong ngữ cảnh ngắn, nhưng không duy trì được trạng thái công việc dài hạn. Khi phiên chat kết thúc, mọi dữ liệu biến mất.
Hermes giải quyết bằng AGENT LOOP khép kín: Nhận tin ➔ Context ➔ LLM ➔ Tools ➔ Cập nhật bộ nhớ.
👉 GitHub mã nguồn mở: https://t.co/0eeHVHIKFT
👉 Bản chạy Cloud thử nghiệm: https://t.co/Te5gJhgwa7
👉 Tham gia miễn phí nhóm học AI thực chiến miễn phí
https://t.co/CxNLmGUsuJ
⚡ Bạn biết Python. Biết gọi API. Vậy tại sao AI của bạn vẫn bị nhốt trong ô chat và không thể làm việc thực tế?
Không phải do LLM yếu — do thiếu ĐÔI TAY.
Hầu hết các công cụ AI hiện tại chỉ biết "nói". Chúng viết code, tóm tắt văn bản xuất sắc nhưng không thể chạm vào thế giới web thực sự để hành động.
Browser Use phá vỡ giới hạn đó.
Nó không phải là bot click chuột thông thường. Đây là thư viện mã nguồn mở giúp AI tự mở Chrome, cuộn trang, click nút, đọc nội dung và điền form y hệt một người dùng thật.
Triết lý cốt lõi: Kết nối trực tiếp qua Chrome DevTools Protocol (CDP). AI tự viết JavaScript điều khiển trình duyệt mà không cần lớp trung gian rườm rà.
Kết quả? Tỷ lệ thành công gần 90% trên các tác vụ web phức tạp nhiều bước.
Chỉ cần cài đặt đúng 1 dòng lệnh
Và bạn có thể ra lệnh bằng tiếng Việt:
- Tìm chuyến bay rẻ nhất đi Bangkok ngày mai, trả về chi tiết giá.
- Vào Amazon tìm linh kiện giá tốt nhất và gom link.
- Mở localhost:3000, test thử mọi tính năng và tìm bug.
AI tự thao tác, bạn đi pha cà phê. Bản mã nguồn mở này hoàn toàn miễn phí, dữ liệu lưu cục bộ cực an toàn.
Chi tiết tài liệu và link tải ở bình luận bên dưới nhé!
Chi tiết code mẫu và sơ đồ kiến trúc SVG cho vòng lặp này đã được upload trong cộng đồng KHOA AI. Anh em join để tải về dùng nhé:
👉 https://t.co/CxNLmGUsuJ
AI Agent tự nâng cấp kỹ năng bằng cách nào?
Inner Loop: chạy task và lưu trace.
Outer Loop: đọc log + feedback, rồi tạo PR vá file SKILL.md.
Video khoảng 1 phút bên dưới minh họa cơ chế Self-Improvement Loop này. 👇
#AIAgents#Software3#LoopEngineering
Nguyên tắc: "Judgment before autonomy."
AI lặp qua 11 gates để nâng chất đến 90%. Human quyết định 10% cuối.
Nếu AI marketing của bạn đang bỏ qua bước này → bạn đang scale Slop.
Sơ đồ kiến trúc đầy đủ:
https://t.co/DUGfugikfw
Source: @shannholmberg
#AIMarketing #LoopEngineering
Coding agent biết khi nào xong → tests pass = done.
Marketing agent thì không có tín hiệu cứng nào.
Đây là tại sao hầu hết "AI Marketing" đang sản sinh Slop mà không hay biết. 🧵
Nghề Prompt Engineer vừa bị khai tử ngầm.
Trưởng dự án Claude Code tại Anthropic chia sẻ: Tôi không còn tự tay gõ prompt cho Claude nữa. Tôi xây dựng các vòng lặp chạy ngầm để chúng tự viết prompt cho nhau.
Đó là KỸ NGHỆ VÒNG LẶP (Loop Engineering). Chi tiết 5 mảnh ghép dưới đây. (1/5)
Coding Loop (theo @shannholmberg):
Act → Run checks (tests, build, typecheck, benchmark) → All green? → Done.
Môi trường TỰ BÁO khi sai. Agent có thể tự trị hoàn toàn.
Marketing Loop thì khác...
11 Judgment Gates — 3 cổng bất ngờ nhất:
➙ Taste: Thực sự xuất sắc, hay chỉ là "xong việc"?
➙ Timing: Đúng thời điểm, hay chỉ đúng tốc độ?
➙ Do nothing: Bản gốc đã tốt hơn? Nếu vậy — đừng sửa.
Cổng cuối này là khó nhất: dám dừng lại khi không cần sửa.
@shannholmberg Marketing Loop:
Act → Run 11 Judgment Gates → Gates clear? → Worth a human decision.
Tại sao cần 11 cổng? Vì:
Bài content tệ vẫn publish được.
Landing page nhạt vẫn load được.
Chiến dịch kém vẫn tiêu tiền của bạn.
Không có compiler báo lỗi ở đây.
🔍 Tôi vừa đọc source code Hermes Agent và phát hiện ra điều hầu hết mọi người bỏ qua:
Framework này không chạy 1 vòng lặp.
Nó chạy 8 — đồng thời — ở các quy mô thời gian khác nhau.
Và chúng compound lẫn nhau.
Đây là toàn bộ kiến trúc 🧵
So sánh nhanh:
Chat wrapper: 1 loop
LangChain/CrewAI: 2-3 loops
DSPy: Optimize prompts (không phải runtime loops)
Hermes: 8 loops đan xen từ ms đến weekly
Câu hỏi để đánh giá bất kỳ AI framework:
"Phiên ngày 90 có tốt hơn ngày 1 không?"
Nếu không → đó là chatbot, không phải agent.
Điều quan trọng là chúng COMPOUND:
Skills (L3) → /goal (L2) nhanh hơn
Curator (L4) → Search kỹ năng chính xác hơn
Memory (L5) → Context tức thì mỗi phiên
Kanban (L6) → Nhiều /goal song song
Compression (L7) → Cost không vượt tầm kiểm soát
Sub-agents (L8) → x3 năng lực xử lý
Kết quả: Agent ngày 90 nhanh hơn 40% so với ngày 1 của chính nó.