Home
Language
English
Türkçe
Bahasa Indonesia
About
Privacy Policy
Terms of Service
Pricing
Sign In
Download All
Share
海拉鲁编程客
@hylarucoder
🖥️ 探索 Agent 的边界 📌 油管「海拉鲁编程客」 🌸 沦为程序员的段子手
👉 和一群小伙伴在构建
Joined December 2011
1.1K
Following
23.1K
Followers
16.9K
Posts
海拉鲁编程客
@hylarucoder
about 11 hours ago
@hd_nvim
@acgotaku311
@cursor_ai
传出去, 马斯克跪求不得的男人
海拉鲁编程客
@hylarucoder
about 12 hours ago
提示词注入是吧?
hfimath
@hfimath
about 22 hours ago
在同一個函式裡嗎 😨
海拉鲁编程客
@hylarucoder
about 13 hours ago
@iamai_omni
存算一体容易堆代码. 但不容易 scale
海拉鲁编程客
@hylarucoder
about 19 hours ago
草, 自己想了两天, 不如看你逗哥的文章.....
idoubi
@idoubicc
15 days ago
聊一聊 Agent 的存算分离架构设计👇 一个有灵魂,有记忆的 Agent,一次任务的生命周期包括以下步骤 1. 用户输入 query(text + files) 2. Agent 读取提示词文件(soul.md,identify.md,user.md 等) 3. Agent 读取可用的工具和技能(tools,skills 等) 4. Agent 读取记忆(memory.md,memory_search 查询) 5. Agent 构建上下文(prompt + tools + memory + query) 6. Agent 进入 Loop(LLM 调用 → 工具调用 → 观测 → 再推理) 7. Agent 交付结果(Artifacts) 什么需要存:提示词文件,工具和技能,对话记录,交付产物 什么需要算:上下文拼接,LLM 调用,工具调用 简单表示这个过程 fn(query, agent runtime) = artifacts 我们可以把 agent 运行方式简单分为三类 1. 本地裸机运行 2. 本地带沙盒(sandbox)运行 3. 云端多副本运行 --- 1. 本地裸机运行,是 OpenClaw 之类 Agent 的常见模式。Agent 提示词文件、skills,对话记录(sessions)全部存在本地磁盘,Agent 执行任务时,会在固定 workspace 目录下运行,用户上传的文件、Agent 产出的文件全部落在同一个 workspace,Agent Loop 完全依赖本地文件构建上下文和执行工具调用,存跟算是一体的。 这种模式好处是足够简单,避免了额外的文件挂载开销,弊端在于安全性,比如 Agent Loop 执行了一个 exec(rm -rf /) 工具调用,很容易对宿主机产生破坏 2. 本地带沙盒运行,是 Codex 之类的 Agent 的常见模式。主要解决两个问题。一是防止 Agent 越权操作,提高安全性;二是解决宿主机的依赖缺失导致工具调用异常的问题。 Agent Loop 执行工具调用时,涉及到敏感操作或者有外部依赖时,把宿主机的 workspace 目录挂载到 sandbox,在 sandbox 执行工具调用,输出产物自动同步到宿主机的 workspace 目录 这种模式下的存算分离,只在工具调用环节引入 sandbox 来动态计算,存储主要靠宿主机的文件系统 3. 云端多副本运行,是 Manus 之类的工具型 Agent 的常见模式。主要特点是多租户,多任务,长时间运行 像 genspark claw,kimi claw,max claw 之类的托管版小龙虾,本质上是在云端多副本运行的助理型 Agent,每个用户有独立的提示词文件,动态安装的 skills,需要长期记忆 这类 claw 托管服务,最简单的实现方式是搭建一套 k8s 集群,在每个 pod 部署一套 Agent 框架(OpenClaw,harmes 等),通过 pvc 挂载云硬盘,实现对用户资料的持久化存储。通过负载均衡策略把每个用户的请求路由到固定的 pod,在同一个 pod 做 Agent Loop,存算是一体的,每个 Agent 有独立的运行空间。这种方案隔离性很好,不好的地方在于 pod 需要常驻,运行成本很高,难以规模化 --- 云端 Agent 需要规模化(scalable),必然要结合 serverless 架构做存算分离。计算层依赖 k8s 集群的调度机制动态扩缩容,水平扩展 Agent 网关的并发处理能力 存储层结合 Agent 的运行生命周期,不同阶段的产物用不同的存储方案,主要分为四种 1. 热状态。Agent Loop 的 step,plan,游标等状态,用 kv(redis)来存,高性能,低延迟,用于异常重启后的断点恢复 2. 对话和任务记录。在任务完成后用关系型数据库(postgres)来存 3. 长期记忆。基于对话/任务记录做摘要,提取成记忆,用向量数据库(pgvector,milvus)来存 4. 工作产物。包括用户上传的文件,Agent 输出的文件,系统内置的 tools,动态创建的 skills 等,用对象存储(s3,oss)来存 --- 以 FastClaw 为例,演示基于存算分离架构的云端 Agent 的运行过程👇 1. 一套 k8s 集群,日常 2 个 pod,部署 fastclaw gateway,接收用户请求 2. 负载均衡把用户请求路由到其中一个 pod,Agent 开始计算逻辑: 2.1 从 db 读取提示词文件(soul,identity,user) 2.2 初始化 pod 内一个临时目录作为 workspace 2.3 初始化 sandbox,挂载 workspace 2.4 从对象存储下载用户资料和系统 skills 到 workspace 2.5 调用 memory_search 工具,从向量数据库查询记忆 2.6 拼接上下文,调用 llm,解析工具 2.7 在 sandbox 执行工具调用,读写 workspace 内的文件 2.8 把 Agent Loop 过程中的状态设置为 checkpoint,保存到 kv 2.9 Agent 输出结果给用户 3. 通过惰性检查,把不活跃的 sandbox 关闭,关闭前把 sandbox 内 workspace 的文件上传到对象存储 以上的存算分离架构,计算层依赖 pod + sandbox,pod 水平扩容支持并发调用,sandbox 承接少量的工具调用,使用 e2b 作为 sandbox 可以做到秒级启动,构建 sandbox 池可以提高并发容错;存储层依赖 kv + db + vector db + oss 的组合使用,瓶颈在于 io 延迟 这套架构最大的挑战在于分布式多副本场景下的数据一致性,需要合理使用锁机制和负载均衡策略。 理解了这套架构,再去看 Manus,Claude managed agents 的实现,就很好理解了。 篇幅有限,不能详述细节,欢迎留言讨论。🤗
See More
Who to follow
Edward
@edward40e
Andy Stewart
@manateelazycat
懒猫微服CEO、前Deepin CTO、不端不装 仗剑走天涯 懒猫微服购买链接 https://t.co/KVqgWHE3yR 懒猫微服有啥用?https://t.co/SF9p24C2IS
Wey Gu 古思为
@wey_gu
Build things, troubleshoot& sing. Co-Founder @NowledgeLabs, build @NowledgeMem& https://t.co/RVZI2oX9pr Microsoft MVP. Feminist. Prev @NebulaGraph, @Ericsson Cloud
海拉鲁编程客
@hylarucoder
about 21 hours ago
@blackanger
怀念 sonnet 3.7 熟练背诵 95.8% 哈利波特的时代? 👀
海拉鲁编程客
@hylarucoder
about 21 hours ago
@plutoless_zhang
蛮好用的
海拉鲁编程客
@hylarucoder
1 day ago
?!!!
hdulei
@hdulei
1 day ago
今天把老glm pro转租出去了。兄弟们,AI一定要订阅年费呀!755的年费。目前已经回收300块了 😜 走的是海哥的邀请码
@hylarucoder
海拉鲁编程客
@hylarucoder
1 day ago
K2.7 Code 青春版👀
海拉鲁编程客
@hylarucoder
1 day ago
风陵渡口初相遇 一见肥波误终身
Baye
@waylybaye
1 day ago
Codex 用 GPT 5.5 xhigh + Fast mode 能看到一点她的影子,但终究不是她。
海拉鲁编程客
@hylarucoder
2 days ago
@tianyi
@kejunz
👀 贴要求, 帮你转发哈哈哈哈
海拉鲁编程客
@hylarucoder
2 days ago
@riverleaf88
https://t.co/G5Ovpq4Opl 老板, 要不要试试我专门给 gpt 5.5 写的格局 skill, 有一定几率开启尤利卡时刻
海拉鲁编程客
@hylarucoder
3 days ago
@CuiMao
本来还在犹豫买不买呢, 准备下单了
海拉鲁编程客
@hylarucoder
3 days ago
yeah
管四
@guansi
4 days ago
Anthropic 最重要的贡献,可能不是做出了 Claude Fable 5,而是证明了这种级别的模型是可以被训练出来的,而且周期并没有大家想象得那么长。 一旦路径被验证,OpenAI 会跟,Google 会跟,国产厂商大概率也会跟。Fable 5 关门当然能延缓扩散,但关不住方向。 技术革命最有意思的地方就在于,很多时候最难的不是复制,而是证明它能做到。一旦有人证明了,剩下的往往只是时间问题。
海拉鲁编程客
@hylarucoder
3 days ago
@pearlher
@LeonLRedfield
如果把幻觉定义为出错, fable 5 和 gpt 5 high/xhigh/pro 相对少一些.
海拉鲁编程客
@hylarucoder
4 days ago
GLM 5.2 发布了,受邀提前两天参与了内测。 结论:支持 1M 上下文后,开发体验提升非常明显。 在上期视频中,干活时 GLM 5.1 相比 DeepSeek Pro 压缩频率偏高,毕竟 Cursor 第一句对话就能占掉 31.6k 的上下文。 支持 1M 上下文后,开发体验顺滑了很多,例如: - 架构判断需要更多上下文,现在可以直接引用几个大模块综合判断, 之前得指定多agent, 但单 agent 效果通常会更好一些. - 减少了不必要的手工操作。以前开发时,我需要使用两段 plan 来给 GLM 5.1 或 DS “超频”(如图1) , 这里有一部分的原因就是为了开多个 agent 来扩充上下文. 现在 单 agent 跑的也很顺 - debug 时拉起一整条长链路也没有太大压力, 低价读日志/tracing 分析可真的美滋滋 我对 GLM 5 系唯一的缺憾就是视觉👀 , 希望早点支持. 另外, fable 又是受限又是下线, 多少会有供应链风险, 最后还是得相信开源模型!
See More
海拉鲁编程客
@hylarucoder
3 days ago
@LeonLRedfield
有幻觉的,当然幻觉也不完全是坏事。 如果你日常使用在它训练的甜点区,感受不到太多幻觉,我自己用的时候明显感觉张口就来的情况太多。
海拉鲁编程客
@hylarucoder
3 days ago
@Arcadia_Bao
左冷禅和岳不群?
海拉鲁编程客
@hylarucoder
4 days ago
有 typo,claude code 第一句话占了 31.6k的上下文
海拉鲁编程客
@hylarucoder
4 days ago
@Xin_Jin1018
@yaosiscom
yeah...... 我觉得 4.6 蛮好. opus 4.6 和 codex 5.5 是互补的. 4.8 很难互补, 幻觉太高.
海拉鲁编程客
@hylarucoder
4 days ago
@Limichange2
evermind
海拉鲁编程客
@hylarucoder
4 days ago
😂 没有 fable 5 的 Claude 订阅也不是很刚需。。。。。。 退款去了
Last Seen Users on Sotwe
jind Jan sarkar
Seen from
Pakistan
عنتيل النسوان الكبيره
Seen from
Egypt
Gloryholeswallowr
Seen from
Canada
princess khy
Seen from
Germany
Indo bokep 18+
Seen from
Singapore
bob
Seen from
Singapore
مرزیا کوهی
Seen from
Pakistan
Ugur3133
Seen from
Turkey
Olgun
Seen from
Turkey
ชอบคนแก่
Seen from
Thailand
Trends for you
1
Messi
Under 10K tweets
2
Caleb
Under 10K tweets
3
Zidane
Under 10K tweets
4
#WWENXT
Under 10K tweets
5
#summerhouse
Under 10K tweets
6
Arrowhead
Under 10K tweets
7
KEEP SWIMMING
Under 10K tweets
8
Lautaro
Under 10K tweets
9
Melanie and Sincere
Under 10K tweets
10
Gabe
Under 10K tweets
Most Popular Users
1
Elon Musk
@elonmusk
240.3M followers
2
Barack Obama
@barackobama
119.3M followers
3
Donald J. Trump
@realdonaldtrump
111.6M followers
4
Cristiano Ronaldo
@cristiano
109.6M followers
5
Narendra Modi
@narendramodi
106.9M followers
6
Rihanna
@rihanna
97.4M followers
7
NASA
@nasa
92.1M followers
8
Justin Bieber
@justinbieber
90.7M followers
9
KATY PERRY
@katyperry
87.2M followers
10
Taylor Swift
@taylorswift13
81M followers
11
Lady Gaga
@ladygaga
72.6M followers
12
Kim Kardashian
@kimkardashian
69.6M followers
13
Virat Kohli
@imvkohli
69.1M followers
14
YouTube
@youtube
68.6M followers
15
Bill Gates
@billgates
63.6M followers
16
The Ellen Show
@theellenshow
62.5M followers
17
CNN
@cnn
61.9M followers
18
Neymar Jr
@neymarjr
61.8M followers
19
X
@x
60.9M followers
20
Selena Gomez
@selenagomez
60.3M followers
Olivia
Online
✨
⭐
💫