Home
Language
English
Türkçe
Bahasa Indonesia
About
Privacy Policy
Terms of Service
Pricing
Sign In
Download All
Share
Flow
@ldneedu
Joined June 2012
53
Following
2
Followers
22
Posts
ldneedu
retweeted
小盖
@xiaogaifun
12 days ago
https://t.co/sshHthPn3R
Flow
@ldneedu
18 days ago
@dotey
支持一把,没有就去买
ldneedu
retweeted
铁锤人
@lxfater
19 days ago
https://t.co/qPc7zO3ypc
ldneedu
retweeted
Mr Panda
@PandaTalk8
19 days ago
Prompt、Context、Harness 工程全景图 做 LLM Agent 应用时,很多人只关注 Prompt。 但真正稳定、可控、可复现的 AI 应用,通常由三层组成: Prompt Engineering、Context Engineering、Harness Engineering。 它们像三个同心圆: 最内层是 Prompt Engineering,决定模��这一次要“做什么”。 中间层是 Context Engineering,决定模型此刻“知道什么”。 最外层是 Harness Engineering,决定模型“如何可靠地做,并持续变好”。 1. Prompt Engineering:指令层 Prompt 是最内层,也是最直接的一层。 它负责告诉模型: 你是谁? 你要完成什么任务? 你应该按照什么步骤思考? 你要遵守哪些约束? 最终输出成什么格式? 一个好的 Prompt 通常包含几个核心要素: 角色 Persona:定义模型扮演的角色。 目标 Purpose:明确这次任务要达成什么。 流程 Process:告诉模型按照什么步骤完成。 约束 Policy:限制边界、风格、长度、格式。 输出 Presentation:规定输出结构,比如 JSON、表格、Markdown。 自检 Proof:要求模型在输出前检查逻辑和错误。 Prompt Engineering 解决的是单次调用质��问题。 它让模型更容易理解任务,更稳定地输出符合预期的结果。 但 Prompt 有一个明显限制: 它只能影响模型这一次怎么回答,无法保证模型长期拥有正确、完整、实时的信息。 2. Context Engineering:上下文层 Context Engineering 是中间层。 它解决的问题是: 模型在回答之前,应该拿到哪些信息? 在真实产品里,模型不能只靠内置知识回答。它需要结合: 用户输入 历史对话 知识库 文档 网页 数据库 API 工具执行结果 短期记忆和长期记忆 Context Engineering 的核心能力,是把这些信息进行管理: 先检索,再筛选; 先压缩,再排序; 再把最重要的信息注入给模型。 常见流程是: 用户提出问题。 系统从知识库或数据库中检索相关内容。 对结果进行过滤、去重、排序。 把长内容压缩成模型能理解的摘要。 最后将高价值信息放入上下文窗口。 Context Engineering 解决的是信息质量问题。 它让模型少猜测、少幻觉、少遗漏。 如果上下文太少,模型会编。 如果上下文太多,模型会分不清重点。 如果上下文顺序混乱,模型会被无关信息干扰。 如果上下文过期,模型会基于错误事实做判断。 所以,Context Engineering 的关键不是“塞更多信息”,而是“给模型刚好需要的信息”。 3. Harness Engineering:外层系统层 Harness Engineering 是最外层。 它解决的问题是: 如何让 AI 应用可靠运行、持续迭代、可以上线? 这里的 Harness,可以理解为模型外部的工程框架和运行系统。 它包括: Agent Loop 工具调用系统 权限控制 错误处理 日志追踪 Guardrails 自动化测试 评估系统 版本管理 成本控制 部署发布 监控告警 如果说 Prompt 是指令,Context 是信息,那么 Harness 就是执��环境。 一个典型 Agent Loop 包含三步: 第一步:收集上下文。 第二步:��取行动。 第三步:校验结果。 如果结果不满足条件,就继续反馈、修正、重试,直到完成任务或触发停止条件。 Harness Engineering 解决的是可靠性问题。 它让模型输出可以被验证,工具调用可以被追踪,错误可以被恢复,系统可以持续优化。 没有 Harness,AI 应用很容易停留在 Demo 阶段。 有了 Harness,AI 才能进入真实业务流程。 三层之间的关系 这三层不是互相替代的关系,而是逐层增强。 Prompt Engineering 关注单次表达。 它决定模型要做什么。 Context Engineering 关注信息供给。 它决定模型知道什么。 Harness Engineering 关注系统运行。 它决定模型如何可靠地做,并且持续变好。 一个简单的总结是: Prompt 决定任务。 Context 决定知识。 Harness 决定可靠性。 常见错误 很多 AI 应用效果不好,问题通常不在模型本身,而在工程层设计不完整。 常见的 Prompt 错误是: 目标不清楚。 约束不明确。 输出格式不稳定。 只写一句话就期待模型完成复杂任务。 常见的 Context 错误是: 不给背景信息。 检索结果噪声太大。 上下文太长,没有压缩。 关键信息顺序混乱。 记忆机制缺失。 长期知识没有更新。 常见的 Harness 错误是: 没有工具调用闭环。 没有评估机制。 没有日志和可观测性。 没有错误恢复。 没有成本和权限控制。 没有自动化测试。 这些问题都会导致 Agent 看起来“很聪明”,但用起来“不可靠”。 最佳实践 做高质量 LLM Agent 应用,可以按照下面的顺序设计: 先定义目标和约束,再写 Prompt。 先检索相关信息,再放入上下文。 先压缩和排序,再注入模型。 所有输出都要可校验、可追踪、可评估。 用数据和评估结果驱动迭代优化。 衡量一个 Agent 是否成熟,可以看几个指标: 准确率是否提升。 相关性是否提升。 幻觉率是否下降。 任务完成率是否提高。 延迟是否可控。 成本是否可控。 失败是否可以恢复。 一句话总结 Prompt Engineering 让模型听懂任务。 Context Engineering 让模型掌握信息。 Harness Engineering 让模型可靠执行。 真正的 AI 工程能力,不只是写好一句 Prompt,而是把 Prompt、Context、Harness 三层系统化设计好。
See More
ldneedu
retweeted
meng shao
@shao__meng
23 days ago
再次强烈推荐「Agentic Engineering Patterns」 作者
@simonw
2026 年 2 月起撰写,每周约新增 1–2 章,目前仍在演进。文字由他本人撰写,示例与代码借助 LLM 辅助。 在线阅读: https://t.co/xlTAbmtJON 核心目标:如何用好 Claude Code、Codex 这类能写代码、也能执行代码的 coding agent,拿到可靠、可维护的结果。 # 核心概念:Agentic Engineering ≠ Vibe Coding Vibe Coding vs Agentic Engineering · 定义来源:Karpathy 提出 vs Willison 提出的专业实践 · 适用人群:常与非程序员原型相关 vs 专业工程师放大既有能力 · 代码质量:未审查、原型级 vs 审查、测试、可上线 · 人的角色:几乎不参与代码理解 vs 定义问题、验证结果、持续改进 harness Agent 的定义: 在循环中调用工具以达成目标。Coding agent 的关键差异是能执行代码——没有执行能力,LLM 输出价值有限;有了执行,agent 才能迭代到"确实能跑"的软件。 人的工作并未消失,而是上移: · 决定写什么代码(问题空间有��十种解法与权衡) · 提供工具与足够细的规格 · 验证结果是否稳健可信 · 把经验写回指令与 harness(LLM 本身不会从错误中学习,但系统可以) # 全书最重要的一个判断 写代码变便宜了,写好代码并没有。 过去几十年,工程习惯都建立在"代码昂贵"之上: · 宏观: 大量设计、估算、排期,功能必须数倍覆盖开发成本 · 微观: 是否重构、写测试、补文档、做 debug UI——每个决定都受时间约束 Agent 把这个约束打碎。一个人还能并行跑多个 agent,同时实现、重构、测试、写文档。 但"好代码"仍有明确标准: · 能跑、且被证明能跑 · 解决对的问题 · 处理错误路径,不只 happy path · 简洁、可维护 · 有测试与合适文档 · 设计留出演进空间(YAGNI 与可扩展性的平衡) · 满足安全、可观测性等 non-functional 要求 新习惯: 当直觉说"不值得做"时,不妨开个异步 agent 试一下——最坏情况是浪费几分钟 token;很多过去"不划算"的改进,现在值得做。 # 五大原则层(Principles) 1. 定义边界 Agentic Engineering 是专业工程师用 coding agent(能写能跑)放大能力;不等于 vibe coding(不审代码的原型玩法)。人的核心工作:定目标、给工具、验结果、把经验写回 harness。 2. 接受新约束 写代码几乎免费,写好代码仍然贵。旧习惯(过度规划、跳过测试/文档/重构)要推翻;直觉说「不值得做」时,不妨开个异步 agent 试一下。 3. 囤积可复用解法 积累带可运行证明的代码片段(仓库、笔记、小工具)。最强用法:把两个已验证例子拼进 prompt,让 agent 组合出新方案;每个技巧人类只需解决一次。 4. 质量应上升,而非下降 技术债、命名混乱、大文��拆分等「简单但耗时」的清理,交给后台 agent 做,成本已低到可零容忍 code smell;用原型并行验证技术选型;任务结束做回顾,把有效做法写进指令(复合工程)。 5. 严守反模式 绝不提交自己没审过的 PR。合格标准:确信能跑、体量小、有上下文、描述自己读过、附测试证据。否则只是把活甩给 reviewer。 # 实操层:与 Agent 更好的协作 1. 先懂机制,再谈用法 Agent = LLM + 系统提示 + 工具循环。你不必背实现细节,但要清楚: · 对话越长越贵;agent 会尽量利用 token 缓存 · 模型无状态,每次重放上下文 · 能执行代码才是 coding agent 与普通 LLM 的分水岭 · Reasoning/Thinking 对调试复杂问题尤其有用 2. Git:大胆用,不必背 把 Git 当 agent 的「时间机器」和「安全网」: · 新会话恢复上下文:Review changes made today · 救场:Sort out this git mess for me · 找丢了的代码:Find and recover my code that does ... · 定位回归:Use git bisect to find when this bug was introduced · 修 commit / 抽库留历史:Undo last commit / 从新 repo 复制模块并保留 commit 历史 3. Subagent:省上下文,不是炫技 上下文有限,大任务要「分身」: · Explore:进陌生 repo 先摸清结构,汇总给主 agent · 并行:多文件独立改动可同时跑,可用更便宜模型 · 专家(审查 / 跑测 / 调试):隐藏冗长输出,只回报结果 原则: 为省 token 而拆,不为拆而拆;主 agent 够用就别过度分工。 4. 测试:三层防线 ① TDD:先写测 → 确认失败 → 实现至通过 ② 建立测试意识:新会话先跑全套测试 ③ 手动验:python -c / curl / Playwright 真浏览器 ④ 留证:Showboat 记录命令与真实输出,防编造 5. 理解代码:还认知债 Agent 产出若成黑盒,会积累 认知债(类似技术债,拖慢后续决策): · Linear walkthrough:线性导读,用 grep/cat 引用代码,禁止手抄 · Interactive explanation:在导读基础上做可暂停、可调速的动画演示 适用: 陌生代码、自己忘了细节的代码、vibe code 出来却没看过的代码。
See More
ldneedu
retweeted
Serena
@369Serena
about 1 month ago
https://t.co/KMcbAWCbRS
ldneedu
retweeted
Vince 聊开发
@vincemask
about 2 months ago
https://t.co/9LFFvTzNle
ldneedu
retweeted
知野
@knoYee_
about 1 month ago
https://t.co/3L8fonzqcX
ldneedu
retweeted
老爸的AI联萌
@ChrisWangwy
about 1 month ago
https://t.co/k9tNPfr8qn
ldneedu
retweeted
苍何
@canghe
about 1 month ago
https://t.co/0qtZ0boeBs
ldneedu
retweeted
sonofmagic
@sonofmagic95
about 1 month ago
7 月 18 号,我将在 Vue&Vite Conf 分享 Weapp-vite 对小程序工程化的重新思考, 看看下一代工具链是如何重塑小程序工程化体验的 😀 官方网站:https://t.co/xgaspqEkkP
ldneedu
retweeted
AI搞钱Hacker
@gaoqian2580
about 1 month ago
https://t.co/hveso8v1aJ
ldneedu
retweeted
Ren
@Ryrenz
about 2 months ago
https://t.co/vaAFLJB2jp
ldneedu
retweeted
鸟哥 | 蓝鸟会🕊️
@NFTCPS
about 2 months ago
卧槽,一天就能把Claude玩明白?这份指南我他妈直接跪了 我告诉你,这玩意儿不是人学的,是神学的。但是今天,只要你肯花一天时间,我保证你从菜鸡变成Claude高手。不吹不黑,这份教程简直是把饭嚼碎了喂你嘴里。 先来第1级,24分钟搞定基础(别嫌短,够用了) 🔹 Claude傻瓜指南:从零到入门,看完你就能跟别人吹牛逼了 🔹 Claude设置:别傻乎乎直接开干,先把环境调好 链接在这: https://t.co/cOVLXKWzqk https://t.co/IUXXX6HT1Y 接着第2级,1小时实战工作流(别只看,动手干) 1 Claude协作:一个人干活的效率,顶你团队三天 2 Claude团队版:别一个人吃独食,拉上兄弟一起干 3 Claude设计:从设计到出图,手把手教你做老板都点赞的东西 4 协作+项目:把Claude变成你的远程员工 5 Claude幻灯片:别再熬夜做PPT了,让AI替你打工 6 Claude技能:解锁隐藏功能 链接在这: https://t.co/Uu81jWQ38g https://t.co/W117GA8936 https://t.co/wN5PMdNIML https://t.co/JUCG6z8Xlh https://t.co/MuDoFnlDwX https://t.co/FV0YB0djw9 然后是第3级,3.5小时专业技巧(这才是真干货) 🔥 避免奉承:别让AI拍你马屁,要让它说实话 🔥 Claude代码:写代码、改bug,它比你隔壁的程序员靠谱 🔥 Claude 101:官方培训课,必看 🔥 突破Claude限制:别再问“还能再回答吗”,直接打破天花板 🔥 停止瞎提示:别再发“帮我写个东西”这种废话 链接在这: https://t.co/sITjoA2EqV https://t.co/HWNrhaah2b https://t.co/DrlGHtD4cD https://t.co/2xPIANFVby https://t.co/x9KnKwwXKa 最后第4级,8小时专家模式(装逼必备) 🚀 Claude电脑:把Claude装进电脑里,直接操控桌面 🚀 用Claude API构建:写代码、搭应用,你也能做二次开发 链接在这: https://t.co/0ME7ckbQXa https://t.co/sobW0u3H6P 专业提示:别他妈一口气看完,你消化不了。每次学一级,然后立马去用。学完一级就停下来,把学的东西用到工作中,用熟了再学下一级。 你想想,别人还在那儿发傻提问“Claude怎么用”的时候,你已经能一边用Claude写代码,一边用Claude做PPT,一边还用Claude调API。这不就是降维打击吗? 别废话了,赶紧收藏起来。今天不学,明天就落后。明天不学,后天就只能看着别人吃肉。
See More
ldneedu
retweeted
老金
@freeman1266
about 2 months ago
https://t.co/EgXwQjnWe2
ldneedu
retweeted
傅盛
@FuSheng_0306
2 months ago
https://t.co/vHD67c6Waz
ldneedu
retweeted
Dr. Moyu|摸鱼局长
@Jason23818126
2 months ago
AI 学习最大信息差来了! 很多人刷二手总结就停了,真正高手都在挖一手 YouTube
@Smartpigai
这篇实操写的不错,总结了5 类核心资源: • 大佬访谈(Lex Fridman等) • 大会分享(YC/Sequoia) • 官方频道(OpenAI/Anthropic) • 实战教程 • Karpathy底层课 多看一手,认知差自然拉开,顺便推荐大家关注他,来自国内大厂的搞钱程序员!
ldneedu
retweeted
程序员鱼皮
@yupi996
2 months ago
https://t.co/TNgc8waPoR
ldneedu
retweeted
宝玉
@dotey
2 months ago
https://t.co/c53sSkOPTr
ldneedu
retweeted
Jason Zhu
@GoSailGlobal
3 months ago
https://t.co/yN3rPdU3uN
Last Seen Users on Sotwe
عراقي
Seen from
Turkey
Plussize Dilara
Seen from
Netherlands
pemuas stw
Seen from
Indonesia
boynozlu_hedonist
Seen from
Turkey
mardin
Seen from
Turkey
ustadzah umi laila
Seen from
Indonesia
PantyhoseFan77
Seen from
Netherlands
Claude Mccarthy
Seen from
Thailand
🎃ชื่นชอบการชักว่าวกับเกงใน/เสื้อใน...สาวๆ🎃
Seen from
Thailand
mama
Seen from
Indonesia
Trends for you
1
Cape Verde
Under 10K tweets
2
Taylor
Under 10K tweets
3
#ARGCPV
Under 10K tweets
4
Egypt
Under 10K tweets
5
Licha
Under 10K tweets
6
Happy 4th
Under 10K tweets
7
Drummond
Under 10K tweets
8
Ducks
Under 10K tweets
9
JUST&T MARRIED
Under 10K tweets
10
WHAT A GOAL
Under 10K tweets
Most Popular Users
1
Elon Musk
@elonmusk
240.7M followers
2
Barack Obama
@barackobama
119.2M followers
3
Donald J. Trump
@realdonaldtrump
111.7M followers
4
Cristiano Ronaldo
@cristiano
110.7M followers
5
Narendra Modi
@narendramodi
107M followers
6
Rihanna
@rihanna
97.7M followers
7
NASA
@nasa
92.2M followers
8
Justin Bieber
@justinbieber
90.9M followers
9
KATY PERRY
@katyperry
87.7M followers
10
Taylor Swift
@taylorswift13
81.6M followers
11
Lady Gaga
@ladygaga
73.1M followers
12
Virat Kohli
@imvkohli
70M followers
13
Kim Kardashian
@kimkardashian
69.8M followers
14
YouTube
@youtube
68.7M followers
15
Bill Gates
@billgates
63.9M followers
16
Neymar Jr
@neymarjr
62.8M followers
17
The Ellen Show
@theellenshow
62.4M followers
18
CNN
@cnn
61.9M followers
19
X
@x
60.8M followers
20
Selena Gomez
@selenagomez
60.8M followers
Olivia
Online
✨
⭐
💫