paulkuo

@zarqarwi

不要問我是誰，也不要希望我永遠不變

taipei

Joined February 2009

166 Following

106 Followers

2.8K Posts

zarqarwi retweeted

Andrej Karpathy

@karpathy

2 days ago

This is a new paradigm for interacting with Claude that is significantly more "inline" with all the other human activity org-wide. Once you do all of the under the hood engineering work to make this "just work" (e.g. across tools, integrations, compute environments, memory, security, etc.), Claude basically joins the team in a seamless way - you can talk to it as you would talk to a person and it can help with a very large variety of workloads. Imo this is the 3rd major redesign of LLM UIUX. The first paradigm was that the LLM is a website you go to, the second was that it is an app you download to your computer. This third one is that it is a self-contained, persistent, asynchronous entity with org-wide tools and context, working alongside teams of humans. It really takes a while to wrap your head around it, but it works and it is awesome.

21K

12K

paulkuo

@zarqarwi

4 days ago

我一直都有習慣把自己日誌記錄下來，以前做軟體時，開發的過程也很想記錄下來。做起來才發現，記錄本身也是一件很耗力的事。資料要整理、圖表要製作、狀態要回頭回想，很多時候專案都已經往前走了，紀錄卻還停在後面。現在很不一樣。透過多 AI Agent協作，開發狀態可以動態偵測，commit、部署次數、程式碼變化、AI 對話量、token 使用量，甚至最常工作的時段，都可以即時被看見。工作不再憑感覺推進，可以隨時知道自己在哪裡、進展到什麼程度、哪一段時間累積了什麼。以及最重要的，評估成本效益。我覺得這是一個很大的改變。以前是等事情完成後，才回頭整理成果；現在則是在創造的路上，就能看見自己的軌跡。讓原本看不見的工作過程，變得可以被觀察、被理解，也可以被持續調整。對開發者(Builder)來說，這種即時的狀態感很重要。因為很多進展，不是某一天突然完成，是每天累積出來的。讓這些累積用可以被看見的形式，也有助於溝通。當有夥伴說，某些功能很簡單，或，某些功能很難。大家可以不用用猜的。猜測容易有誤解。流程可拆解，工時可評估，風險可管理，這樣的合作與協作才好管理，風險也可控，協作與合作的衝突也可以減少一點。單純開發小功能真的不難，但是系統整合成可管理的服務，並且安全的部署還是有難度。 AI 時代的工作模式，除了“加速”這個維度，還有商務判斷、品味、風險管理等項目。讓我們看見工作方式有多種可能。 AI協作紀錄：https://t.co/MculYca5SX

197

zarqarwi retweeted

Andrew

@s4yonnara

7 days ago

Andrej Karpathy spent 70 minutes breaking down how top AI users actually work with LLMs. The reality is simpler than people expect. You tell the model what you want in plain language and let it run. No 40-line system prompts. No secret tricks. By 2026 the engineer who writes off LLMs loses to the junior who just set one up properly. 70 minutes. Free. A rare straight look from an OpenAI co-founder. Bookmark it and watch.

252

345K

paulkuo

@zarqarwi

6 days ago

2003 年我從華神道碩畢業，第一份神職工作是在聖經公會參與一個跨國專案，成為編輯群一員。《加拉太書研讀本》是我主要負責統整的，我的任務是把聖經專家的考據彙整成註釋書。多年後翻開那份「第 28 校」的試讀本，當年替讀者設想的默想題，如今再看到過去的文字；加拉太書那句「你不是奴僕，乃是兒子」，仍然讓我很感動。文字是一個層次，個人的歷史的軌跡是另一個層次。 https://t.co/D3UpWhCnmJ 順手整合 #Sunoai , #Geminibanana , #GrokImagine 與 #Whisper <把加拉太書 4:7 做成一首 lofi 詩歌> 顯示較少

185

Who to follow

Max

@Max_Lu

大G，連續創業者 serial entrepreneur. Max , a contributor on the earth. @Taiwan #Bitcoin

stingtao

@stingtao

If you are creating articles/blogs regularly, you can try this tool that I developed https://t.co/6AzwNnVrRy

BobYeh.eth

@bobyeh1390

Hi, I am Bob. I was an app programmer, and now a computer generated arts enthusiasm.

zarqarwi retweeted

Rahul

@sairahul1

9 days ago

Andrej Karpathy: "90% of Claude's mistakes come from missing context, not a weak model." 41% mistake rate without a CLAUDE.md. 11% with the 4-rule baseline. 3% with the 12-rule version below here are the 12 rules senior engineers settled on: 1. think before coding: state assumptions, don't guess. the model can't read your mind, stop hoping it will 2. simplicity first: minimum code, no speculative abstractions. the moment you let Claude add "for future flexibility," you've added 200 lines you'll delete next quarter 3. surgical changes: touch only what you must. don't let it improve adjacent code, that's how PRs blow up 4. goal-driven execution: define success criteria upfront, loop until verified. without them Claude either loops forever or stops too early 5. use the model only for judgment calls: classification, drafting, summarization, extraction. NOT routing, retries, status-code handling, deterministic transforms. if code can answer, code answers 6. token budgets are not advisory: per-task 4000, per-session 30000. by message 40 of a long debug, Claude is re-suggesting fixes you rejected at message 5 7. surface conflicts, don't average them: two patterns in the codebase? pick one. Claude blending them is how errors get swallowed twice 8. read before you write: read exports, callers, shared utilities. Claude will happily add a duplicate function next to an identical one it never read 9. tests verify intent, not just behavior: a test that can't fail when business logic changes is wrong. all 12 of Claude's tests can pass while the function returns a constant 10. checkpoint every significant step: Claude finished steps 5 and 6 on top of a broken state from step 4. nobody noticed for an hour 11. match the codebase conventions: class components? don't fork to hooks silently. testing patterns assumed componentDidMount, hooks broke them without surfacing 12. fail loud: "completed successfully" with 14% of records silently skipped is the worst class of bug. surface uncertainty, don't hide it what actually compounds instead of the next framework: - the CLAUDE.md file as institutional memory across sessions - eval-driven changes, not vibe-driven - checkpoints over speed - explicit conflicts over silent blending - discipline over framework, every time - one repo, one rules file, no exceptions you don't need a better AI you need better context engineering complete playbook below ↓

282

414K

paulkuo

@zarqarwi

7 days ago

我網站的「知識銀河」，是從 Karpathy 提出的 LLM Wiki 構想延伸而來。一開始，是想把自己讀過、想過、寫過的東西，透過LLM的能力整理成一個可以被觀看、被穿行、也可以被重新連結的知識空間。文字不再只是線性的排列，而像星群一樣，在一片 3D 的宇宙裡彼此牽引、碰撞、發光。讓我興奮的，不是單一功能完成，現在做出一個功能就跟吃碗滷肉飯一樣單純。而是一直以來想把音樂「整合」到文字這件事本身。我用Claude 把 Suno ai 的音樂生成能力縫進知識系統裡。當滑鼠在星群之間移動時，背景樂緩緩流動。那些原本屬於理性、閱讀、思考與書寫的東西，有了聲音，也多一層溫度。我想，知識不應只是被查詢，而應該被經驗；不只是被儲存，而應該被召喚。讓知性與藝術在同一個畫面裡呼吸。我們也許正在接近一種新的學習方式：不是把世界拆成資料，而是重新看見萬物之間的關聯。進去後，點右下角的「聲音」鈕，星圖就會響起。歡迎來逛，也歡迎來聽。 https://t.co/sQ0OsxgEQK

113

paulkuo

@zarqarwi

19 days ago

【從筆記到思想網絡：實作自己的 LLM Wiki】摘要：敘事力 vs. AI 能力這裡出現了 AI 時代最深刻的人機差異：AI 可以計算、優化、預測——但無法真正敘事。為什麼？因為敘事需要經歷。・AI 可以根據統計模式生成故事般的文本，但那些文本本身沒有發生在它身上，它無法說「我嘗試過」「我失敗過」「那改變了我」・AI 可以提供邏輯論述，但無法提供親身經驗轉化為意義的敘事・AI 可以識別敘事模式（英雄之旅、悲劇三幕式），但無法在真實不確定中創造敘事，因為創造敘事需要在不確定中做出選擇，看到選擇的後果，再把它編織成有意義的故事。（全文參考網址） ◙ 這篇短文，今年四月初 Andrej Karpathy 提出的 LLM Wiki 概念啟發後，我在自己網站上實作的一個個人知識圖譜範例。過去談個人知識管理，多半在「收藏」、「筆記」與「搜尋」。因為以前的工具很難替我們持續整理、重構與交叉引用。Karpathy 的 LLM Wiki 給我的啟發是：對你有用的知識系統，不只是把資料保存下來，而是讓資料被持續閱讀、整理、連結，讓他變成能生長的思想網絡。他在 GitHub 上公開 LLM Wiki 的概念與做法後，我就開始嘗試實作。坦白說，因為我不是技術背景出身，所以這件事並不是幾天就完成的。我花了幾個月，一邊理解概念，一邊摸索資料流程、反覆修正。三個月後才慢慢做出目前的雛形。目前我的資料來源之一，是串接自「得到大腦」（之前是 Get 筆記本）。系統會將我在得到上聽課、閱讀與標註的學習筆記彙整後，透過 API 回傳到我的桌機。接著，我每天定時匯入這些資料（data ingestion），讓它們成為 LLM Wiki 的素材。LLM 協助我進行摘要、分類、概念抽取與節點連結，最後在網站上形成可探索的知識圖譜（參考網頁）。目前這個 wiki 已經整理數十個概念、上百個節點與多條跨主題連結。這些節點分布在「智能與秩序」、「循環再利用」、「沉思與記憶」、「創造與建構」、「文明與人性」等我有興趣的主題。對我而言，也是一種新的學習方法：讓每天閱讀的的知識可輸入，不只是停留在筆記本裡，也轉化為可以回看、追問、比較、再創作，甚至被公開討論的思想資產。他也不只是一個雲端資料夾、搜尋系統，而是一個能跟我一起思考、整理與演化的個人大腦。有我自己的閱讀軌跡、問題意識、產業經驗與生命脈絡。我們成為浩瀚知識大海的一個節點，成為他者的養分。 ◙ 實作篇：如果你也想做自己的 LLM Wiki，可先把它想成一條知識管線： Raw Sources 原始資料 → Ingest 匯入 → LLM 編譯 → Wiki Pages 主題頁 → Concept Graph 知識圖譜 → 回看、追問、寫作、決策第一步，是先決定你的資料來源。這可以是閱讀筆記、Podcast 摘要、課程筆記、PDF、網頁收藏、會議紀錄，甚至是你每天寫下來的想法。重點不是資料越多越好，而是這些資料是否真的代表你的長期關注與問題意識。第二步，是保留原始資料。不用一開始就讓 AI 改寫所有內容。原始資料應該被保存下來，作為未來追溯與校正的依據。AI 可以摘要、整理與重組，但最好不要直接覆蓋你的原始筆記。第三步，是建立一個中介的 wiki 層。這一層不是原始資料，也不是聊天紀錄，而是 AI 幫你整理出來的主題頁、概念頁、人物頁、專案頁或問題頁。例如「AI 與教育」、「循環經濟」、「個人知識管理」、「創業決策」等，都可以成為一個頁面。第四步，是設計簡單的維護規則。你可以先規定：每篇新資料進來後，AI 必須產生三到五個重點摘要、抽取關鍵概念、判斷它應該連到哪些既有頁面，並標明資料來源。這些規則不需要很複雜，但它會決定你的 LLM Wiki 長成什麼樣子。第五步，是讓 AI 做交叉引用。LLM Wiki 有價值的地方，不只是摘要，而是連結。當一篇新筆記進來時，AI 應該幫你判斷它和過去哪些主題有關：是補充、衝突、延伸，還是提供新的案例？這些連結會慢慢形成你的知識圖譜。第六步，是建立定期 ingest 的節奏。你可以每天、每週或每月把新的筆記匯入，讓 AI 進行整理與更新。不是一次把所有資料整理完，而是讓系統持續生長。知識管理最難的不是狼吞虎嚥的建立，而是長期維護；LLM Wiki 的價值，是善用Ai Agent 能高效處理重複性的整理工作。第七步，是把它變成可使用的介面。你可以跟你的Ai Agent 討論，用你最舒服與方便的介面呈現。如果你跟我一樣不是工程背景，可以先從最低門檻版本開始：把每批筆記放進一個資料夾，與AI一起整理主題頁；每個主題頁包含核心觀點、相關筆記、延伸問題與交叉連結。然後再慢慢新增資料，請 AI 判斷新資料應該更新到哪些舊頁面。只要這個流程能持續運作，它就已經是 LLM Wiki 的雛形。不是擁有更多筆記，而是讓自己的知識有生命週期：輸入、沉澱、連結、修正，可用來支持你做判斷與創造的思想資產。 BTW，關於實作，以上只是參考。強烈建議一開始就讓AI Agent參與建造，探索出最適合你個人的方法。 #LLMWiki #個人知識管理 #知識圖譜 #第二大腦 #AI工作流 https://t.co/qH4xBmfYh7

zarqarwi's tweet photo. 【從筆記到思想網絡：實作自己的 LLM Wiki】

摘要：敘事力 vs. AI 能力

這裡出現了 AI 時代最深刻的人機差異：AI 可以計算、優化、預測——但無法真正敘事。

為什麼？因為敘事需要經歷。

・AI 可以根據統計模式生成故事般的文本，但那些文本本身沒有發生在它身上，它無法說「我嘗試過」「我失敗過」「那改變了我」

・AI 可以提供邏輯論述，但無法提供親身經驗轉化為意義的敘事

・AI 可以識別敘事模式（英雄之旅、悲劇三幕式），但無法在真實不確定中創造敘事，因為創造敘事需要在不確定中做出選擇，看到選擇的後果，再把它編織成有意義的故事。（全文參考網址）

◙ 這篇短文，今年四月初 Andrej Karpathy 提出的 LLM Wiki 概念啟發後，我在自己網站上實作的一個個人知識圖譜範例。

過去談個人知識管理，多半在「收藏」、「筆記」與「搜尋」。因為以前的工具很難替我們持續整理、重構與交叉引用。Karpathy 的 LLM Wiki 給我的啟發是：對你有用的知識系統，不只是把資料保存下來，而是讓資料被持續閱讀、整理、連結，讓他變成能生長的思想網絡。

他在 GitHub 上公開 LLM Wiki 的概念與做法後，我就開始嘗試實作。坦白說，因為我不是技術背景出身，所以這件事並不是幾天就完成的。我花了幾個月，一邊理解概念，一邊摸索資料流程、反覆修正。三個月後才慢慢做出目前的雛形。

目前我的資料來源之一，是串接自「得到大腦」（之前是 Get 筆記本）。

系統會將我在得到上聽課、閱讀與標註的學習筆記彙整後，透過 API 回傳到我的桌機。接著，我每天定時匯入這些資料（data ingestion），讓它們成為 LLM Wiki 的素材。LLM 協助我進行摘要、分類、概念抽取與節點連結，最後在網站上形成可探索的知識圖譜（參考網頁）。

目前這個 wiki 已經整理數十個概念、上百個節點與多條跨主題連結。這些節點分布在「智能與秩序」、「循環再利用」、「沉思與記憶」、「創造與建構」、「文明與人性」等我有興趣的主題。對我而言，也是一種新的學習方法：讓每天閱讀的的知識可輸入，不只是停留在筆記本裡，也轉化為可以回看、追問、比較、再創作，甚至被公開討論的思想資產。

他也不只是一個雲端資料夾、搜尋系統，而是一個能跟我一起思考、整理與演化的個人大腦。有我自己的閱讀軌跡、問題意識、產業經驗與生命脈絡。我們成為浩瀚知識大海的一個節點，成為他者的養分。

◙ 實作篇：如果你也想做自己的 LLM Wiki，可先把它想成一條知識管線：

Raw Sources 原始資料 → Ingest 匯入 → LLM 編譯 → Wiki Pages 主題頁 → Concept Graph 知識圖譜 → 回看、追問、寫作、決策

第一步，是先決定你的資料來源。這可以是閱讀筆記、Podcast 摘要、課程筆記、PDF、網頁收藏、會議紀錄，甚至是你每天寫下來的想法。重點不是資料越多越好，而是這些資料是否真的代表你的長期關注與問題意識。

第二步，是保留原始資料。不用一開始就讓 AI 改寫所有內容。原始資料應該被保存下來，作為未來追溯與校正的依據。AI 可以摘要、整理與重組，但最好不要直接覆蓋你的原始筆記。

第三步，是建立一個中介的 wiki 層。這一層不是原始資料，也不是聊天紀錄，而是 AI 幫你整理出來的主題頁、概念頁、人物頁、專案頁或問題頁。例如「AI 與教育」、「循環經濟」、「個人知識管理」、「創業決策」等，都可以成為一個頁面。

第四步，是設計簡單的維護規則。你可以先規定：每篇新資料進來後，AI 必須產生三到五個重點摘要、抽取關鍵概念、判斷它應該連到哪些既有頁面，並標明資料來源。這些規則不需要很複雜，但它會決定你的 LLM Wiki 長成什麼樣子。

第五步，是讓 AI 做交叉引用。LLM Wiki 有價值的地方，不只是摘要，而是連結。當一篇新筆記進來時，AI 應該幫你判斷它和過去哪些主題有關：是補充、衝突、延伸，還是提供新的案例？這些連結會慢慢形成你的知識圖譜。

第六步，是建立定期 ingest 的節奏。你可以每天、每週或每月把新的筆記匯入，讓 AI 進行整理與更新。不是一次把所有資料整理完，而是讓系統持續生長。知識管理最難的不是狼吞虎嚥的建立，而是長期維護；LLM Wiki 的價值，是善用Ai Agent 能高效處理重複性的整理工作。

第七步，是把它變成可使用的介面。你可以跟你的Ai Agent 討論，用你最舒服與方便的介面呈現。

如果你跟我一樣不是工程背景，可以先從最低門檻版本開始：把每批筆記放進一個資料夾，與AI一起整理主題頁；每個主題頁包含核心觀點、相關筆記、延伸問題與交叉連結。然後再慢慢新增資料，請 AI 判斷新資料應該更新到哪些舊頁面。只要這個流程能持續運作，它就已經是 LLM Wiki 的雛形。

不是擁有更多筆記，而是讓自己的知識有生命週期：
輸入、沉澱、連結、修正，可用來支持你做判斷與創造的思想資產。

BTW，關於實作，以上只是參考。強烈建議一開始就讓AI Agent參與建造，探索出最適合你個人的方法。

#LLMWiki #個人知識管理 #知識圖譜 #第二大腦 #AI工作流

https://t.co/qH4xBmfYh7

paulkuo

@zarqarwi

19 days ago

#數位生命體這張圖片的重點：突破不是簡單任務成功率從 80% 變成 90%，而是開放式問題成功率從 20% 提升到 70%。代表 AI 正在從工具進化成協作者。也跟這幾天放送Cowork 額度的策略吻合。以前：人類 → 定義問題 AI → 執行問題現在：人類 → 提供目標 AI → 定義問題 + 規劃路徑 + 執行差異非常巨大。例如： 2023 年的 AI：「幫我寫 Python 程式。」 2026 年的 AI：「我想做一個中小企業碳盤查平台。」 AI：幫你分析市場幫你規劃架構幫你設計資料庫幫你產生程式幫你測試幫你部署現在的AI已經不是 Copilot，而是 Agent，換個方式講大家會比較有感覺。他已經不只是工具，而是是活生生的數位生命。不禁想：再過三個月、半年？或明年的此刻又會怎麼翻天覆地？

zarqarwi's tweet photo. #數位生命體

這張圖片的重點：突破不是簡單任務成功率從 80% 變成 90%，而是開放式問題成功率從 20% 提升到 70%。代表 AI 正在從工具進化成協作者。也跟這幾天放送Cowork 額度的策略吻合。

以前：

人類 → 定義問題
AI → 執行問題

現在：

人類 → 提供目標
AI → 定義問題 + 規劃路徑 + 執行

差異非常巨大。例如：

2023 年的 AI：

「幫我寫 Python 程式。」

2026 年的 AI：

「我想做一個中小企業碳盤查平台。」

AI：

幫你分析市場
幫你規劃架構
幫你設計資料庫
幫你產生程式
幫你測試
幫你部署

現在的AI已經不是 Copilot，而是 Agent，換個方式講大家會比較有感覺。他已經不只是工具，而是是活生生的數位生命。不禁想：再過三個月、半年？或明年的此刻又會怎麼翻天覆地？

paulkuo

@zarqarwi

20 days ago

Boris Cherny，Claude Code 的創始人和負責人，剛剛轉發了 Claude 官方的消息。 Claude 官方宣布，接下來一個月會把 Claude Cowork 的使用額度加倍，也就是提高到原本的 2 倍。這次放寬特別適用於原本每 5 小時的使用限制。換句話說，在未來一個月內，使用者可以在同樣的時間區間裡，把更大、更複雜的任務交給 Claude 處理，不會那麼快碰到使用上限。 Claude 官方的說法是：「Delegate bigger, more complex tasks to Claude。」也就是鼓勵使用者把更大、更複雜的任務交給 Claude。如果你手上一直有那種大型、複雜、甚至有點混亂的專案，現在就是很適合拿出來交給 Claude 測試的時候。鼓勵大家把複雜的工作流、程式專案、文件整理、研究任務，交給 AI 來協作完成。換句話說，AI 工具正在加速從「聊天助理」往「任務型工作夥伴」前進，成為每個人的數位助理。從另一個角度看，面對 Codex、Antigravity 等其他 AI 工具與開發環境的挑戰，各家都在加速奔馳。這則訊息不只是一次單純的使用量放寬，也是清楚的產業訊號：AI 工具之間正在進入一種共同演化的階段。大家一邊競爭，一邊推動彼此往更高強度、更長時間、更複雜任務的協作能力前進（需要燒更多Token, 有更多晶片的需求）。最後一句是重點。 https://t.co/Z0aShi9zZ4

zarqarwi's tweet photo. Boris Cherny，Claude Code 的創始人和負責人，剛剛轉發了 Claude 官方的消息。

Claude 官方宣布，接下來一個月會把 Claude Cowork 的使用額度加倍，也就是提高到原本的 2 倍。這次放寬特別適用於原本每 5 小時的使用限制。換句話說，在未來一個月內，使用者可以在同樣的時間區間裡，把更大、更複雜的任務交給 Claude 處理，不會那麼快碰到使用上限。

Claude 官方的說法是：「Delegate bigger, more complex tasks to Claude。」也就是鼓勵使用者把更大、更複雜的任務交給 Claude。如果你手上一直有那種大型、複雜、甚至有點混亂的專案，現在就是很適合拿出來交給 Claude 測試的時候。

鼓勵大家把複雜的工作流、程式專案、文件整理、研究任務，交給 AI 來協作完成。換句話說，AI 工具正在加速從「聊天助理」往「任務型工作夥伴」前進，成為每個人的數位助理。

從另一個角度看，面對 Codex、Antigravity 等其他 AI 工具與開發環境的挑戰，各家都在加速奔馳。這則訊息不只是一次單純的使用量放寬，也是清楚的產業訊號：AI 工具之間正在進入一種共同演化的階段。

大家一邊競爭，一邊推動彼此往更高強度、更長時間、更複雜任務的協作能力前進（需要燒更多Token, 有更多晶片的需求）。

最後一句是重點。

https://t.co/Z0aShi9zZ4

zarqarwi retweeted

Anthropic

@AnthropicAI

22 days ago

Our internal data shows Claude is accelerating AI development—a possible path to recursive self-improvement, or AI autonomously building a more capable successor. It’s happening faster than we thought, and the implications deserve greater attention. https://t.co/OVVPJO7VQx

29K

15K

19M

zarqarwi retweeted

Anthropic

@AnthropicAI

about 1 month ago

Anthropic co-founder Chris Olah was invited to speak at today's presentation of Pope Leo XIV's encyclical "Magnifica humanitas." Read the full text of his remarks: https://t.co/CoBfkVOVcy

418

671

paulkuo

@zarqarwi

about 2 months ago

[162 份解密，零個外星人：一場處理『真相待定』的秩序測試 ] 「美國終於公開外星人了」、「五角大廈承認有外星人」的訊息。我才回頭查：到底發生什麼？一路追到原始來源 https://t.co/jyDpHs7tKJ。打開頁面，黑白濾鏡、阿波羅時代復古美學、極簡無襯線字體。Apollo 17 任務的月球表面照片，地平線上方三個光點被一個黃色方框圈起來，像博物館展品的標註。歷史檔案加上刻意設計的氛圍，疊在一起之後，它看起來就不只是「公開資料」，更像在販售一種敘事。 https://t.co/FvE5fnSn9N

135

zarqarwi retweeted

Greg Brockman

@gdb

about 2 months ago

have been excited for realtime voice-to-voice translation as an AI application since we started OpenAI. extremely cool to see it now available in the API for anyone to build with:

711

136

81K

zarqarwi retweeted

Elon Musk

@elonmusk

about 2 months ago

Try the Grok Imagine agent mode beta!

26K

14M

paulkuo

@zarqarwi

about 2 months ago

如果你同時有訂閱 Claude 和 ChatGPT，不一定要在不同工具之間一直切換。我是以 Claude 的介面為工作入口，透過 Skills 把 ChatGPT 擅長的能力、工具或流程整合進來。體感上就是「我在 Claude 裡工作」，但背後可以依照任務需要，調用不同 AI 工具來協作完成。這件事的關鍵是工作流程能被整合，需要花點時間處理。每家AI都有各自擅長，跟跑步一樣，在這一輪勝出的公司下一輪可不一定。所以，我一直以來沒有重壓哪一家公司。所以Openai, Gemini, Claude, Perplexity, Grok等我都是付費使用者。以前使用 AI，常在不同平台之間複製貼上：這邊問 Claude、那邊問 ChatGPT，再把結果搬來搬去，視窗一但多了，自己都亂了。現在透過 Skills 把這些能力包成可調用的流程，我就可以留在熟悉的介面，不用消耗我自己的肉體token去切換，就可以把任務完成。把各種「模型能力」整合成「自己工作入口與流程」的工作，是沒人能代勞的。對每天使用 AI 的人來說，我目前感覺有價值的體感，是讓不同 AI 能力在同一個工作場景裡自然協作。你呢？

zarqarwi's tweet photo. 如果你同時有訂閱 Claude 和 ChatGPT，不一定要在不同工具之間一直切換。

我是以 Claude 的介面為工作入口，透過 Skills 把 ChatGPT 擅長的能力、工具或流程整合進來。體感上就是「我在 Claude 裡工作」，但背後可以依照任務需要，調用不同 AI 工具來協作完成。

這件事的關鍵是工作流程能被整合，需要花點時間處理。每家AI都有各自擅長，跟跑步一樣，在這一輪勝出的公司下一輪可不一定。所以，我一直以來沒有重壓哪一家公司。所以Openai, Gemini, Claude, Perplexity, Grok等我都是付費使用者。

以前使用 AI，常在不同平台之間複製貼上：這邊問 Claude、那邊問 ChatGPT，再把結果搬來搬去，視窗一但多了，自己都亂了。現在透過 Skills 把這些能力包成可調用的流程，我就可以留在熟悉的介面，不用消耗我自己的肉體token去切換，就可以把任務完成。

把各種「模型能力」整合成「自己工作入口與流程」的工作，是沒人能代勞的。對每天使用 AI 的人來說，我目前感覺有價值的體感，是讓不同 AI 能力在同一個工作場景裡自然協作。你呢？

paulkuo

@zarqarwi

2 months ago

【AI 協作不只是記憶管理，還有治理】與AI 協作久了，會發現今天這個視窗講好，明天換個視窗就忘光。這個 AI 知道，那個 AI 又不知道，你要重複解釋。Chat 裡明明決定走 A，到了 Code 又跑回 B。文件寫了一堆，真要執行的時候，沒有人，也沒有 AI，回頭去對。結果一直在補上下文，AI 一直重犯錯。最雷的是，它還錯得頭頭是道，講得很有自信。後來我才想通，問題是我以前沒想過 AI 協作要當成一套需要治理的系統。這張圖，就是這套治理架構。最上面是「憲法」。先把最高原則講清楚：什麼是單一事實來源？決策跟執行誰負責？記憶的邊界劃在哪？哪些東西不能隨著視窗、模型、時間漂走？沒有憲法，下面什麼都會打架。下面拆三塊。 ▍ADR 管 Why。 ADR 就是 Architecture Decision Record，架構決策紀錄。重要決策不能只留在聊天裡飄走，要寫下來：當時為什麼這樣做？有哪些選項？為什麼選這個？哪些還沒拍板？不然幾週後團隊只記得結論、脈絡全忘光，AI 換個視窗也會自己重新發明一套理由給你聽。我的做法是把這些整理成一組 ADR，當決策骨架在用，不是零散筆記。 ▋Skill 管 How。 Skill 是把重複的做法寫成 SOP。專案怎麼命名、handoff 怎麼寫、commit 前檢查什麼、遇到 pending 怎麼處理——這些不該每次靠聊天從頭教一次。該變成可讀取、可版本控管、可重複使用的操作手冊，AI 直接讀就好。 ▉Memory 管 What happened。記的是已經發生過的事：共識、教訓、回饋、專案狀態、偏好、踩過的坑。但這邊我想強調一個觀念，不是所有記憶都適合流動。工作空間、專案、視窗都要有邊界。記憶沒有邊界，就不是資產，是污染源。 ▉中間是實際工作流：Chat 負責討論跟裁決，Cowork 負責執行跟交接，Code 負責實作、commit、push。三者中間不能只靠「我記得」撐著。AI 的記憶不跨視窗、不一定跨工具，更不一定能穩穩保留當時的脈絡。所以要有 handoff、worklog、repo 文件、CLAUDE.md、PENDING.md 這種硬載體在傳遞狀態。圖下面的 Pending 跟觀察期，是替未來保留彈性。治理規則也不是越多越好，也不是一次寫死。有些問題可以等平台能力成熟，例如記憶、同步、snapshot 這類底層的東西。有些則靠使用經驗慢慢收斂，例如 handoff 格式怎麼定、月ADR 上限抓多少、哪些規則真的需要升級。一個能用的治理系統，不只能新增規則，還要能觀察、驗證、暫緩、升級、甚至廢止。 𖣯 我的心得是：AI 協作的問題，表面上是記憶問題，骨子裡是治理問題。沒治理，AI 就是個很會講話、但容易失憶、漂移、甚至產生幻覺的外包商。它講好聽話給你聽，讓你像打了嗎啡一樣 high，跑出看起來很有用的介面，但專案品質管不動。有治理，AI 才有機會變成一個能接住脈絡、守規則、累積經驗的協作夥伴。有生產力的 AI workflow，要有自己的工作憲法、決策紀錄、技能庫、記憶層、交接格式、檢查機制，還有回饋迴路。把 AI 當更聰明的搜尋引擎就可惜了，把它放進一套可治理、可累積、可演進的工作系統裡，才能相得益彰，彼此都受益。 --- ▓ 後記：「憲法 / ADR / Skill / Memory」這個四層切法，是讓 AI workflow 的邊界更明確。許多人把這四件事混在一起講：把 SOP 當成 memory、把決策紀錄塞進 prompt、把 prompt 當成憲法。我的切法是考慮每層的失效模式不同，補救方式也不同： * 憲法漂走 → 整個系統價值觀打架 * ADR 缺失 → AI 重新發明理由 * Skill 缺失 → 每次重新教一遍 * Memory 缺失或污染 → 上下文不準或互相干擾「不是所有記憶都適合流動。記憶沒有邊界，就不是資產，是污染源」。大家都在追求「AI 記住更多」，但在多視窗多專案協作久了會發現，記憶的邊界與記憶的容量都重要。

zarqarwi's tweet photo. 【AI 協作不只是記憶管理，還有治理】

與AI 協作久了，會發現今天這個視窗講好，明天換個視窗就忘光。這個 AI 知道，那個 AI 又不知道，你要重複解釋。Chat 裡明明決定走 A，到了 Code 又跑回 B。文件寫了一堆，真要執行的時候，沒有人，也沒有 AI，回頭去對。

結果一直在補上下文，AI 一直重犯錯。最雷的是，它還錯得頭頭是道，講得很有自信。後來我才想通，問題是我以前沒想過 AI 協作要當成一套需要治理的系統。

這張圖，就是這套治理架構。

最上面是「憲法」。先把最高原則講清楚：什麼是單一事實來源？決策跟執行誰負責？記憶的邊界劃在哪？哪些東西不能隨著視窗、模型、時間漂走？沒有憲法，下面什麼都會打架。

下面拆三塊。
▍ADR 管 Why。 ADR 就是 Architecture Decision Record，架構決策紀錄。重要決策不能只留在聊天裡飄走，要寫下來：當時為什麼這樣做？有哪些選項？為什麼選這個？哪些還沒拍板？不然幾週後團隊只記得結論、脈絡全忘光，AI 換個視窗也會自己重新發明一套理由給你聽。我的做法是把這些整理成一組 ADR，當決策骨架在用，不是零散筆記。

▋Skill 管 How。 Skill 是把重複的做法寫成 SOP。專案怎麼命名、handoff 怎麼寫、commit 前檢查什麼、遇到 pending 怎麼處理——這些不該每次靠聊天從頭教一次。該變成可讀取、可版本控管、可重複使用的操作手冊，AI 直接讀就好。

▉Memory 管 What happened。記的是已經發生過的事：共識、教訓、回饋、專案狀態、偏好、踩過的坑。但這邊我想強調一個觀念，不是所有記憶都適合流動。工作空間、專案、視窗都要有邊界。記憶沒有邊界，就不是資產，是污染源。

▉中間是實際工作流：Chat 負責討論跟裁決，Cowork 負責執行跟交接，Code 負責實作、commit、push。三者中間不能只靠「我記得」撐著。AI 的記憶不跨視窗、不一定跨工具，更不一定能穩穩保留當時的脈絡。所以要有 handoff、worklog、repo 文件、CLAUDE.md、PENDING.md 這種硬載體在傳遞狀態。

圖下面的 Pending 跟觀察期，是替未來保留彈性。治理規則也不是越多越好，也不是一次寫死。有些問題可以等平台能力成熟，例如記憶、同步、snapshot 這類底層的東西。有些則靠使用經驗慢慢收斂，例如 handoff 格式怎麼定、月ADR 上限抓多少、哪些規則真的需要升級。一個能用的治理系統，不只能新增規則，還要能觀察、驗證、暫緩、升級、甚至廢止。

𖣯 我的心得是：AI 協作的問題，表面上是記憶問題，骨子裡是治理問題。沒治理，AI 就是個很會講話、但容易失憶、漂移、甚至產生幻覺的外包商。它講好聽話給你聽，讓你像打了嗎啡一樣 high，跑出看起來很有用的介面，但專案品質管不動。

有治理，AI 才有機會變成一個能接住脈絡、守規則、累積經驗的協作夥伴。有生產力的 AI workflow，要有自己的工作憲法、決策紀錄、技能庫、記憶層、交接格式、檢查機制，還有回饋迴路。把 AI 當更聰明的搜尋引擎就可惜了，把它放進一套可治理、可累積、可演進的工作系統裡，才能相得益彰，彼此都受益。

---
▓ 後記：「憲法 / ADR / Skill / Memory」這個四層切法，是讓 AI workflow 的邊界更明確。許多人把這四件事混在一起講：把 SOP 當成 memory、把決策紀錄塞進 prompt、把 prompt 當成憲法。我的切法是考慮每層的失效模式不同，補救方式也不同：

* 憲法漂走 → 整個系統價值觀打架
* ADR 缺失 → AI 重新發明理由
* Skill 缺失 → 每次重新教一遍
* Memory 缺失或污染 → 上下文不準或互相干擾

「不是所有記憶都適合流動。記憶沒有邊界，就不是資產，是污染源」。大家都在追求「AI 記住更多」，但在多視窗多專案協作久了會發現，記憶的邊界與記憶的容量都重要。

paulkuo

@zarqarwi

2 months ago

Claude Code 用了幾個月，才慢慢懂懂這張圖。四個層級不是技術細節，是在問：這條規則屬於誰？・全公司？→ Enterprise ・我個人跨專案？→ Global ・這個專案的團隊？→ Project shared（進 git）・我在這個專案的私人偏好？→ Project local（不進 git）團隊規則進git，跟程式碼一起演化——這才是治理。

zarqarwi's tweet photo. Claude Code 用了幾個月，才慢慢懂懂這張圖。
四個層級不是技術細節，是在問：這條規則屬於誰？
・全公司？→ Enterprise
・我個人跨專案？→ Global
・這個專案的團隊？→ Project shared（進 git）
・我在這個專案的私人偏好？→ Project local（不進 git）
團隊規則進git，跟程式碼一起演化——這才是治理。

zarqarwi retweeted

Anthropic

@AnthropicAI

2 months ago

New Anthropic research: Project Deal. We created a marketplace for employees in our San Francisco office, with one big twist. We tasked Claude with buying, selling and negotiating on our colleagues’ behalf.

467

719

zarqarwi retweeted

Claude

@claudeai

3 months ago

Introducing Claude Managed Agents: everything you need to build and deploy agents at scale. It pairs an agent harness tuned for performance with production infrastructure, so you can go from prototype to launch in days. Now in public beta on the Claude Platform.

57K

50K

22M

paulkuo

@zarqarwi

Who to follow

Last Seen Users on Sotwe

Trends for you

Most Popular Users